文章概要:
1. Hugging Face推出了名为“训练集群即服务”的新AI服务,允许公司进行AI模型训练,无需拥有大量计算资源。
2. 用户可以使用价格计算器根据参数、功能、训练数据量和速度配置所需的模型,价格范围广泛。
3. 尽管提供了这项服务,顶级AI模型如GPT-4或Google的Gemini仍然显著昂贵且强大。未来,处理器进步、更高效的架构和高质量训练数据可能会降低培训成本。
Hugging Face最近推出了一项新的人工智能服务,名为“training cluster”,旨在帮助公司进行AI模型的培训,而无需拥有庞大的计算资源。这一新服务允许用户利用高性能GPU集群,并通过价格计算器根据参数、功能、训练数据量和所需的速度来配置他们所需的模型。
根据价格计算器,最便宜的可配置文本模型拥有70亿个参数,估计成本为43,069美元,需要大约四天的培训时间。
而最昂贵的多模态模型(包括文本和图像)将花费高达18,461,354美元,拥有700亿个参数、7万亿个训练数据标记,以及在1000个Nvidia H100GPU上进行了长达184天的培训。这突显了不同模型之间的价格差距。
然而,即使使用Hugging Face的服务培训出拥有70亿参数的最强多模态模型,也很可能在性能上无法与GPT-4或Google的Gemini竞争,这两者拥有约1.8万亿参数,是后者的25倍之多。估计其培训成本在6,800万美元到1亿美元以上。
这表明,尽管提供了新的AI培训服务,但尖端AI模型在财务角度上仍具有强大的竞争力。
尽管存在高昂成本,但未来随着处理器技术的进步、更高效的架构以及高质量训练数据的需求降低,培训价格可能会有所下降。