研究人员用不到50美元成功训练出具备推理能力的人工智能模型_科技魔方-中文AI大模型门户网站

首页 更多动态 正文: 研究人员用不到50美元成功训练出具备推理能力的人工智能模型; 更多动态

2025年02月06日

点赞; 　　上周五发布的一份研究报告显示，斯坦福大学和华盛顿大学的研究人员仅花费不到50美元的云计算费用，便成功训练出一个名为s1的人工智能模型。该模型在数学和编程能力测试中表现出与OpenAI的o1和DeepSeek的r1等顶尖推理模型相似的水平。

　　s1团队通过“蒸馏”技术创建了这一模型，即通过训练模型来学习其他人工智能模型的答案，从而提取其推理能力。研究人员透露，s1是从谷歌的Gemini 2.0 Flash Thinking Experimental模型中蒸馏出来的。加州大学伯克利分校的研究人员也使用了相同的蒸馏方法，以约450美元的成本创建了一个类似的推理模型。

　　s1模型及其训练数据和代码已在GitHub上开源。研究人员表示，他们希望找到实现强大推理性能和“测试时扩展”的最简单方法，这些是OpenAI的o1中的一些突破。通过监督微调(SFT)方法，可以使用相对较小的数据集来蒸馏推理模型，比大规模强化学习更具成本效益。

　　值得注意的是，s1的训练仅用了16个Nvidia *** GPU，耗时不到30分钟，租用计算资源的成本约为20美元。研究人员还发现，在推理过程中添加“等待”一词，有助于模型获得更准确的答案。

+1; 来源：DoNews

延展资讯

: 美图奇想大模型登顶视频生成权威榜单VBench榜首

: 商汤日日新融合大模型交互版开放商用实时音视频对话限时免费

: 科大讯飞发布深度推理模型“讯飞星火X1”

: 周鸿祎参与的首部“AI短剧”预计在春节上线

: 小米澎湃 HyperOS「AI 写真」功能 1 月中旬逐步下线，已消费米币将自动返还

: AI圈开年首炸：139位中国清北名校天才创立一家震撼硅谷的企业

最热新闻最新新闻 更多>

用户推荐最热产品 更多>

倾城

小新

叶紫

创维电视（SKYWORTH）55V40

创维电视（SKYWORTH）55V40

小米全面屏电视E43K

小米全面屏电视E43K

康佳（KONKA）55D6S

康佳（KONKA）55D6S

荣泰S60按摩椅

荣泰S60按摩椅

自媒体头条更多>: 极致听感智能降噪三星Galaxy Buds Pro诠释非同凡“响”

未来科技范试驾摩灵MOi｜视频

品牌专区更多>

产品与服务

联系站长

反馈邮箱

news#keji100.net（发邮件时把#换成@）

关于我们