李飞飞团队用不到50美元训练出媲美DeepSeek R1的AI推理模型

李飞飞团队用不到50美元训练出媲美DeepSeek R1的AI推理模型

2025.02.06 16:13

钛媒体App 2月6日消息，据报道，李飞飞等斯坦福大学和华盛顿大学研究人员近日以不到50美元的云计算费用训练了一个名叫s1的人工智能推理模型。该模型在数学和编码能力测试中的表现与OpenAI的o1和DeepSeek的R1等尖端推理模型类似。研究人员透露，s1是从谷歌的Gemini 2.0 Flash Thinking Experimental模型中蒸馏出来的。“蒸馏”技术，即通过训练模型来学习其他人工智能模型的答案，从而提取其推理能力。此外，研究人员表示，s1模型也用到了阿里巴巴旗下中国人工智能实验室Qwen开发的可免费下载的小型现成人工智能模型。值得注意的是，s1的训练仅用了16个Nvidia H100 GPU，耗时不到30分钟，租用计算资源的成本约为20美元。研究人员还发现，在推理过程中添加“等待”一词，有助于模型获得更准确的答案。目前，s1模型及其训练数据和代码已在GitHub上开源。

AGI

本文内容仅供参考，不构成投资建议，请谨慎对待。

0 / 300

根据《网络安全法》实名制要求，请绑定手机号后发表评论

请登录后输入评论内容

投资日历