李飞飞团队 S1 技术思路:低成本实现高效推理模型

news/2025/2/10 14:43:58/

李飞飞团队 S1 技术思路:低成本实现高效推理模型

人工智能领域,模型训练成本一直是制约技术普及和创新的重要因素。然而,李飞飞团队近日以不到 50 美元的云计算费用成功训练出了名为 S1 的 AI 推理模型,其在数学和编码能力测试中的表现与 OpenAI 的 o1 以及 DeepSeek 的 R1 等尖端推理模型相当,这一成果引发了行业的广泛关注。

基于开源模型的监督微调

S1 模型并非从零开始训练,而是基于阿里云的通义千问(Qwen)模型进行监督微调得到的。阿里云方面确认,S1 模型是以阿里通义千问 Qwen2.5-32B-Instruct 开源模型为底座,在 16 块 H100 GPU 上监督微调 26 分钟,就训练出了新模型 s1-32B。这种基于强大开源模型的微调方式,为 S1 模型提供了坚实的基础,使其能够在较短的时间和较低的成本内实现性能的提升。

精心筛选的小数据集

李飞飞团队构建了一个名为 s1K 的小型数据集,该数据集包含 1000 个经过精心筛选的问题,这些问题覆盖了数学、科学等多个领域,并配备了从谷歌推演出的推理过程和答案。通过在这个小型但高质量的数据集上进行微调,S1 模型能够学习到更精准的推理能力和答案生成方式,从而在测试中表现出色。

创新的 “预算强制” 方法

在训练过程中,团队采用了针对模型思考时间的 “预算强制” 方法,以此控制计算量。具体来说,模型每次只能在限定的思考时间内给出结果,这一策略不仅在确保了效率的同时,极大地提升了答案的准确性。通过这种方式,模型能够对答案进行更深度的理解和多次检查,从而纠正潜在的错误。

知识蒸馏技术的应用

S1 模型还巧妙融合了知识蒸馏技术。知识蒸馏是一种模型压缩手段,从庞大复杂的 “教师模型” 中提取出知识的精华,再悉心传授给小巧灵活的 “学生模型”。在 S1 的开发中,研究人员选择了谷歌的 Gemini 2.0 Flash Thinking Experimental 模型作为教师模型,通过蒸馏技术,S1 能够从教师模型中提取关键的推理能力,从而在保持高性能的同时显著降低训练成本。

性能表现与意义

通过上述技术手段,S1-32B 模型在竞赛数学问题(MATH 和 AIME24)上的表现比 o1-preview 高出 27%。这一成果不仅展示了在低成本下训练高性能 AI 模型的可能性,也推动了 AI 技术的普惠化。S1 模型的出现挑战了传统的 AI 研发模式,表明高昂的算力投入并非高性能 AI 的必要条件,算法创新正在打破资源垄断。

 


http://www.ppmy.cn/news/1570881.html

相关文章

AF3 distogram_loss函数解读

AlphaFold3 的distogram loss函数用于训练中比较预测的距离分布(由 logits 表示)与真实距离分布之间的差异。在蛋白质结构预测中,distogram 表示每对残基之间距离落在各个区间(bin)的概率分布,损失函数使用交叉熵来衡量预测分布与真实分布(通过计算残基之间的欧氏距离确…

win32汇编环境,结构体的使用示例二

;运行效果 ;win32汇编环境,结构体的使用示例二 ;举例说明结构体的定义,如何访问其中的成员,使用assume指令指向某个结构体,计算结构数组所需的偏移量得到某个成员值等 ;直接抄进RadAsm可编译运行。重要部分加备注。 ;下面为asm文件 ;>>…

2025_2_9 C语言中队列

1.队列(先进先出) 队列也是一种受限制的线性结构 它只能在一端添加元素,在另一端访问,删除元素 (队首插入,队尾删除) 因为链表实现没有数组实现快,所以队列大多数是用数组实现的 q…

火语言RPA--XML提取

🚩【组件功能】:在XML文本中提取通过XML选择器提取指定节点内容 配置预览 配置说明 源XML文本 支持T或# 默认FLOW输入项 提取处理的对象,若为空,以上一个组件的输出做为源XML文本,支持文本或表达式输入。 XmlPath选…

wxWidgets生成HTML文件,带图片转base64数据

编译环境大家可以看我之前的文章,CodeBlocks + msys2 + wx3.2,win10 这里功能就是生成HTML文件,没用HTML库,因为是自己固定的格式,图片是一个vector,可以动态改变数量的。 效果如下: #include <wx/string.h> #include <wx/file.h> #include <wx/ima…

MyBatis-Plus与PageHelper的jsqlparser库冲突问题

背景介绍 在最近的一个项目中&#xff0c;我们决定将Spring Boot升级至3.x版本&#xff0c;并同时升级了MyBatis-Plus到最新版本&#xff08;3.5.7&#xff09;。然而&#xff0c;在完成这些升级之后&#xff0c;我们遇到了一个问题&#xff1a;分页插件PageHelper无法正常工作…

【声音转文字CapsWriter】声音随时转化为文字,CapsWriter提高工作效率

文章目录 前言1. 软件与模型下载2. 本地使用测试3. 异地远程使用3.1 内网穿透工具下载安装3.2 配置公网地址3.3 修改config文件3.4 异地远程访问服务端 4. 配置固定公网地址4.1 修改config文件 5. 固定tcp公网地址远程访问服务端 前言 今天我要给大家安利一个神器——CapsWrit…

Linux下安装SVN服务端小白教程

安装 使用yum安装非常简单&#xff1a; yum install subversion 配置 2.1. 创建仓库 我们这里在/home下建立一个名为svn的仓库&#xff08;repository&#xff09;&#xff0c;以后所有代码都放在这个下面&#xff0c;创建成功后在svn下面多了几个文件夹。 [rootlocalhos…