第四范式涂威威:企业专属大模型技术需闭环数据、思维链学习、高落地效率...

news/2025/2/12 0:33:56/

近日,以“智行天下 能动未来”为主题的第七届世界智能大会隆重举办,第四范式副总裁、主任科学家涂威威出席高峰会,与中国工程院院士邬江兴、德国弗劳恩霍夫电子纳米系统研究所所长Harald Kuhn、高通公司中国区董事长孟樸等院士及企业代表,同台共话大模型等智能科技在产业中的创新应用。

b612b53296f427a7cabc7662e80daadf.jpeg

涂威威表示,生成式AI让企业软件的人机交互和应用价值内核价值都有了质的提升,打造数据闭环是企业落地成功的关键,结合环境学习让机器从真实决策环境中学习更高层级的目标是打造更强智能助手的重要手段。

企业软件使用遵循“二八法则”,即用户普遍只能使用其中20%的功能,软件的价值难以充分发挥,此外,功能的开发和迭代效率低下。生成式AI的出现让企业软件以「对话框式」实现功能的调用,不再需要找到某个位于十几级菜单目录下的功能,或者耗费过多精力在软件界面的开发环节。

这样一个智能助理甚至可以通过思维链的方式调用多种功能,帮助企业用户完成多步骤复杂的任务,也可以利用AI对软件的核心功能进行智能化改造,让传统软件内核从增删改查等基础工具,变革为能够解决感知、预测、决策、执行等问题的生产力工具。

实现这个更强大的智能助理的核心就是大模型。涂威威同时指出,企业想要落地专属大模型应用,需要满足以下3大条件:形成高质量的闭环数据、具备多步推理思维链(Chain of thoughts)的学习能力、解决大模型落地效率问题。

在闭环数据方面,大模型的背后还是机器学习,即利用数据训练模型。数据的质量决定了模型的最终效果,所以优质的训练数据是大模型落地应用的重中之重。基于此,需要用户的反馈形成高质量的闭环数据,进一步优化迭代大模型。其中,面对大模型中“知识”过时等问题时,大模型可以借用Memory机制,在外部有策略地获得对大模型有帮助且更加实时、可信的数据,从而可靠地解决用户实际的问题。大模型在垂直场景落地时,实际效果往往取决于业务定义的优劣,而不只是语义上的相关与否,因此大模型需要从用户的反馈中学习,来帮助用户越用越好。

ff93bac992d1b27a0dd6233663874fb0.png

在思维链学习方面,为了让生成式AI这样的智能助手能够像人一样,处理更多复杂的问题,除了通过类似ChatGPT的Plugin模式以外,大模型还需要能够根据业务学习具备多步推理能力来形成长程序列决策的能力,即思维链学习的能力。现有的RLHF方法由于只是单步,所以本质上只是考虑当前回答是否满足用户定义的Reward Model。

解决更加复杂的多步序列决策任务,较为简单的方式是利用如模仿学习等方式让机器模仿专家解决复杂问题的过程,理想情况下可以逼近专家的水平,这样的方式的上限受限于人类专家的水平,就像AlphaGo单靠学习人类棋谱可以击败实力相对较弱的人类选手,但很难超越顶尖选手一样。为了能进一步提升,突破人类专家的能力上限,可以用大模型提供的基础世界常识模型,结合环境学习,让机器从真实的决策环境中学习更高层级的目,通过离线训练与在线微调结合的方式,在获得高阶推理能力的同时,大幅降低试错成本。这也是未来打造更强企业智能助手的核心手段。

在大模型落地效率方面,No Free Lunch定理告诉我们,没有哪一个模型能以最优的方式解决所有的问题,企业预算始终是有限的,企业落地大模型更合理的做法不是把所有的预算都投入到一个超级大模型中,而是可以通过组合多个专业模型各司其职来解决。这就如同人类大脑有不同的分区,不同分区负责不同职责一样。这种方式更利于模型迭代、维护,同时更利于控制成本。第四范式也正在基于南京大学LAMDA实验室提出的“学件”思想构建可重用、可演进和可了解的企业级大模型学件群组。

d80b0704f91f93dd155b235b59c19e31.png

今年2月,第四范式正式发布了「式说」大模型,后提出“以生成式AI重构企业软件(AIGS)”的技术战略,提升企业级软件的体验及开发效率。目前已与金融、零售、制造、医疗、房产、运营商等近百家合作伙伴及企业探索大模型的落地合作。


http://www.ppmy.cn/news/74811.html

相关文章

hadoop介绍以及未来发展

大数据作为当今世界的重要商业行为,给无数商家和企业带来了无数的发展机遇和机会,这里介绍一下,因为sap也是需要进入大数据时代的,毕竟跟这互联网,sap有发展,如果单纯就是应用在企业中,会错失很…

「车型分析」控制系统典型应用车型 —— 辊筒AGV

辊筒AGV (Roller conveyor ) 是一种常见的AGV机器人类型,它利用辊筒和轮子在巷道中实现货物的搬运和运输,可实现托盘物品的卸载和运输等功能, 具有更高的灵活性、适应性和效率。本文将基于这款市场上常见的AGV进行一次简单的介绍。 1 车型介绍: 辊筒AGV…

架构设计的一些建议——陈皓

序言 本周5月15日,MegaEase创始人兼CEO、知名架构师、CSDN 资深博主陈皓(网名:左耳朵耗子)于13日去世,享年47岁。之前听过他的极客时间《左耳听风》,个人觉得还是有点收获的。 CoolShell——陈皓 写这篇…

qt之元对象系统

组成 QObject类:是所有使用元对象系统的类的基类Q_OBJECT宏:使得类可以使用元对象的特性,如动态属性,信号与槽MOC:元对象编译器,为每个QObject的子类提供必要的代码来实现元对象系统的属性 QMetaObject定…

直播预告 | 医疗人工智能入行经验分享

(本文阅读时间:2 分钟) 或许大家从不同程度上听说或使用过智能导诊机器人、语音电子病历或是智能问诊?这些高端大气又便利的产物都是人工智能在医疗健康领域的重要应用场景产品及服务。 “AI医疗”是人工智能技术赋能医疗健康产业…

VS Code 大量 Java 新功能来袭!

大家好,欢迎来到 Visual Studio Code Java 的 4 月更新!在此博客中,我们将带来大量基础用户体验更新,其中包括调试功能改进、Maven 插件中的配置文件支持、全新 Java Project Explorer 的用户界面和 Spring Boot 项目的可视化增强…

小航编程题库GoC南海区小学四年级模拟测试题(含题库教师账号)

需要在线模拟训练的题库账号请点击 小航助学编程在线模拟试卷系统(含题库答题软件账号)_程序猿下山的博客-CSDN博客 填空题8.0分 删除编辑 答案:100 第1题画一条高度为100,粗为5的竖线。 //程序名:直线 //作者: int main() { pen.size(5)…

sys用户下为其他用户的创建私有db link的案例

文章目录 1.查询job执行情况2.确认根因3.重建DB LINK3.1使用current_schema方式3.2使用procedure方式 4.重新编译失效的对象,并手动执行job 记录一下scheduler job执行失败,而不知到job拥有者密码的情况下,如何重建私有db link的案例 1.查询j…