讯飞星火与昇腾AI双向奔赴:本土化技术创新应对全球化挑战的一次成功验证

ops/2024/12/22 20:57:45/

文 | 智能相对论

作者 | 陈泊丞

2019年,彼时的AI赛道还不像今天这么热。

这一年,人工智能连续第三年出现在政府工作报告中,政策关键词从“加快”“加强”转变为“深化”,开始进入行业需求快速增长的应用探索期。而华为也在这个阶段完成了初步的战略布局和自主技术储备,向更深层次迈进。科大讯飞也前瞻性地联合多家国内厂商围绕根技术进行科研攻关,并希望通过一系列自主创新,提升AI领域的自主化水平,从而真正与国际科技巨头们能在同一起跑线上进行竞争。相似的经历、一致的目标,让科大讯飞和华为意识到对根技术的探索任重道远,并开始寻求深度的合作。

本土科技厂商的双向奔赴:“敢用-真用-会用-用好”步步深入

回顾讯飞星火大模型和华为昇腾的合作之路,科大讯飞副总裁、AI工程院院长潘青华梳理出了四个关键阶段,即“敢用-真用-会用-用好”,双方在每一个阶段都遇到了大量的问题、顾虑,最终携手克服困难,才把原生创新的路径走通。在与昇腾合作之前,科大讯飞就已经做了很多技术上的行动,比如自研深度学习并行训练框架和训推工具链,基于国内优秀软硬件基础设施打造稳定高效的大规模深度学习训练平台等等,但是在核心算力层面上始终没有很好的国产化解决方案,算力资源成了本土科技厂商发展AI大模型的一个关键限制。在这种情况下,科大讯飞走出了“敢用”的第一步。

随着对根技术需求的认识加深以及对昇腾AI平台性能的了解,科大讯飞开始尝试基于昇腾AI进行模型训练和推理工作。昇腾以其高度专业的服务态度和服务能力,全力支持讯飞AI训练移植优化,包含语音识别、语音理解、机器翻译等模型在昇腾算力资源上的移植适配。这让科大讯飞与昇腾AI的合作继续进入了“真用”阶段,开始寻求发展中解决大模型训练推理的核心难题。

以国内首个支持万亿参数大模型训练的智算集群“飞星一号”正式上线为标志性节点,科大讯飞不仅在业界首创基于RoCE的大规模无损组网,还与昇腾AI联合解决500余次软硬件问题,首次实现千亿参数大模型训练效率达到业界水平。在这个过程中,科大讯飞与昇腾AI共同攻坚克难,解决大规模集群训练中保存断点后性能“抖动”、性能“爬坡”等疑难杂症。有了这些成功的探索与验证,科大讯飞与昇腾AI的合作进入了以原生创新为主导的“会用”阶段,双方在根技术上的攻关取得显著回馈。

基于昇腾硬件亲和特性,科大讯飞对星火大模型的模型结构进行重新设计,不仅让星火大模型训练性能较之前提升10%,还创新实现了混合长序列并行算法,促使星火大模型在昇腾上的长序列性能提升了15%。今年6月,科大讯飞正式发布完全基于昇腾算力训练的星火大模型V4.0,其中星火V4.0在国内外中英文12项主流测试集的8项中,实现了对GPT-4Turbo的超越,成功晋升为业界领先的通用大模型底座。

未来,科大讯飞将继续思考如何进一步“用好”昇腾AI,面向更大规模集群和更大规模训练任务,共同探索如何持续挖潜集群性能、大模型推理性能如何进一步提升等等一系列问题。

一路走来,步步深入,科大讯飞与昇腾AI从最初的接触探索到后来的深入协同,再到原生创新的成功实践,双方以深度合作的姿态,在AI原生创新之路上越走越坚定。

本土化技术创新完成了一次很好的验证

本土化技术创新难在两大方面,一是技术难做,没有解题思路,二是项目难坚持,没有持续解决问题的理念,往往就会无疾而终。这是一段长期的探索历程,技术决定了起步,而理念决定了起步后的发展是否能长期。

一、技术与理念的双向奔赴。

科大讯飞与昇腾AI的这场合作之所以能成功,不仅是技术层面的深入协同,还有理念层面的双向奔赴。比如针对大规模集群训练两个月后“越训越慢”的问题,科大讯飞与昇腾AI通过集合通信-驱动-内核的层层分析,最终发现操作系统内核问题,导致算子下发时间变长、训练性能下降,才有了后续的解决方案。

二、互为反哺的价值共生。

此次合作中,业界看到的更多是科大讯飞基于昇腾AI完成了一系列成就,但与此同时,昇腾AI也在接受反哺。科大讯飞深入参与并助力昇腾持续完善面向大模型的软件生态,共同开发和优化了基础算子和通信算子共120多个,基于底层开放API接口也开发了自定义融合算子30多个。同时,双方共同组建的联合项目组还推动了昇腾工具50多项关键特性的开发,促使Mindstudio工具不断完善,也持续丰富了昇腾的大模型工具集。

好的合作关系一定是互相成就的,双方在本次合作中收获的巨大成果便是具象化呈现,若要实现本土化技术创新,就应该在互为反哺的价值共生关系中去寻求答案。

三、惠及产业发展的生态成果。

科大讯飞和昇腾AI的这场合作,在惠及企业自身的同时,也在推动着中国AI产业的跨越发展。比如,双方联合打造的国内首个支持万亿参数规模大模型训练的智算集群“飞星一号”,大幅提升我国在人工智能领域的行业竞争力。接下来双方将继续深入探索未来中国人工智能产业发展的关键问题,相信将有更多技术创新与生态成果,更广泛地惠及千行万业。

大模型原生创新时代开了个好头

科大讯飞和昇腾AI的双向奔赴为中国AI产业发展开了一个好头。正如潘青华院长在演讲中强调,“只有持续跑得快才能最终跑得赢。”中国AI产业发展需要持续跑得快。

现阶段,“原生创新”概念经常被行业所提及。但大部分的讨论只停留在了应用原生创新之上,认为只要把AI应用孵化在技术平台上,就是做到了原生创新,往往却忽视了根技术的原生创新。

如果孵化到国外的技术平台,做到了应用的原生创新,那确实是“跑得快”,但是能“持续”吗?其中客观存在的不稳定性和高风险,或许会在未来的某天突然“暴雷”,给企业经营和产业发展带来不可挽回的损失。

而只有基于根技术的自主创新,放在自家的技术平台上孵化、培育,那才有“持续跑得快、跑得稳”,最终“跑得赢”,跑向一个真正的大模型原生创新时代。科大讯飞和昇腾AI就一直在为这样的时代而努力。

基于讯飞星火医疗大模型平台和昇腾AI基础软硬件,科大讯飞与华为联合打造了一体化医疗健康私有化解决方案。同时,讯飞医疗还携手华为,与四川大学华西医院达成了三方战略合作伙伴关系,共同围绕创新医疗服务模式、改善就医体验、医疗大模型技术应用等重点领域展开深入合作。

这将是医疗大模型应用落地的一个里程碑,未来一个“AI为每个医生打造诊疗助理,为每个居民打造健康助手的世界”或许很快就会到来。那么,站在社会民生的角度来看,大模型原生创新时代的到来,不仅仅是对产业发展有助益,更将是AI普惠社会民众的开端。

据多家媒体统计,2024年上半年,在已公开的行业大模型中标信息中,科大讯飞的合同数量、合同金额均保持行业领先,行业场景逐步拓宽。今天,随着AI赛道越来越热,千行万业都在向AI领域发起冲锋,而产业经济的高质量发展需要持续跑得快、跑得稳,最终才能跑得赢。这一目标离不开本土企业对根技术的攻关以及对原生创新的坚持。

在讯飞星火与昇腾AI的双向奔赴中,业界看到了一条从技术攻关到应用探索的完整路径。以此为标杆,中国的AI产业又完成了一次探索验证,将跨入一个更稳定、坚实的发展新阶段。

*本文图片均来源于网络 


http://www.ppmy.cn/ops/124063.html

相关文章

IO,进程线程面试题

1.标准IO和文件IO的区别 标准IO:调用封装好的相关库函数,来实现数据的输入输出 文件IO:调用系统(内核)提供的相关函数,来实现数据的输入输出 1、标准IO属于库函数,文件IO属于系统调用 2、标准…

go 的 timer reset

在 Go 语言 1.23 版本之前,与Timer(定时器)关联的通道是异步的(有缓冲,容量为 1)。这意味着即使在调用Timer.Stop(停止定时器)或Timer.Reset(重置定时器)并返…

基于Arduino的宠物食物分配器

创作本文的初衷是本人的一个养宠物的梦想(因为家里人对宠物过敏,因此养宠物的action一直没有落实),但是梦想总是要有的哈哈哈哈哈。上周正好是和一个很好的朋友见面,聊到了养宠物的事情,她大概是讲到了喂宠…

详解RTL design的 CDC和RDC

一、CDC(跨时钟域处理,Clock Domain Crossing) (一)基本原理 时钟域的概念 在芯片设计中,时钟域是由一个时钟信号及其相关逻辑组成的区域。每个时钟域内的电路元件(如寄存器、组合逻辑等)都由同一个时钟信号来同步操作。例如,一个微处理器芯片可能有多个时钟域,如用…

垃圾回收器

一、垃圾回收器的三种类型 1.串行 单线程执行:所有的垃圾回收工作都由单个线程完成,即在进行垃圾回收时,应用程序的其他所有线程都会停止。简单而高效:由于单线程执行,实现上相对简单,适用于小型或中小型…

HTML实现飘动广告效果

上述HTML代码创建了一个简单的网页,其中包含一个可以在页面内自动移动的小方块(div元素),并且当鼠标悬停在该方块上时,动画会暂停;当鼠标移开时,动画会继续。以下是代码的详细分析: …

k8s之ingress-nginx-controller安装

作者:程序那点事儿 日期:2024/01/30 01:25 要在master节点上安装 helm repo add ingress-nginx Welcome - Ingress-Nginx Controller helm search repo ingress-nginx helm pull ingress-nginx/ingress-nginx --version 4.4.2 mv ingress-nginx-4.4.…

传智杯 第六届—C

题目描述: 输入两个字符串,从第一字符串中删除第二个字符串中所有的字符。例如:第一个字符串是"They are students.",第二个字符串是”aeiou"。删除之后的第一个字符串变成"Thy r stdnts."。保证两个字符…