曝阿里达摩院大模型 M6 带头人杨红霞已离职:个人选择,非行业原因

news/2024/11/16 9:24:29/

c2f439bdfdf40d64908a08ecd8c00c26.jpeg


  报道  

作者:李梅(AI科技评论)

编辑:Aeneas David

【导读】阿里 M6 大模型带头人杨红霞,已从阿里巴巴达摩院智能计算实验室离职。

AI科技评论获悉,阿里 M6 大模型的原带头人杨红霞,已于 9 月初因个人家庭原因从阿里巴巴达摩院智能计算实验室离职。

杨红霞常年深耕在产业化大规模落地的人工智能相关技术,在任资深算法专家期间带领团队探索阿里在下一代人工智能突破性技术-认知智能的技术发展与场景应用落地。

99aebc25cda0969080f983ecf18924e1.png

杨红霞 ,2007 年本科毕业于南开大学,获统计学学士学位。其后她去往美国杜克大学统计科学系攻读博士学位,师从 David Dunson 教授。

博士毕业后,杨红霞先入职 IBM 全球研发中心任 Watson 研究员,之后入职雅虎公司,担任首席数据科学家。

2016 年,杨红霞结束她在美国近 10 年的留学及工作生涯回国,去往杭州加入阿里巴巴集团。

杨红霞领导的阿里巴巴达摩院 M6 团队致力于认知智能方向,目前研发了 AliGraph、M6、洛犀等较为有影响力的人工智能开源平台和系统,发表顶级会议、期刊文章超过 100 篇,美国和中国专利超过 30 项。

她曾带领团队获 2019 世界人工智能大会最高奖卓越人工智能引领者(Super AI Leader,简称 SAIL 奖),2020 年国家科学技术进步奖二等奖和 2020 年杭州市创新领军团队。2022年6月,杨红霞入选 2022 福布斯中国科技女性50榜。

大模型 M6 是杨红霞在任期间的最突出成就。据了解,她离职是因为个人家庭原因,而非行业问题。达摩院大模型 M6 团队的后续工作不受影响。

M6 于 2021 年 3 月首次发布,是国内首个千亿参数多模态大模型。当时,OpenAI 前政策主管 Jack Clark 曾赞扬道:这个模型的规模和设计都非常惊人。这看起来像是众多中国的 AI 研究组织逐渐发展壮大的一种表现。

作为通用性 AI 大模型,M6 拥有多模态、多任务能力,尤其擅长设计、写作、问答,在电商、制造业、文学艺术、科学研究等领域都具有广泛应用前景。杨红霞曾在接受采访时表示:“多模态预训练是下一代人工智能的基础,M6 模型实现了训练效率和生成精度等多项突破,是当前众多中文多模态下游任务最优模型。”

6 月份,杨红霞团队又发布万亿参数的 M6,仅使用 480 块GPU,就能实现万亿参数体量的智能运算。相比原来的百亿参数模型,功耗降低 8 成,效率提升 11 倍。

M6 在当年 10 月再次突破极限,杨红霞团队使用 512 GPU,在 10 天内训练出 10 万亿模型。与大模型 GPT-3 具有同等参数规模,但能耗仅为其 1%。

据了解,M6 已经在阿里新制造平台-犀牛制造中得到应用,它服务内部近 50 个部门,并在阿里云对外产品中投入使用,还被收录在 MIT Tech Review 2021 年度中国 AI 突破技术报告。

参考资料:

https://baijiahao.baidu.com/s?id=1746369376161463935&wfr=spider&for=pc

http://www2.stat.duke.edu/~hy35/home.html

本文经授权转载自微信公众号「AI科技评论」(ID:aitechtalk)

outside_default.png

点个在看 paper不断!


http://www.ppmy.cn/news/675405.html

相关文章

M6的服务器是什么型号,M6螺栓(螺栓型号为M6×16是什么意思?)

M6螺栓的剪切力一般有多大?能承受50kg吗? 分析如下: 1、剪应力=50*9.8/20.1=24.38MPa,可以承受50KG; 2、M6螺母的应力截面积:20.1平方毫米,所以剪应力=50*9.8/20.1=24.38MPa,螺栓如果是4.8级的,那么它的抗拉强度为400MPa,抗剪强度约为抗拉强度的一半,为200MPa,200/…

仅用 480 块 GPU 跑出万亿参数!全球首个“低碳版”巨模型 M6 来了

继今年 3 月阿里达摩院发布国内首个千亿参数多模态大模型 M6(MultiModality-to-MultiModality MultitaskMega-transformer,以下简称 M6) 之后,6 月 25 日,达摩院宣布对 M6 进行全新升级,带来“低碳版”巨模…

香蕉派BPI-M6 采用深蕾半导体Vs680芯片设计,板载4G LPDDR4和16G eMMC存储

Banana PI BPI-M6 香蕉派BPI-M6是香蕉派社区在2022年推出的新一代单板计算机,它采用深蕾半导体(Synaptics) VS680四核Cortex-A73 (2.1GHz)和一个Cortex-M3处理器,Imagination GE9920 GPU。 NPU高达6 .75 tops算力。 板载4GB LPDDR4内存和16GB EMMC存储&a…

Redis【实战篇】---- 分布式锁

Redis【实战篇】---- 分布式锁 1. 基本原理和实现方式对比2. Redis分布式锁的实现核心思路3. 实现分布式锁版本一4. Redis分布式锁误删情况说明5. 解决Redis分布式锁误删问题6. 分布式锁的原子性问题7. Lua脚本解决多条命令原子性问题8. 利用Java代码调试Lua脚本改造分布式锁 1…

windows默认打开计算机,如何设置Win10文件资源管理器默认打开“这台电脑”

如何设置Win10文件资源管理器默认打开“这台电脑” 自从升级到了WIN10,每次再打开资源管理器(WindowsE)后,出现的"快速访问(Quick Access)"界面总觉得不习惯 有没有方法可以改成直接打开“这台电脑(This PC)”呢? 当Windows系统升级…

x98air2+android+升级,[x98 air 3g平板]安装任意版本32位win10的方法

0:台电x98 air 3g装完win10出现如图错误 1:不完美的解决办法 开机时,escape进入bios,将bios的rtc芯片的时间改到前几年的时间,如2014.1.1 然后保存重启,问题暂时解决,但是台电的那个预览版本身有使用时间的限制,所以需…

x98air2+android+升级,【转】台电x98 3G 平板刷机、升级、ROOT详解及教程

很多x98 3G用户平板的用户询问如何刷机?如何ROOT的问题?下面就本人的经验谈谈如何做。一、刷机 刷机如果并非必要,请尽量不要刷。特别是没有相关知识的用户更是需要当心。如果其中某一步出错,可能你的机器就只能当砖头使用了。 一般来说刷机分为线刷和卡刷。 1.所谓线刷就是…

信号链噪声分析13

文章目录 概要整体架构流程技术名词解释技术细节小结 概要 提示:这里可以添加技术概要 接 触 ADC 或 DAC 时您一定会碰到这个经常被引用的公式,用于计算转换器理论信噪 比(SNR)。与其盲目地相信表象,不如从根本上了解其来源,因为…