今天看到一条新闻,感觉腾讯在 AI 大模型方面确实挺厉害的,符合它低调务实的风格,在不知不觉中一天竟然开源了两个核心的,重要的 AI 大模型。
据新闻报道,11月 5 日,腾讯混元宣布最新的 MoE 模型“混元 Large” 以及混元 3D 生成大模型正式开源。同时,腾讯云TI平台和高性能应用服务 HAI 也于宣布开放接入这两个模型,为模型的精调、API调用及私有化部署提供一站式服务。
简单介绍一下这两个大模型。
腾讯混元 Large 模型是基于 MoE 模型结构的,熟悉 AI 技术的同学应该知道,MoE(Mixture of Experts),即混合专家模型,是目前国内外主流的大模型结构,MoE 模型的每一层都包含多个并行的同构专家,一次 token 的前向计算只会激活部分专家,是一种稀疏的网络结构,因而推理成本远低于同等参数的稠密模型。
这次腾讯混元 Large 模型总参数量 389B,激活参数量 52B ,上下文长度达 256 k,是当前业界参数规模最大、效果最好的开源 MoE模型,同时通过技术的优化,也更适配开源框架的精调和部署,具有较强的实用性。
公开的测评结果显示,腾讯混元Large在CMMLU、MMLU、CEval、AGIEval等多学科综合评测集、中英文NLP任务、代码和数学等9大维度全面领先,超过Llama3.1、Mixtral等国外一流的开源大模型。
而混元 3D 生成大模型是首个同时支持文字、图像生成 3D 的开源大模型。据说,这个模型具有强大泛化能力和可控性,可重建各类尺度物体,大到建筑,小到工具花草。
经过定性、定量多个维度的评估,腾讯混元3D生成大模型在生成质量上全面超过了 SOTA 开源模型。并在保证高质量、多样化生成的条件下,推理性能也达到了业界领先水平,显著减少了 3D 资产生产的耗时。
说白了,有了这个开源大模型,以后大家做 3D 模型会非常的方便。
看到腾讯拥抱开源,一天开放 2 大核心模型,让我又想起了 AI 开源与闭源之争,今年上半年,关于 AI 大模型开源好,还是闭源好,在网上激烈的讨论。
其实,我是坚定的开源拥护者,原因很简单,我感觉有 3 点。
1、 降低了开发门槛
对于 AI 大模型来讲,门槛挺高的,一般的企业是没有能力开发的,如果使用闭源的就必须交钱,而且闭源的大模型无法自由修改和扩展,限制了创新的可能性。同时因为闭源,也缺乏透明度。
如果有像腾讯这样的大企业在开源大模型上下力,许多小型企业和初创公司可以利用腾讯提供的开源资源,快速构建自己的 AI 应用,而无需从零开始开发。比如,在教育领域,可以让许多教育机构利用腾讯的开源模型,开发出智能教育工具,提供个性化的学习体验。再比如,腾讯混元开源的文生 3D 大模型,也可以让很多中小型企业针对自己的业务去开发 3D 模型。
所以,开源大模型降低了企业和开发者进入 AI 领域的门槛。
2、 降低了开发和运行成本
开源技术通常是免费的,企业可以减少在模型开发上的资金投入。而且开发一个大规模的 AI 模型需要大量的计算资源、数据集和技术积累,这些对于大多数企业来说都是巨大的成本开支。就以腾讯的混元 Large 和混元 3D 生成模型,已经在这些方面进行了大量的投入和优化。企业可以直接使用这些开源模型,而不需要从头开始研发。
另外,我们也知道通用大模型因为其通用性,所以,涉及的东西太多,在算力和电力上,耗费也巨大,开源模型,我们可以针对自己的业务进行裁剪和修改,对于运行成本来讲也很节省。
3、 有助于生态的繁荣与创新
就以这次腾讯的开源为例,腾讯的开源大模型混元 Large 和混元 3D 生成模型,通过提供先进的技术和架构,可以推动了整个行业的技术进步。开源使得其他研究人员和开发者可以基于腾讯的模型进行二次开发,探索新的应用场景。比如,混元 Large 模型在自然语言处理中的卓越表现,促使各类企业和研究机构能够更好地解决实际问题,如自动化客服和智能写作等。
而且,腾讯的开源大模型不仅限于某一领域,其多模态能力使其在多个行业中得以应用。比如,混元文生 3D 模型可用于游戏开发、建筑设计、虚拟现实等领域。在游戏开发中,开发者可以快速生成高质量的 3D 资产,当大家都在上面使用的时候,可以玩出更多花样。目前,腾讯地图利用混元 3D 模型推出了自定义 3D 导航车标功能,支持用户创作个性化的 3D 导航车标。腾讯元宝 APP 上线了“3D 角色梦工厂”,支持个性化的 UGC 3D 人物生成。
开源有利于生态的繁荣与创新。
再来说说我认为腾讯为什么坚持走开源路线。腾讯是一家以产品起家的数字企业,用户为本、构建生态是腾讯一贯坚持并且擅长做的事情。我们看微信生态,腾讯擅长的是搭建“基础设施”、降低使用门槛,小程序、公众号和视频号都是很好的例子,里面活跃着一大批中小开发者和内容创作者。
很显然,对于大企业来说,闭源可以保护企业核心的商业机密,开源对于企业早期的商业化并不有利。不过相比这些,腾讯更看重的是开放,把生态做好、把蛋糕做大。通过开源,腾讯也希望促进知识共享,吸引更多的用户和合作伙伴。
现在的AI虽然很火热,但还并没有真正实现技术普惠,那腾讯这样的大企业通过开源模型去帮助中小企业和开发者就是一个很好的实践。
另外,开源模型我认为反倒是企业技术创新自信的表现。正因为相信自己的技术能够持续改进并保持领先,所以愿意将其开源供他人使用和学习。我一直认为,开源不仅仅是技术上的选择,更是一种开放创新文化的体现,腾讯是很好践行开放创新的一家企业。
所以,真希望,国内大厂能够像腾讯一样,多为开源做贡献,在支持自身发展的同时,也多为 AI 行业的生态做贡献。