猎户星空发布MoE大模型,推出AI数据宝AirDS

embedded/2024/11/28 12:47:52/

发布 | 大力财经

11月27日,猎户星空联合聚云科技举办了题为《Data Ready for Al,MoE大模型发布暨商业闭环分享》媒体见面会。猎户星空正式发布了自主研发的Orion-MoE 8×7B大模型,并携手聚云科技推出了基于该大模型的数据服务—AI数据宝AirDS(AI-Ready Data Service)。这两项重要成果的发布,不仅标志着猎户星空在AI技术领域的又一重大突破,更为AI行业商业化进程注入新动能。

(猎豹移动董事长兼CEO、猎户星空董事长傅盛线上接受媒体采访)

Orion-MoE 8×7B:引领多语言大模型新潮流

猎户星空首席科学家韩堃出席会议,首先对Orion-MoE 8×7B大模型进行了详细介绍。这款大模型是猎户星空自主研发的开源混合架构专家大模型,拥有8×70亿参数,采用了生成式混合专家的设计,涵盖了中文、英语、日语、韩语等多种语言,展现出卓越的性能。

早在2024年年初,猎户星空隆重发布自研“为企业应用而生”的百亿参数大语言基座模型Orion-14B。为什么要在2024年底发布MoE大模型?

猎户星空在探索AI应用场景过程中,一方面以客户视角为出发点,模型既要效果好又要速度快;另一方面从大模型技术发展来看,相比稠密模型的“通才”、一群“专家”的MoE能更高效专业地完成企业复杂任务,而且在不显著增加计算成本的前提下大幅增加模型容量。所以,这款极具性价比的Orion-MoE 8x7B大模型是“为匹配企业客户需求而生”。

在主流的公开基准评测中,Orion-MoE 8×7B与同规模参数级别的基座大模型对比,各项评测指标均表现优异,特别是在多语言能力方面展现出强大实力。此外,在推理速度方面也表现抢眼,显著高于同等参数规模的稠密模型。

AI数据宝AirDS:开启大模型商业化闭环

猎户星空基于研发MoE大模型对数据训练的认知理解和能力积累,携手猎豹移动旗下聚云科技共同推出大模型数据服务—AI数据宝AirDS(AI-Ready Data Service),为全球化企业提供更为高效、精准的AI数据服务支持,助力其在AI应用落地过程中实现“最后一公里”的突破。

猎户星空首席科学家韩堃介绍道,近年来,由于计算能力的提升、大规模数据集的可用性以及算法的改进,AI大模型进入爆发增长期,算力、算法、数据,是大模型发展的关键三要素。然而,相比于算法和算力,在大模型商业闭环中,数据明显成为最直接影响其在垂直行业落地效果的关键。

“捅破AI行业窗户纸,百模大战靠数据”,AI数据宝AirDS提供全方位的大模型数据服务,涵盖数据收集、清洗、标注、提示词工程以及评估等环节,猎豹移动董事长兼CEO、猎户星空董事长傅盛线上接受媒体采访表示。在实际应用中,已服务包括移动通信终端、互联网娱乐、新能源汽车等多个领域的中国领先出海品牌,帮助客户显著提升AI应用的效果与效率,助力全球市场竞争。

猎豹移动副总裁童宁在会上详细介绍了AI数据宝AirDS的成功案例。例如,在移动通信终端领域,AI数据宝AirDS通过收集多场景、多语⾔数据,完成开发测试平台,优化prompt⼯程,提升⼤模型针对用户需求的数据返回准确率;还有,AI数据宝AirDS通过开发⼤模型⾃动化⼯具测试平台以及prompt⼯程,实现移动终端多语⾔用户之间语⾳交互翻译,准确率大幅提升。在互联网娱乐领域,AI数据宝AirDS服务让用户可通过⾃然语⾔交互实现⼤模型对外部互联⽹应⽤API的调⽤。在这些案例之外,AI数据宝还服务于出海新能源汽车、出海金融、出海消费零售等行业。

总结:猎豹移动的集团基因及整合优势

会议接近尾声,猎豹移动高级副总裁孙明焱总结此次推出AI数据宝AirDS是基于猎豹移动在多个领域的既有基因和显著优势,包括出海全球化经验、应用开发能力、AI机器人和大模型行业实践与技术积累。

做为中国第一批成功出海的互联网企业,猎豹移动凭借工具应用开拓了全球市场。近年来,猎豹移动战略转型从传统的ToC业务转向以AI和大模型为核心的ToB业务,并通过控股猎户星空,进一步加强在AI服务机器人和AI大模型领域的布局。

在获取客户需求层面,猎豹移动旗下聚云科技拥有超过十年的出海运维经验,对外赋能、服务中国企业出海上云、用云、管理云,拥有了一大批服务中国品牌出海的实践案例,深刻掌握着客户在云端的GenAI应用需求;在AI数据服务能力层面,猎豹移动控股的猎户星空对通过提升数据质量来改善大模型效果有着充分的实践经验。此次猎户星空携手聚云科技聚合大模型数据收集、清洗、标注、提示词工程和评估的全方位服务,共创AI数据宝AirDS(AI-Ready Data Service)。相对于传统的数据标注公司,拥有在AI数据服务能力上划时代的技术优势,是大模型业内对外开放数据能力的唯一厂商。

除了发布Orion-MoE 8×7B大模型和AI数据宝AirDS外,猎户星空宣布与香港大学计算与数据科学学院签订了合作协议,双方将联合研发用于课程教学场景的AI应用教育工具,并开展“专注具身智能相关的课程项目”,共同推动AI技术在应用领域的普及与应用。


http://www.ppmy.cn/embedded/141183.html

相关文章

论文阅读 - Labeled Datasets for Research on Information Operations

https://arxiv.org/pdf/2411.10609 目录 Introduction Related Work Characterizing IOs and Their Tactics Detecting Inauthentic Coordinated Behaviors Collecting IO Control Datasets IO Datasets Control Datasets Control Data Collection Data Curation D…

系统代理与Tun模式的工作原理和应用场景详解

系统代理与Tun模式的工作原理和应用场景详解 为了更详细地解释系统代理和Tun模式的工作原理及特性,我们需要深入理解这两种技术在网络数据处理中的具体应用和实现方式。这种理解将帮助用户更好地选择合适的网络流量管理策略。 系统代理 工作原理 系统代理模式基…

ROS2-参数服务器

在 ROS 2 中,节点之间可以通过参数服务器共享和获取参数。这意味着一个节点可以声明一个参数,而其他节点可以读取或修改这个参数。这是通过 ROS 2 的参数系统实现的,它允许节点在参数服务器上声明、设置和获取参数 。 0. 背景 系统有多个 RO…

第五章 nfs服务器

nfs简介: (1)NFS(Network File System):网络文件系统 是FreeBSD支持的文件系统中的一种 允许网络中的计算机之间通过TCP/IP网络共享资源(不同的计算机、操作系统)…

性能测试调优之线程池的性能优化

做性能测试时,有些压测场景下TPS上不去,或者响应时间变长,或者直接出现一些连接 被拒绝的报错,这些都有可能是tomcat的连接池不够引起的。 连接池的概念 线程池:是一个管理线程集合的框架,它负责维护一个…

MyBatis-数据库连接池、属性文件config.properties、类名简化、MyBatis的整体架构

一、数据库连接池 1、概述 存储实现创建好的连接对象的容器 2、优点 避免了频繁创建和销毁连接对象 3、使用 在使用到连接对象时可在数据库连接池中直接获取 4、实现 不需要我们去实现,框架和一些第三方有现成的组件(C3P0、ADCP、德鲁伊(阿里巴巴)&#xff…

AIGC:重塑文学的新力量

目录 一.AIGC 为文学创作带来的新机遇 1.激发创意灵感 2.提高创作效率 3.拓展文学风格和形式 4.促进文学的普及和传播 二.AIGC 对文学创作的挑战 1.版权问题 2.文学价值的质疑 3.对人类作家的冲击 三.如何应对 AIGC 对文学的影响 1.明确版权归属 2.提高文学素养 3…

力扣动态规划基础版(字符串应用)

5.最长回文串 5. 最长回文子串https://leetcode.cn/problems/longest-palindromic-substring/ 先全部置为false然后反向遍历。动态规划数组,dp【i】【j】表示从第i到第j 是否是回文串。Arrays.fill表示的是将指定的内容填充到数组中。状态转移方程如下 这个题目用…