数字人的新革命,BAT的“冲高”战场

news/2024/10/30 23:15:09/

 

配图来自Canva可画

ChatGPT横空出世,让人们看到了数字人的另一种可能,将ChatGPT与虚拟数字人融合,研发出更加智能化、拟人化的虚拟数字人成为数字人厂商的新命题、新方向。

2月份,岭南股份、风语筑、开普云等10多家公司,均表示公司数字人相关业务已经接入类似ChatGPT技术,或正在研究相关技术与数字人结合的应用场景。

3月份,天娱数科宣布旗下虚拟数字人已经接入ChatGPT等模型,主要用于持续优化内容生产效率与创意;腾讯发布全新的AI智能创作助手“腾讯智影”,推出了智影数字人、文本配音、文章转视频等AI创作工具。

4月份,百家云宣布将正式推出应用于多个垂直行业及场景的人工智能生成内容及视频解决方案,有望在极短时间内为客户打造出专属的虚拟数字人、智能工具,构建高拟真、多样化的虚拟场景。

从以上行业新消息来看,不少数字人厂商已陆续接触ChatGPT技术。而这些行业探索者陆续跟进新技术的原因也很简单:数字人是虚拟世界交互的重要载体,市场空间广阔,根据市场分析机构IDC预测,到2026年中国AI数字人市场规模将达102.4亿元。

在争夺数字人蓝海市场的路上,互联网大厂的数字人竞争正在随着技术的升级而不断升维。

大厂编织“天罗地网”

不知不觉,数字人产业从概念炒作阶段走向落地的实质发展阶段,虚拟数字人加速融入人们的生活。有以虚拟歌手、虚拟偶像为代表的表演型虚拟数字人,有虚拟银行柜员、虚拟客服、虚拟主播等服务型虚拟数字人,也有走入千家万户的陪伴型虚拟数字人。

多种类型数字为人们提供多元化服务的背后是BAT等互联网大厂和数字人初创厂商深厚的技术积淀。

百度早早发布集数字人生产、内容创作、业务配置服务为一体的数字人直播平台“曦灵”,构建数字人手语平台、数字明星运营平台、数字人直播平台与交互能力相关的对话配置平台,为B端提供虚拟主持人、虚拟员工、虚拟偶像、品牌代言人的创建与运营服务。

腾讯也不甘落后,不止聚焦服务型数字助手,推出数字人平台——云小微数智人平台,试图构建数字人与智能车载、智能家居、智能交通等智能设备的联系,还结合游戏生态孵化了《QQ炫舞》的星瞳、《和平精英》的吉莉、《王者荣耀》的无限王者团等虚拟偶像,抢先占领游戏用户心智后,渗透至多元化群体。

字节跳动布局数字人的思路和腾讯类似又有不同,字节跳动数字人布局主要体现在虚拟偶像业务“A-SOUL”和数字时尚平台“沸寂”上,经过一段时间运营“A-SOUL”成为人气超高的虚拟偶像组合,而数字时尚平台“沸寂”已被关停。

阿里也对数字人市场虎视眈眈,其基于自身在电商业务上的优势,对数字人直播、数字人代言人展开了探索。另外,阿里巴巴正研发由数字人全面接管的终端交互引擎,即将推出第一款“数字人+终端”产品。

总之,互联网大厂对数字人技术和应用场景展开广泛布局,引领数字人服务从垂直单一的方向,向着多个点面进发,数字人厂商围绕技术、场景、产品展开的竞争继续升维。

从B端向C端,从点到面

活跃在市面上的虚拟数字人分为身份型虚拟人(虚拟偶像)和服务型虚拟人(数字员工),前者可助力品牌传播和营销,后者的作用是替代一些重复性、机械性的工作,帮助企业降低成本,提高企业客户的效率。

据中商产业研究院数据预计,2030年中国数字虚拟人整体市场规模将超过2700亿元,其中身份型数字人约1747亿元占比达65%;服务型数字人约955亿元,占比达35%,市场发展空间广阔。

目前身份型虚拟人和服务型虚拟人的商业化更多面向B端市场,究其原因有以下几点:

一来,数字经济浪潮汹涌,各行各业数字化转型加快,数字人需求主要集中在B端市场;二来,数字人研发成本和运营经费高昂,制作周期也比较长,能为数字人买单的主要是B端市场;三来,元宇宙风口下,虚拟偶像、虚拟KOL等产业爆发,数字人作为元宇宙重要的组成部分,十分受科技企业的关注。

数字人已经在各类场景中承担着多重角色,它们是企业的“工具人”,也是行业实现数字化转型的直观表现。

例如,北京冬奥运上和央视主持人朱广权和搭档的AI 虚拟人手语主播;在航天领域,新华社数字记者、数字航天员小诤……冬奥运AI 虚拟人手语主播是百度的杰作、数字航天员小诤是腾讯的作品,数字人B端应用市场竞争已进入白热化阶段。

数字人深入人们生活的同时,消费者也对数字人了解和认可度也逐渐加深加强。此外,随着人工智能、云计算、5G等前沿科技的革新,数字人朝着多元应用方向发展,不可避免地成为C端用户的“新助手”。

一方面,数字人正在朝着多元化且广泛的应用方向发展,快速扩展到不同行业、不同场景,也将面向更广大的C端用户提供服务。数字人应用于金融、影视、电商等行业提高行业生产和运营效率,那么也具备帮助C端用户生产内容和辅助工作的能力,例如和数字人练口语、和数字人玩游戏等等。

另一方面,各类前沿技术稳步向前,数字人规模化是大势所趋,届时数字人制作成本降低,普通用户也可以承担和购买数字人服务,个人虚拟分身为代表的应用潜力巨大,这也是百度、阿里、腾讯等数字人厂商的商业化新目标。

毫无疑问,数字人会是一门好生意,但数字人规模化落地面临着人才、成本、场景、技术等层层困难,其中最关键的是制造技术瓶颈,如何让数字人摆脱“空有一副好皮囊”的市场评价是一大难题。

“死磕”技术升级,构建差异化竞争力

技术进步是数字人发展的动力源,数字人厂商之争亦是前沿科技实力之争。

以往人们对数字人的关注点是“拟人化程度”,也就是数字人的皮囊和外在表现力,因此数字人厂商的竞争焦点是让数字人更像人的建模、渲染、动作捕捉和AI驱动等技术。建模、渲染技术可以让数字人具备人的外貌特征,动作捕捉和AI驱动技术可以让数字人说话、做表情和动作,形象更逼真。

现在人们对数字人提出了更高要求,不止外在要像人还要有一个“有趣的灵魂”,需要新技术支撑,这也就要求数字人厂商斥巨资,专研新技术创新迭代产品,以满足人们不断变化的需求。

数字人是多项前沿技术的集大成者,数字人厂商技术路线的不同,技术输出和产品制造的能力也不同。

一是,建模和渲染等技术领先的技术型玩家,它们“塑值”能力较强,提供数字人及其相关场景的制作服务。较为知名的厂商有亿真科技、相芯科技、叠镜数字、虚谷未来等等,它们长期专注于数字人皮囊的塑造,构建数字人的技术底座。

二是,深耕人工智能、语音识别、动作捕捉、面部捕捉等技术的技术型玩家,它们主要负责让数字人“动”起来。代表企业有科大讯飞、云舶科技、青瞳视觉等等,它们通过各自的技术强项,让数字人得以生动、平稳地运行。

三是,集合多项底层技术构建数字人技术平台的平台型玩家,它们有的是全链路技术赋能者,也有的像是“组装工厂”,将各类技术组合成一个完整的数字人产品。百度、腾讯、阿里正是这类平台型玩家,它们在有丰富内容和多元化的应用场景,也有各个环节技术赋能的能力,加速了数字人的生产效率和应用范围。

以百度为例,百度智能云曦灵平台集数字人生产、内容创作、业务配置服务为一体,可以为广电、互娱、金融、政务、运营商、零售等行业提供一站式的虚拟主持人、虚拟员工、虚拟偶像、品牌代言人的创建与运营服务。

这三类玩家各有技术强项,它们相互影响、相互促进,也是竞争关系。技术型玩家、平台型玩家相互博弈,将会推动数字人制作效能和智能水平将持续提升,“数字人+”浪潮会更汹涌。

开辟新空间,创造新价值

数字人应用于各行各业不同场景,“数字人+”浪潮越发澎湃,为各行各业带来新的发展方向,为数字人厂商开拓新增长空间。

首先,数字孪生、人工智能等前沿技术的革新,会让数字人更智能,实用性更强、体验感更佳,商用价值有望提高。当下的数字人产品或多或少存在一些技术缺陷,以至于用户体验不佳,市场不间断地传来质疑声,未来技术进步也会改善产品质量,拔高商业化价值。

其次,数字经济高速发展,数字人利好政策接连发布,加速推动数字人应用落地。据了解,2021年,我国将虚拟数字技术的发展纳入了“十四五”规划之中;2022年,国内首个数字人产业的专项支持政策出台;同一年,相关布局发布《虚拟现实与行业应用融合发展行动计划(2022-2026年)》……

再有,数字人应用场景增加,进一步释放生产力。随着百度、阿里、腾讯等互联网企业把目光聚焦在“数字人+”,基于不同行业的业务特点和需求,孵化千行千面的数字员工,提供智能化、差异化服务,可以进一步降本增效,释放生产力。

总而言之,巨头的博弈、场景的拓展、技术的进步、政策的出台,未来数字人产业将创造出巨大的经济价值,BAT等行业探索者也将获得长足的增长。


http://www.ppmy.cn/news/83088.html

相关文章

java多线程同步技术基础

说明 当程序中出现多个进程对同一资源进行操作时,因为对数据的操作非常密集,可能会对资源过度操作,这时就需要用到线程的同步技术。 以一个抢红包程序为例,红包数量为3个,开启5个线程来模拟抢红包行为,红…

Python实现ACO蚁群优化算法优化卷积神经网络回归模型(CNN回归算法)项目实战

说明:这是一个机器学习实战项目(附带数据代码文档视频讲解),如需数据代码文档视频讲解可以直接到文章最后获取。 1.项目背景 蚁群优化算法(Ant Colony Optimization, ACO)是一种源于大自然生物世界的新的仿生进化算法&#xff0c…

深入学习MYSQL-使用触发器

触发器 每个表最多支持6个触发器,(insert,update,delete)之前和之后。 删除触发器 drop trigger trigger_name;insert 触发器  在INSERT触发器代码内,可引用一个名为NEW的虚拟表,访问被插入…

API测试| 了解API接口测试| API接口测试指南

什么是API? API是一个缩写,它代表了一个 pplication P AGC软件覆盖整个房间。API是用于构建软件应用程序的一组例程,协议和工具。API指定一个软件程序应如何与其他软件程序进行交互。 例行程序:执行特定任务的程序。例程也称为过…

搭建监控日志系统

在微服务或者集群架构中,一次请求的调用会跨多个服务(web,mysql,feign等)、多个模块(用户模块,商品模块等)、多个容器(用户模块可能有多个实例),这…

Unity之OpenXR+XR Interaction Toolkit 安装和配置

前言 XR Interaction Toolkit 是Unity基于OpenXR标准,发布的一套XR工具,目的是方便我们快速接入XR相关的SDK,并且做到兼容不同VR设备的目的,目前流行的VR设备如Oculus,Metal,HTC Vive,Pico等统统都支持。 所以我们今天的目的就是把XR Interaction Toolkit从导入到配置,…

Elastic Learned Sparse Encoder 简介:Elastic 用于语义搜索的 AI 模型

作者:Aris Papadopoulos, Gilad Gal 寻找意义,而不仅仅是文字 我们很高兴地与大家分享,在 8.8 中,Elastic 提供开箱即用的语义搜索。语义搜索旨在根据文本的意图或含义进行搜索,而不是词汇匹配或关键字查询。与传统的…

C++11 call_once 和 once_flag

文章目录 一、简介二、原理2.1 示例2.2 call_once源码详解2.3 once_flag源码详解 三、Linux内核中的 DO_ONCE 机制 一、简介 std::call_once 和 std::once_flag 是 C11 中引入的线程安全的函数和类型,用于确保某个函数只被调用一次。 std::once_flag 是一个类型&a…