内测挤爆的文心一言,能否迎战GPT-4?

news/2025/2/12 3:52:34/

2月7日,百度宣布推出ChatGPT类型人工智能产品“文心一言”,并于3月份完成内测向公众开放。一个多月后的今日,在北京百度总部和上海张江人工智能岛,文心一言如期而至。

百度董事长兼CEO李彦宏介绍,文心一言在商业文案创作、数理推算等方面有突出能力,同时他也承认,文心一言“并没有完全ready(准备好)”。

背负着国内市场的期待,文心一言为何要匆忙上线?业内人士认为,国内GPT技术的发展,要以抢占应用场景为先机,再辅助以算法技术的迭代,“边学边赶”才能有机会与国际AI巨头迎头赶上。

具备更强中文理解力

发布会现场,李彦宏展示了文心一言在五个使用场景的表现,包括文学创作、商业文案创作、数理推算、中文理解和多模态生成。

在文学创作场景中,文心一言根据对话问题将知名科幻小说《三体》的核心内容进行了总结,并提出了五个续写《三体》的建议角度,体现出对话问答、总结分析、内容创作生成的综合能力。此外,文心一言准确回答了《三体》作者、电视剧角色扮演者等事实性问题。据介绍,AICG内容回答事实性问题时容易出现事实性差错,而文心一言延续了百度知识增强的大模型理念,大幅度提升了事实性问题的准确率。

在商业文案创作场景中,文心一言也完成了给公司起名、写口号和新闻稿的创作任务。

“AI要写好一篇稿子,除了需要准确理解我们的意图,还要有清晰的表达能力。”李彦宏解释称,人类常说“读万卷书”,AI则是 “读书破千亿卷”。文心一言大模型的训练数据包括万亿级网页、数十亿的搜索数据和图片、百亿级的语音日均调用数据以及5500亿条事实的知识图谱等。“有研究表明,数据规模足够大,参数达到千亿级,大模型就可能发生‘智能涌现’,即使在没有专门训练过的领域,也能涌现出知识理解和逻辑推理能力。”

文心一言还具备了一定的思维能力,能够学会数学推演及逻辑推理等相对复杂任务。面对“鸡兔同笼”这类锻炼人类逻辑思维的经典题,文心一言能理解题意,并有正确的解题思路,进而像学生做题一样,按正确的步骤,一步步算出正确答案。

值得一提的是,文心一言扎根于中国市场的大语言模型,因而具备中文领域先进的自然语言处理能力,在中文语言和中国文化上有更好的表现。在现场展示中,文心一言正确解释了成语“洛阳纸贵”的含义、“洛阳纸贵”对应的经济学理论,还用“洛阳纸贵”四个字创作了一首藏头诗。

除了日常的对话,李彦宏现场还展示了文心一言生成文本、图片、音频和视频的能力,还能够生成四川话等方言语音。不过遗憾的是,视频生成能力因成本较高,现阶段还未对所有用户开放。

“多模态是生成式AI一个明确的发展趋势。”李彦宏表示,“未来,随着百度多模态统一大模型的能力增强,文心一言的多模态生成能力也会不断提升。”

常用功能表现正常,漏洞仍然不少

“十月怀胎,一朝分娩。”李彦宏在发布会上如是形容文心一言的诞生。

据悉,文心一言的上线已连续多日进行压力测试,亚洲目前最大的单体智算中心山西阳泉百度智算中心,已经将算力提升到每秒可以完成400亿亿次浮点运算,并与全国其他几座智算中心共同为文心一言提供算力支持。

除了日常对话外,文心一言还提供了写报告、AI作画和查知识点三个功能模板。

文心一言在“传统媒体融合转型”为题的报告中,不仅解释了“媒体融合”的意义,还给出了数字化转型、内容创新、用户分析等多方面建议。懂经哥发现这些内容并非是搜索引擎的直接呈现,而是经过大模型的整理和归纳。在查知识点和AI作画方面,文心一言也正常表现,通常在一分钟内能够给出反馈。

不过,懂经哥在试用时发现,文心一言在交流方面仍有不少漏洞,时常出现前后矛盾的现象。另外,在对话过程中缺少上下文之间的呼应,更像是一对一的应答。

也有部分内测用户表示,同样的问题抛给文心一言和GPT-4,两者的答案有一定差距。比如《三体》的续写,“文心一言”的答案比较抽象,比如生命的意义、人类的宇宙关系,而GPT-4的回答更具体、更有冲突感,比如类人机器人的崛起、黑暗森林法则的挑战等。

试用申请挤爆测试网页

本月15日,OpenAI推出了GPT-4,市场反馈优于ChatGPT,文心一言今日上线,难免与GPT-4将有所比较。

百度早在2019年推出了文心大语言模型,以此为基础的文心一言也属于百度多年来的“厚积薄发”,不过就连李彦宏自己也承认:“不能说我们完全ready了,文心一言对标ChatGPT,甚至是对标GPT-4,门槛仍然是很高的,我自己测试感觉还是有很多不完美的地方。”

或许是担心文心一言的稳定性,李彦宏在发布会现场并未使用现场实时演示,而是采用提前录制好的视频进行了文心一言的能力展示。李彦宏也表示,该模型目前还存在一定不足,“无论是哪家公司,都不可能靠突击几个月就能做出这样的大语言模型。深度学习、自然语言处理,需要多年的坚持和积累,没法速成。”

资本市场对文心一言的反应也不尽理想。今日午后,百度的港股出现持续下挫,跌幅一度达到近10%,随后略有收窄。截至收盘,百度股价报收125.1港元/股,跌6.36%,总市值3458亿港元。

文心一言为何仓促上线?百度今日披露的两组数据能说明问题——短短一个月的时间,超过650家合作伙伴宣布加入文心一言生态;发布会后一小时内,排队申请文心一言企业版API调用服务测试的企业用户已达3万多家,申请产品测试网页多次被挤爆,百度智能云官网流量飙升百倍。

“大家都希望能早一点用上最新最先进的大语言模型。”难怪李彦宏直言,“文心一言”并不完美,但市场有需求必须要推出来。

对于“用市场换时间”的做法,360创始人周鸿祎也公开表示认同。“目前国内发展GPT技术,首先要占据应用场景,同步全力发展核心算法技术。”他表示GPT技术的应用场景需要复杂的工程化和商业化的能力,以及丰富的数据清洗和人工标注的经验,如果等国内的算法赶上GPT-4再上马,市场就错过了。

GPT概念是风口还是泡沫?

除了文心一言外,国内已有多家机构和企业推出类GPT大模型。今年2月,小冰公司的ChatGPT应用“小冰链(X-Chain of Thought & Action)”开启了小范围内测。3月初,复旦大学计算机科学技术学院邱锡鹏团队发布类ChatGPT模型MOSS,目标是打造一个具有中国特色的中文大型语言模型;360也表示将借鉴微软与OpenAI能力结合所推出的New Bing模式 ,推出新一代智能搜索引擎,并基于搜索场景推出人工智能个人助理类产品。阿里达摩院类ChatGPT产品已处于内测阶段,京东云将推出产业版ChatGPT—ChatJD……更多大模型也在逐步内测推进中。

据国际数据公司(IDC)测算,2021年全球市场人工智能市场收入规模达850亿美元,并将于2025年突破2000亿美元大关,复合年均增长率高达24.5%。另据中信建投报告显示,中国人工智能行业发展势头凶猛,在全球人工智能产业化地区中仅次于美国和欧盟,约占全球市场规模的9.6%,2022年中国人工智能市场规模达2729亿元。

GPT概念到底是风口还是泡沫?国研新经济研究院创始院长朱克力告诉懂经哥:“如百度等技术型公司已在大模型领域深耕多年,AI技术较为成熟,文心一言的出现无疑是利好,抓住这一机会能优先抢占市场。”他也劝告投资者切勿盲目跟风,一些企业缺少技术优势,仅以ChatGPT为噱头赢得股市青睐,一旦泡沫戳破将损失惨重。”

“AI市场爆发性的需求增长,将释放出前所未有的、指数级的商业价值。”李彦宏预测,大语言模型将带来云计算、模型精调和应用服务提供商三大产业机会,“基于文本生成、图像生成、音频生成、视频生成、数字人、3D等场景,已经涌现出很多创业明星公司,可能就是未来的新巨头。”

国信证券研报也认为,AIGC应用场景有望全面爆发,作为生产力工具还将不断推动聊天机器人、数字人、元宇宙等领域发展。作为推动人工智能发展的三大要素,算法目前仍在迭代,数据积累量不够,算力也刚刚突破,“三兄弟”的突破还将不断创造出新的业态和应用。


http://www.ppmy.cn/news/963847.html

相关文章

盘点国内热门AI大模型

Chat-GPT问世以来,使得大模型一时间内火爆非凡。国内外各大科技公司也纷纷加入到大模型的研发行列中来,“百模之战”愈演愈烈,国内百度、阿里、华为等科技大厂陆续推出旗下大模型产品,新锐科技公司也不甘落后,目前不少…

Python微服务架构设计使用asyncio提升性能

文章目录 1 引言2 微服务概念3 backend-for-frontend 模式4 实施产品列表 API4.1 实现基础服务4.2 实现BFF服务4.3 重试失败的请求4.4 断路器模式 5 总结 1 引言 许多 Web 应用程序都被构建为单体应用程序,单体应用程序通常是包含多个模块的大中型应用程序&#xf…

为什么有些人对CHATGPT持否定态度?

在当今人工智能技术飞速发展的时代,CHATGPT被誉为是自然语言处理领域的一大突破。然而,有些人对CHATGPT持否定态度。本文将探讨这种态度产生的原因。 技术可靠性的问题 对于很多人来说,他们对CHATGPT持否定态度的原因之一可能是技术可靠性的…

如何使用CNN预测股票

大盘股被单股力量操纵的可能性比较低,所以选大盘股. 100个交易日为1组,每隔25个交易日,选一组。如果一只股票交易20年,大概可以选得200组。搞50只大盘股,那么就有10k的数据可以使用。 数据格式是100个连续交易日的涨…

股票分析,利用线性回归实时预测股价,只需要提供股票代码即可爬取相应股票数据并建模

这里参考了别人的代码,并引用了tushare模块中定义的接口自动获取了依据 股票代码来获取数据 此篇文章提供了 1.一个简单通过接口爬取csv数据的方法 2.一个处理csv数据的简单方法 3.依据数据进行特征提取建立简单的股价预测模型 如下: 使用的话只需要修改…

一文教你如何用Python预测股票价格

翻译 | AI科技大本营(rgznai100) 参与 | 刘畅 编辑 | 周翔 【AI科技大本营导读】最近,A股尤其是上证指数走势凌厉,让营长有种身在牛市中的错觉。然而大盘天天涨,营长账户中还是那几百万,甚至还有所缩水。夜…

谈谈股市预测

(作者:牟牧云 2016/6/27) 股市具有高度混沌的特性,是一个复杂非线性动力系统。如同其他复杂性系统一样,想要进行长期的预测近乎是不可能的,和天气预报类似。但对于短期的预测却是有可能的,不仅是…

股票短期走势是否可以预测,要看什么指标?

股票短期走势是否可以预测,要看什么指标?在投资理论中,有些投资者喜欢做短线,因为短线是根据当下热点走,获利快,买卖进出自由。股票短期均线金叉说明短期投资者慢慢开始看多,市场热点也开始出现…