对于任何人来说,生成式人工智能和支持它的基础模型目前都处于Gartner所谓的「膨胀预期的顶峰」,这一点并不奇怪,在最新的「Gartner AI技术成熟度曲线」中。这意味着他们正在悬崖上摇摇欲坠,这可能会使他们陷入「幻灭的低谷」。
「人工智能技术成熟度曲线有许多值得特别关注的创新,包括生成式人工智能和决策智能,这些创新在两到五年内将被主流采用。」高德纳首席分析师阿夫拉兹·贾夫里(Afraz Jaffri)表示:「尽早采用这些创新将带来显著的竞争优势,并缓解在业务流程中使用人工智能模型的相关问题。」
两种类型的GenAI创新占主导地位
生成式人工智能正在主导人工智能的讨论,使用ChatGPT等系统,以非常真实的方式提高了开发人员和知识工作者的生产力。这导致企业和行业重新思考他们的业务流程和人力资源的价值,将生成式人工智能推向了技术成熟度曲线中「膨胀预期的顶峰」。
Gartner现在看到了生成式人工智能运动在通往更强大的人工智能系统的道路上的两个方面:
由生成式人工智能推动的创新
生成式人工智能影响业务,因为它与内容发现、创作、真实性和法规有关。它还具有自动化人工工作以及客户和员工体验的能力。
属于这一类的关键技术包括:
- 通用人工智能(AGI)是一种(目前假设的)机器智能,它可以完成人类可以执行的任何智力任务。
- 人工智能工程(AI engineering)是企业大规模交付人工智能解决方案的基础。规程创建了一致的企业开发、交付和可操作的基于ai的系统。
- 自主系统(Autonomic systems)是自我管理的物理或软件系统,执行领域限定的任务,表现出三个基本特征:自主、学习和代理。
- 云人工智能服务(Cloud AI services)提供人工智能模型构建工具、用于预构建服务的api和相关中间件,这些中间件支持在作为云服务的预构建基础设施上运行的机器学习(ML)模型的构建/培训、部署和使用。
- 复合人工智能(Composite AI)是指不同人工智能技术的组合应用(或融合),以提高学习效率,拓宽知识表示的层次。它以更有效的方式解决了更广泛的业务问题。
- 计算机视觉(Computer vision)是一组技术,涉及捕获,处理和分析现实世界的图像和视频,以从物理世界中提取有意义的上下文信息。
- 以数据为中心的人工智能(Data-centric AI)是一种专注于增强和丰富训练数据以推动更好的人工智能成果的方法。以数据为中心的人工智能还解决了数据质量、隐私和可扩展性问题。
- 边缘人工智能(Edge AI)是指将人工智能技术嵌入到非IT产品、物联网端点、网关和边缘服务器中。它涵盖了消费者、商业和工业应用的用例,如自动驾驶汽车、增强的医疗诊断功能和流媒体视频分析。
- 智能应用程序(Intelligent applications)利用学习适应来自主响应人和机器。
- 模型操作化(Model operationalization,简称ModelOps)主要关注高级分析、人工智能和决策模型的端到端治理和生命周期管理。
- 运营人工智能系统(Operational AI systems,简称OAISys)支持生产就绪和企业级人工智能的编排、自动化和扩展,包括ML、dnn和生成式人工智能。
- 提示工程(Prompt engineering)是指以文本或图像的形式向生成AI模型提供输入,以指定和限制模型可以产生的响应集的学科。
- 智能机器人(Smart robots)是由人工智能驱动的,通常是移动的,旨在自主执行一项或多项物理任务的机器。
- 合成数据(Synthetic data)是一类人工生成的数据,而不是从对现实世界的直接观察中获得的数据。
推动生成式人工智能进步的创新
「由于稳定扩散、中间旅程、ChatGPT和大型语言模型的普及,生成式人工智能的探索正在加速。大多数行业的最终用户企业都在积极尝试生成式人工智能,」Gartner副总裁、分析师Svetlana Sicular表示。
「技术供应商组建了生成型人工智能小组,以优先交付支持生成型人工智能的应用程序和工具。2023年出现了许多利用生成式人工智能进行创新的初创公司,我们预计这一数字将会增长。一些政府正在评估生成式人工智能的影响,并准备出台法规。」
属于这一类的关键技术包括:
- 人工智能仿真(AI simulation)是人工智能和仿真技术的结合应用,共同开发人工智能代理和模拟环境,在模拟环境中可以对人工智能代理进行训练、测试和部署。
- 人工智能信任、风险和安全管理(AI trust, risk and security management,简称AI TRiSM)确保人工智能模型治理、可信度、公平性、可靠性、鲁棒性、有效性和数据保护。
- 因果人工智能(Causal AI)识别和利用因果关系,超越基于相关性的预测模型,朝着能够更有效地规定行动和更自主地行动的人工智能系统发展。
- 数据标记和注释(Data labeling and annotation,简称DL&A)是对数据资产进行进一步分类、分割、注释和增强的过程,以丰富数据,以便更好地进行分析和人工智能项目。
- 第一原理人工智能(First-principles AI,简称FPAI)将物理和模拟原理、治理定律和领域知识纳入人工智能模型。FPAI将人工智能工程扩展到复杂的系统工程和基于模型的系统
- 基础模型(Foundation models)是以自监督的方式在大范围的数据集上训练的大参数模型。
- 知识图谱(Knowledge graphs )是物理世界和数字世界的机器可读表示。它们包括实体(人、公司、数字资产)及其关系,它们遵循图形数据模型。
- 多智能体系统(Multiagent systems,简称MAS)是一种由多个独立(但相互作用)的智能体组成的人工智能系统,每个智能体都能够感知环境并采取行动。代理可以是人工智能模型、软件程序、机器人和其他计算实体。
- 神经符号人工智能(Neurosymbolic AI )是复合人工智能的一种形式,它结合了机器学习方法和符号系统来创建更强大、更值得信赖的人工智能模型。它为更有效地解决更广泛的业务问题提供了推理基础设施。
- 负责任的人工智能(Responsible AI)是一个总称,指的是在采用人工智能时做出适当的商业和道德选择。它包括企业责任和实践,以确保积极、负责和道德的人工智能开发和运营。
人工智能的未来会怎样?
MartechToday采访了Gartner的主管分析师阿夫拉兹·贾夫里(Afraz Jaffri),他专注于分析、数据科学和人工智能,讨论了我们应该如何解读这种情况。
MartechToday:你预计基础模型需要2到5年的时间,生成式人工智能需要5到10年才能达到「生产力的平台期」。这是基于什么?
阿夫拉兹·贾夫里:这是我们可以看到真正采用的地方,不仅仅是在少数企业中,这可能会更快地完成,而是在所有级别的企业中——主要是以打包应用程序的形式。每一款软件都将包含某种生成式人工智能功能,但从这些功能中获得的实际生产力将需要更长的时间才能理解。这是一场竞赛,每个人都在自己的软件中推出生成式人工智能产品或功能;在所有这些情况下,效益将需要更长的时间来实现和衡量。
基础模型涵盖范围很广;不仅是大语言模型,还有图像和视频模型。这就是为什么平稳期的时间会更长。
MartechToday:我们可以想象一些对生成式人工智能非常具有破坏性的事情。一个是监管问题——人们确实担心大型语言模型会抓取个人数据,尤其是在欧洲。另一个与版权有关。你考虑过这些可能的干扰了吗?
阿夫拉兹·贾夫里:是的,它们是思维的一部分。第一个问题实际上是信任方面。不管外部规则如何,人们仍然觉得很难控制模型的输出并保证输出实际上是正确的。这是一个很大的障碍。正如你所提到的,还有监管方面的问题。如果在欧洲,这些模型受到严格的监管,它们甚至可能无法使用;我们已经看到ChatGPT在那里被删除了一段时间。如果大企业确实认为遵守这一规定太麻烦,它们可能会直接从该地区撤出服务。
还有法律方面的问题。正如你所说,这些模型的基础数据包括从网上抓取的受版权保护的数据。如果数据的提供者开始要求适当的赎回,这也会对这些模型的未来使用水平产生影响。然后是安全方面的问题。你能使这些模型在抵御攻击时有多安全?这里肯定有逆风要航行。
MartechToday:我们经常听到「圈内人」的说法。在向用户发布任何由生成式人工智能创造的内容之前,你需要人工审查和批准。但基因人工智能的好处之一是其创造力的速度和规模。人类怎么能跟上呢?
阿夫拉兹·贾夫里:它的速度和规模是用来供人类做他们需要做的事情的。它的存在是为了帮助那些需要浏览10份文件才能得到答案的人;现在他们可以在一分钟内完成。由于信任问题,这些是使用语言模型的最有价值的任务类型。
MartechToday:如果负责任的人工智能距离平稳期还有5到10年的时间,那么你的预测似乎是崎岖不平的。
阿夫拉兹·贾夫里:监管世界和其他系统是未知的;即使它们被正式确定了,不同地区也会有不同的规定。这些模型的固有性质是,它们确实有不安全的倾向。要想控制这一点需要时间去学习。你如何检查一个模型是否安全?你如何审核模型的遵从性?安全吗?最佳实践很难获得;每个企业都在采取自己的方法。忘掉生成式人工智能吧,其他的人工智能模型,那些已经被企业使用了一段时间的模型,仍然在犯错误,仍然表现出偏见。
MartechToday:人们应该如何为即将到来的幻灭低谷做准备?
阿夫拉兹·贾夫里:企业在体验生成式人工智能的过程中会遵循不同的轨迹,所以这并不一定意味着企业需要陷入低谷。它通常发生在期望没有得到管理的时候。如果你开始着眼于一些有针对性的用例,一些有针对性的实现,你就有了很好的成功指标,也有了对数据管理和企业的投资;如果你将所有这些与关于模型可以做什么的实际叙述结合起来,那么你就控制了成熟度曲线,并且不太可能陷入低谷。
MartechToday:你是否认为人工智能的技术成熟度曲线比你所见过的其他领域都要快?
阿夫拉兹·贾夫里:人工智能的技术成熟度曲线确实倾向于向那些在曲线上移动得更快的创新倾斜——而且它们在它们能做的事情上也往往更有影响力。目前,它是创投基金的前沿和中心。这是研究领域的一个焦点领域。很多这样的东西都来自学术界,学术界在这个领域非常活跃。
MartechToday:最后是AGI,即人工通用智能(复制人类智能的AI)。你会在十年或更久的时间里实现这一目标。你是否因为这可能根本不可能而两面下注?
阿夫拉兹·贾夫里:是的。我们确实有一个标记,「在停滞期之前就过时了」。有一种观点认为这永远不会发生,但我们认为这将超过10年,因为对AGI的实际含义有很多不同的解释。许多受人尊敬的研究人员表示,我们正走在通往AGI的道路上,但要看到这条道路的实际样子,还需要更多的突破和创新。我们认为这比很多人认为的要遥远。