简说目前市面上最流行的“AI Agentic”

背景

当吴恩达在布道完著名的Agent设计模式后

他于不久后又引领了AI界的开发们开始关注另一种高级开发模式,即"Agentic",吴恩达多次反复强调:“Agentic是比Agent更具未来”。

那么什么是Agentic呢?

什么是AI Agentic

AI Agentic即代理人工智能

当我们谈论代理人工智能时,其实指的是一类目标实现自主操作的人工智能系统。这意味着,设计用于做出决策并与环境互动以实现特定的目标。为此,代理人工智能必须能够感知其环境,收集和处理数据,并执行操作以实现预定义目标。 

与需要人工监督并遵循预定义规则的传统人工智能系统不同,代理人工智能有望动态地调整与优化其性能。

代理人工智能与传统人工智能系统的区别

代理人工智能在许多关键方面与传统人工智能系统有所不同,主要是在自主性和适应性方面。

自主性意味着传统的人工智能系统可能需要监督或人工干预才能执行任务。它们根据预定义的规则和脚本运行,这限制了它们适应新情况的能力。另一方面,代理人工智能却能够自主运行、做出决策,并在没有持续人工监督的情况下采取行动。这种自主性使它们能够更有效地管理复杂而动态的环境。

至于适应性,这与传统人工智能模型通常缺乏随时间学习和适应的能力形成对比。它们是为特定任务而设计的,难以应对超出其训练数据范围的场景。另一方面,代理人工智能使用机器学习技术不断从新数据和经验中学习。这种适应能力使它们能够提高性能并管理更广泛的任务。

Agentic Workflow

拿写文章做类比。例如和另一个人说:“想让你为我写一篇关于给定主题的文章,需要一次性打字从头到尾”,虽然人们可以这样写,但实际上我们没有用这种方式写出很好的作品。

但是,我们可以用工作流来做更好的思考和写作,如从大纲、到研究、初稿、批判等,这是一个迭代的过程,这一系列迭代的工作流可以让我们自己更好的工作产品。

Agentic Workflow 能做到完成拆解的各任务环节,我们已经看到许多具有 Agentic Workflow 的 AI 应用的准确性有了巨大提高。同样,工作流的瓶颈之一也在于推理能力,因为用户使用产品需要反复调用 LLM,所以我们需要更快的推理能力来实现预期效果。

AI Agent 具备自我批判能力,在工作流中可以检查步骤,然后修正自己的错误

吴恩达举了个例子,之前做过一个在线写调研报告的 Agent,某次在斯坦福大学给一个小组做演示,不知什么原因,那次调用网页搜索失败了,可能是 API 调用错误;但是这个 Agent 发现调用网络搜索失败之后,转而去用维基百科搜索代替。

其实他本人都忘了自己给 Agent 做了联网搜索和维基百科搜索的能力,而这个编写出的 Agent 足够聪明,当网络搜索失败时,它转向维基百科搜索,然后成功完成那次 demo。

AI Agent 也许也会出错、有缺陷,但当 Agentic Workflow 可能在某个步骤上出错时,它会发现是什么错误、自我批判修正,这会使它们更加稳健。AI Agent 在这方面就像人类一样,当我们做一些事情时,很多事情第一次都不起作用,但我们反思、批判和修复的能力,使人类的行动与思想更加强大。建立在当前模型基础上的 Agentic Workflow 可以让我们在做有商业价值的应用上取得很大进展。

Agentic Workflow的准确定义和关键特点

准确定义

Agentic Workflow 是与大型语言模型(LLM)交互和完成任务的一种新方法。它通过将任务分解为多个子任务,并引导AI代理按步骤完成每个子任务,从而优化工作流程。

任务分解

将复杂的任务分解为更小的、可管理的子任务,每个子任务的输出将作为下一步的输入,以此循环往复。

AI代理(Agent)

AI代理是Agentic Workflow的核心,负责执行特定的子任务。每个代理可能负责工作流中的一个或多个特定环节。

自主性和自我决策能力

Agentic AI具备高级的认知能力,能够进行复杂的情境感知和环境理解,并在面对新情况时做出合理的判断和决策。

适应性和学习能力

Agentic AI能够从经验中学习,不断调整自己的行为以适应不断变化的环境,能够根据实时数据和环境变化动态生成策略。

模块化架构

Agentic Workflow采用模块化设计,每个模块或组件负责特定的任务或功能,这种设计允许灵活地添加、更新或替换模块。

智能体网络

在Agentic Workflow中,AI Agent形成一个网络,每个Agent拥有自己的专长和责任,通过网络协作,共同处理复杂的任务。

自适应循环

Agentic Workflow包含一个自适应循环,其中AI Agent不断收集反馈,评估性能,并根据反馈调整自己的行为,确保工作流的持续优化和改进。

交互式界面

Agentic Workflow提供了交互式界面,支持自然语言交互和可视化操作,提高了用户体验和系统的可访问性。

数据和知识管理

Agentic Workflow需要一个强大的数据和知识管理系统,以存储、检索和分析大量数据,支持AI Agent的学习和决策过程。

安全性和隐私保护机制

考虑到数据安全和隐私问题,Agentic Workflow内置了加密、访问控制和审计跟踪等安全机制,以保护敏感信息12。

设计模式

Agentic Workflow的设计模式包括反思、工具使用、规划和多智能体协作,这些模式指导开发者如何利用AI Agent来创建能够自主操作和适应环境变化的工作流程。

Agentic Workflow代理工作流的核心构成要素

Agentic Workflow(代理工作流)是一种通过AI Agent 来增强和优化工作流程的方法。这种工作流通常涉及将复杂的任务分解为更小的、可管理的子任务,然后由AI Agent代理逐步完成。

定义目标和需求

明确你希望通过Agentic Workflow实现的目标和需求。

选择合适的AI平台

选择一个支持Agentic Workflow的AI平台,例如LinkAI或其他提供类似功能的平台。

集成所需应用程序

确定需要集成到工作流中的应用程序和工具,并利用AI平台的集成功能将它们连接起来。

设计工作流程

设计工作流程的每个阶段,包括触发事件、任务执行、决策点和反馈循环。

创建AI代理

根据工作流程的需要,创建一个或多个AI代理来执行特定的任务或子任务。

任务分解

将复杂的任务分解为更小的步骤,确保每个步骤都可以由AI代理独立完成。

设置触发器和动作

为每个AI代理设置触发器,定义在什么条件下代理应该执行特定的动作。

迭代和优化

通过测试和反馈来迭代和优化工作流程,确保AI代理能够准确地完成任务。

监控和调整

持续监控工作流程的执行情况,并根据需要进行调整,以提高效率和准确性。

用户界面和体验

设计直观的用户界面,使用户能够轻松地与AI代理交互和管理工作流程。

安全性和合规性

确保工作流程符合相关的数据保护法规和安全标准。

文档和培训

为团队成员提供必要的文档和培训,确保他们理解并能够有效地使用Agentic Workflow。

利用反馈进行迭代

收集用户反馈,并将其用于进一步改进工作流程和AI代理的性能。

扩展和集成

随着业务需求的发展,考虑扩展工作流程并集成更多的应用程序和服务。

你可以构建一个Agentic Workflow,它能够利用AI Agent的力量来自动化复杂的任务,提高工作效率,并释放人力资源以专注于更高价值的工作。

进入实战

说了这么多,什么是Agentic AI?我们直接进入实战。

什么时候我该使用Agentic?什么时侯我该使用Agentic Workflow

哪些场景必须使用Agentic?

Agentic是用来解决AI的准确率以及让AI可以有一个自我反思,极大化唤醒LLMs的内部涌现机制的。要知道一个成熟的以百B来计的LLM内部聚合着的知识那可是超越互联网搜索引擎的,可以毫不夸张的说这样的一个LLM聚合了人类几乎所有文字上可以找到的知识。

如何利用和发挥好这些知识而不要让LLM产生的答案和你的答案出现偏移,就是关系到一个正确“引导涌现”而不要老是出现幻觉的问题。

同时对于追求高精度场景,即LLMs的回答必须精确到像“规则引擎”一样,此时你必须使用Agentic。

如:

1. 导游,你手头资料库只有杭州相关的旅游信息,用户现在在问北京,如果在RAG里没有Agentic此时LLMs有90%概率会把杭州的信息“包装”一下用以回答用户关于“北京”旅游的信息,这太可怕了。

2. 用户的问题比较模棱两可,此时一般的AI Agent上手就回答了,而实际回答的效果是很糟的。此时我们希望Agent接近人类一样,可以不断的在和用户的交互中确认、引导甚至诱导,一步步让客户把它的问题明确以便于LLMs更好、更准确的回答用户。比如说:

用户:我想喝咖啡。
AI:请问您是爱喝什么口味的咖啡呢?有无品牌要求?用户:美式
AI:请问您爱手工调配的还是冲压?喜欢在家自己研磨吗?用户:不在家,在家不太喝,我是上班族。
AI:那您更多的是在外面喝咖啡吧?那么您有无自己中意的咖啡品牌?星巴克?Manner还是Costa。用户:星巴克
AI:那太好了,我们这正好有如下几款星巴克。。。。。。

Agentic一定要有Workflow吗?

不一定,单个也可以,如下魔咒所示,就是一种Agentic:

请确保文章的每一段落都能直接进入讨论主题,而不是通过引入或过渡性短语来构建内容。尤其在文章的最后一部分,直接陈述您的观点或结论,避免使用可能导致总结或过渡的词汇和短语。示例:如下
错误:首先,我们需要考虑……
正确:考虑到……
错误:这个观点很有趣,然而……
正确:尽管这个观点很有趣,……
错误:综上所述,我们可以得出结论……
正确:根据以上分析,我们可以得出结论……

它自带“反思”。

Workflow到底可以给Agentic带来什么不一样的地方?

如果只是像上述例子中的Agentic不能满足我们复杂的业务场景,比如说:多工种合作(有点像斯坦福小镇)那种。

我们用举例来说明。

自然语言数据报表处理

说我们零售有一个集采系统,这个系统可以让各门店报上各自的需求,也可以让供应商来这个系统上查看各需求同时来满足各门店的采购需求。

这种在B2b2c场景应用面特别多,而一旦当密如蛛网的B2b2c形成后,IT人员会陷入各种无陷报表的“杂事”中。于是呢,我们决定把这个Portal开放给到门店、供应商自己去做查询。但是问题是:这些用户非IT专业,他们会个Excel已经不得了,怎么可能自己去做出下钻、上钻、剖析、行列转变的SQL呢?

那么此时我们准备用自然语言向他们开放报表报务,使得这些人员通过自然语言描述就可以让AI出具相应的报表。

不过问题又来了,这些人员的语言、逻辑思维能力也是不如受过专业训练的IT人员的,比如说对于洗发水的描述就有好几种切口或者不统一的说法。

有人爱说:飘柔

有人爱说:飘柔洗发水

有人爱说:沙宣

有人爱说:那个舒淇做广告的

有人会说:黑人牙膏

有人会说:黑人

有人会说:black man

千奇百怪的说法、切口、甚至还有错别字。当一个庞大的报表系统要精准的出据报表,又要处理这些语义上的校正,这显然用一个Agentic是不可能的。此时必须使用Agentic Workflwo。

因此我们的处理步骤如下:

  1. 先判断用户当前输入的门店是什么
  2. 再判断用户当前到底是问怎么操作?如:常用操作知识或者不熟悉还是闲聊还是已经表达清了自己想要查看什么数据?亦或者说的出据报表的类别描述的太粗颗粒了?
  3. 再看用户对于报表的查询条件是否已经到达了可以出据报表的程度?
  4. 出据报表

再来举一例。

智能导游

我们可以看到现市面上的导游基本都是不管你是谁上去看到的“套餐”都为预设式。可是很多时候我们的客户的需求千奇百怪。或许网站上提供的130种套餐都不符合我的真正心意,我希望在A套餐里抽出3条+B套餐内的1条+D套餐内的饮食安排?

这种需求你怎么满足?

同时呢,用户可能不仅仅只是要求你出据旅游计划、策划,而是正在问你当地的名胜古迹的一些历史背景呢?

此时我们的解决手法是,2套每套又蕴含多Agentic Workflow。

第一套:先判断用户当前是在咨询非旅游策划类即:普通咨询,如:一些景点的收费情况呀?名胜古迹背后的历史故事呀?风土人情呀?还是专业旅游路线策划类咨询:即计划类、策划类咨询。

第二套:有了第一套判断后此时AI会把用户的后续咨询事宜交给不同的“专家座席”,比如说我们现在知道了用户正在做“专业旅游路线策划”,那么当专业旅游路线策划AI Agentic接手后它会进入正式回答。

可是我们从业务知识知道,当一个旅游策划类AI需要精准得回答出让用户满意的答案时必须要知道几个基础信息,无非就是:

  1. 你游玩的目的地(当然这个目的地还要我们支持,你不能说你要去月亮,如果没有Agentic那AI还真会给你胡诌一通);
  2. 你的游玩意图,即:是美食为主?步行为主?自由行?跟团?信仰之游?还是只看景点?还是去享受人生的?
  3. 你准备好去几天?
  4. 你是否有什么其它特殊要求?

所以这一个Agentic就蕴含了至少3-4道Workflow的Step,如下图所示:

说在最后

Agentic AI 的出现是人工智能领域的一场重大变革,它将从根本上改变我们与 AI 的交互方式,也将为人类社会带来巨大的价值。

我们共同呼吁开发者积极拥抱 Agentic AI,探索其应用边界,共同推动 AI 技术的发展。同时,我们要高度关注 Agentic AI 可能带来的伦理和社会影响,例如算法偏见、隐私泄露等问题,各界需要共同努力,确保 AI 技术安全可控地发展,为人类创造更加美好的未来。


http://www.ppmy.cn/news/1522508.html

相关文章

新换了电脑,电脑里常用的6款软件,下载回来继续用

新换了电脑,准备把之前电脑里常用的几款软件都下载回来继续用,独乐乐不如众乐乐,分享一下~ 1、Listen 1 一款开源、免费的音乐播放器,它能够整合多个主流音乐平台的资源,包括网易云音乐、QQ音乐、酷狗音乐、酷我音乐、…

[SWPUCTF 2021 新生赛]web方向(一到六题) 解题思路,实操解析,解题软件使用,解题方法教程

题目来源 NSSCTF | 在线CTF平台因为热爱,所以长远!NSSCTF平台秉承着开放、自由、共享的精神,欢迎每一个CTFer使用。https://www.nssctf.cn/problem [SWPUCTF 2021 新生赛]gift_F12 这个题目简单打开后是一个网页 我们一般按F12或者是右键查…

WorkPlus安全即时通讯:端到端加密开启信息保密新时代

在数字化时代,信息的保密性和安全性变得越发重要。企业和个人需要确保他们的敏感信息和机密通讯不会落入黑客或第三方的手中。为了满足这一需求,WorkPlus安全即时通讯平台应运而生。作为一款拥有端到端加密功能的通讯平台,WorkPlus着重于保护…

小米Vela:端侧AI推理框架

小米Vela是小米公司基于开源实时操作系统NuttX打造的物联网嵌入式软件平台。该平台旨在为各种物联网硬件提供统一的软件服务,支持丰富的组件和易用的框架,以打通碎片化的物联网应用场景。2024年8月在“开源中国开源世界”大会,小米对外公开超…

python 解析数据后保存到excel

openpyxl 特点: 支持读写Excel 2010 xlsx/xlsm/xltx/xltm文件格式。可以操作Excel的几乎所有功能,如样式、图表、图片等。适用于复杂的Excel操作,例如公式、数据验证和条件格式。社区支持较好,文档比较完善。 优点: 功…

MyBatis入门 – 动态SQL

MyBatis入门 – 动态SQL 1.动态SQL介绍 1.1 什么是动态SQL 在原先的JDBC中,开发者需要根据业务的不同要求手动拼接SQL语句,不仅增加开发的复杂度,同时也降低开发效率。而动态SQL则能够根据不同业务场景动态构建查询。动态SQL一般是根据用户…

Java网络编程入门

在现代软件开发中,网络编程是一项不可或缺的技能。Java提供了强大的网络编程支持,使得开发者能够轻松地创建网络应用程序。今天将介绍Java中的网络编程基础,重点讲解Socket和ServerSocket类的使用。 什么是Socket? Socket是网络通…

android系统源码12 修改默认桌面壁纸--SRO方式

1、aosp12修改默认桌面壁纸 代码路径 :frameworks\base\core\res\res\drawable-nodpi 替换成自己的图片即可,不过需要覆盖所有目录下的图片。 由于是静态修改,则需要make一下,重新编译。 2、方法二Overlay方式 由于上述方法有…

[动态规划] 删除并获得点数

给你一个整数数组 nums ,你可以对它进行一些操作。 每次操作中,选择任意一个 nums[i] ,删除它并获得 nums[i] 的点数。之后,你必须删除 所有 等于 nums[i] - 1 和 nums[i] 1 的元素。 开始你拥有 0 个点数。返回你能通过这些操…

vue3缺陷

Vue 3 的一些缺陷包括: 1. 兼容性问题:由于 Vue 3 使用了新的响应式系统,与 Vue 2 的代码不兼容。这意味着在迁移现有项目时需要进行一些改动。 2. 学习曲线:Vue 3 引入了一些新的概念和 API,相对于 Vue 2 有一定的学习…

如何利用AI优化知识中台的用户体验

引言 在数字化时代,知识中台作为企业知识管理与服务的重要载体,其用户体验的优劣直接关乎到信息的有效传递、员工的学习效率及企业的整体创新能力。随着人工智能(AI)技术的飞速发展,将AI融入知识中台的设计与优化中&a…

Linux系统高效进程控制的实战技巧

Linux系统高效进程控制的实战技巧 Linux是一种开源的Unix-like操作系统内核,由林纳斯托瓦兹(Linus Torvalds)于1991年首次发布。Linux以其稳定性、安全性和灵活性而著称,广泛应用于服务器、桌面、嵌入式系统等多个领域。在Linux系…

使用Docker快速安装和运行Elasticsearch

Elasticsearch 是一个基于 Lucene 构建的开源搜索引擎,它提供了分布式、多租户能力的全文搜索引擎,具有 HTTP web 接口和无模式的 JSON 文档。在本文中,我们将介绍如何使用 Docker 快速安装和运行 Elasticsearch。 为什么使用 Docker 安装 E…

redis中使用lua脚本

1、现实问题 1.redis采用单线程架构,可以保证单个命令的原子性,但是无法保证一组命令在高并发场景下的原子性。例如: 在串行场景下:A和B的值肯定都是3在并发场景下:A和B的值可能在0-6之间。 2.极限情况下1&#xff1…

Qt Widget核心属性

文章目录 前言enabledgeometrywindowTitlewindowIconwindowOpacitycursorfonttoolTipfocusPolicystyleSheet 前言 Qt中的各种控件,都是继承自QWidget类,了解这个类的属性方法之后,后续的控件也通用 enabled enabled描述了一个控件是否处于…

文件包含PHP伪协议利用方法

1.file://协议 使⽤: file:// ⽂件的绝对路径和⽂件名 2.php?cmdfile://D:\phpstudy_pro\WWW\123.txt 2.php://filter协议 ⽤途:常⽤于读取⽂件 / 源码 2.php?cmdphp://filter/readconvert.base64-encode/resource1.php 3.php://input协议 步骤一&…

【C++拓展(一)】后端开发常用的技术栈

💓博主CSDN主页:杭电码农-NEO💓   ⏩专栏分类:C从入门到精通⏪   🚚代码仓库:NEO的学习日记🚚   🌹关注我🫵带你学习C   🔝🔝 C拓展 1. 前言2. 语言层面3. 设计模式层面4. 开…

「Qt Widget中文示例指南」如何实现一个系统托盘图标?(一)

Qt 是目前最先进、最完整的跨平台C开发工具。它不仅完全实现了一次编写,所有平台无差别运行,更提供了几乎所有开发过程中需要用到的工具。如今,Qt已被运用于超过70个行业、数千家企业,支持数百万设备及应用。 System Tray Icon&a…

基础学习之——Apache Spark

Apache Spark是一种开源的大数据处理框架,它提供了快速、通用和可扩展的大数据分析和处理功能。Spark可以在大规模数据集上进行高速计算,并且可以与多种数据源和工具进行集成。 Spark的基本概念包括: 弹性分布式数据集(Resilient…

【LeetCode 121】买卖股票的最佳时机

1. 题目 2. 分析 如果当前的价格比之前买入的价格要低,那么我们就“逢低买入”,更新买入的价格,因为在此后的每一天里,当前的价格与之前的买入价格相比是更优解。 如果读者对单调队列有接触,可以看到这一步的核心思想…