1. 背景介绍
基于大模型的智能体指的是结合大模型与关键模块(如规划与记忆)来执行复杂任务的应用架构。在构建大模型智能体时,大模型充当主要控制器或“大脑”,管理完成任务或响应用户请求所需的操作流程。大模型智能体通常包含核心模块,如规划、记忆和工具使用。
为什么光靠大模型还不够,还需要引入智能体? 关于这个问题,有兴趣可以看下我们之前的文章《Agentic RAG(智能体RAG) 》。即使使用RAG系统提供相关信息,也可能不足以处理这个复杂查询。因为该问题需要大模型将任务拆解为多个子任务,并依靠工具和操作流程来最终得出完整答案。一个可能的解决方案是构建一个大模型智能体,使其能够访问搜索API、相关文献以及公共/私有数据库,以提供相关的信息。此外,大模型还需要访问“代码解释器”工具,以处理相关数据。
开源的智能体框架很多,但是从商用角度来说,会更倾向于稳定、可靠的系统实现,而不只是停留在demo阶段。之所以介绍Upsonic,是因为其在稳定性层面有相对可靠的保证。
Upsonic 是一个专注于可靠性的框架。表格中的结果基于小规模数据集生成,展示了 JSON 键转换的成功率。测试过程中未对框架进行硬编码修改,仅启用了各框架的现有功能并执行测试。测试采用 GPT-4o 进行。每个部分进行了 10 次转换,表格中的数字表示错误次数。例如,如果显示 7,则意味着 10 次转换中有 7 次出错。
2. Upsonic-AI智能体框架
Upsonic 是一个面向数字工作者和垂直 AI 智能体的任务导向型 AI 智能体框架。能够编排大模型调用、智能体和计算机操作完成任务。
组件 | 描述 | 关键特性 |
---|---|---|
任务(Tasks) | 希望完成的工作 | - 有明确的目标 |
- 使用特定工具 | ||
- 融入更大的流程 | ||
- 产生可操作的结果 | ||
智能体(Agents) | 使用工具完成任务的大模型 | - 对工具的操作 |
- 自我反思 | ||
- 记忆 | ||
- 上下文压缩 | ||
安全运行环境(Secure Runtime) | 运行代理的隔离环境 | - 本地部署 |
- 云端 | ||
- 定制化 | ||
模型上下文协议(Model Context Protocol) | 大模型工具标准 | - 广泛的工具支持 |
关于Model Context Protocol(MCP),可以参考我们在2月12日发的《MCP(Model Context Protocol) 大模型智能体第一个开源标准协议》,时下非常火的概念。智能体这一波火热,manus功不可没,虽然最后被证明是一个拼接怪。但我觉得可能是大家对于agent的期望过高,其中能够很好的整合大模型生态工具和资源,非常丝滑流畅完成指令任务,就是一个非常了不起的创造。
该框架的能力特点,主要有:
1. 任务
完成需要实现的任务,并以多种方式运行它们以获取结果,专注于任务本身,而非流程。
2. 自动角色配置:
Upsonic框架自动生成角色并分配相应任务。
3. MCP支持
直接集成由社区和企业开发的全面工具池。通过官方工具实现稳定性保障。
4. 可扩展性
最关键的核心组件部署在服务端,可通过Docker部署服务器,并以无状态方式在客户端与应用程序进行轻量级集成。
5. 直接调用大模型
如果任务简单且无需子任务,无需使用智能体流程。可直接调用大模型并即时获取结果。
6. 对象化响应
与大模型协作时,为获得更精确的结果,响应具备可编程性。
3. 可靠性层
Upsonic相对其他的智能体框架,比较有特色的,可能就是Reliability Layer。可靠性是AI智能体最关键的概念。使用AI智能体来持续执行自身工作中一些小型、重复性的任务。在这种应用场景下,如果AI智能体无法正确完成任务并提供高质量的结果,就无法将其融入自己的工作流程。
Upsonic 在这一点上提供了一个增强智能体可靠性的分层系统。该系统按照特定级别进行强化和细化,使用户能够根据自身使用场景创建可靠的AI智能体。
大模型输出的可靠性至关重要,特别是在数值运算和执行操作方面。Upsonic 是通过采用多层次的可靠性体系来解决,采用控制智能体和验证轮次以确保输出的准确性。
- Verifier Agent: 负责验证输出、任务和格式,检测不一致性、数值错误和幻觉现象。
- Editor Agent: 根据验证智能体的反馈修订和优化输出,直至达到质量标准。
- Rounds: 通过评分验证循环实施迭代式质量改进。
- Loops: 在关键的可靠性检查点,通过受控反馈循环确保准确性。
后续我们将会逐步带来AI智能体的实战分享,敬请期待!
4.参考材料
【1】Introduction - Upsonic
【2】https://github.com/Upsonic/Upsonic
【3】LLM Agents | Prompt Engineering Guide