【大模型智能体】UpsonicAI-面向任务可靠执行的智能体框架

embedded/2025/3/15 7:38:07/

1. 背景介绍

        基于大模型智能体指的是结合大模型与关键模块(如规划与记忆)来执行复杂任务的应用架构。在构建大模型智能体时,大模型充当主要控制器或“大脑”,管理完成任务或响应用户请求所需的操作流程。大模型智能体通常包含核心模块,如规划、记忆和工具使用。

        为什么光靠大模型还不够,还需要引入智能体? 关于这个问题,有兴趣可以看下我们之前的文章《Agentic RAG(智能体RAG) 》。即使使用RAG系统提供相关信息,也可能不足以处理这个复杂查询。因为该问题需要大模型将任务拆解为多个子任务,并依靠工具和操作流程来最终得出完整答案。一个可能的解决方案是构建一个大模型智能体,使其能够访问搜索API、相关文献以及公共/私有数据库,以提供相关的信息。此外,大模型还需要访问“代码解释器”工具,以处理相关数据。

        开源的智能体框架很多,但是从商用角度来说,会更倾向于稳定、可靠的系统实现,而不只是停留在demo阶段。之所以介绍Upsonic,是因为其在稳定性层面有相对可靠的保证。

            Upsonic 是一个专注于可靠性的框架。表格中的结果基于小规模数据集生成,展示了 JSON 键转换的成功率。测试过程中未对框架进行硬编码修改,仅启用了各框架的现有功能并执行测试。测试采用 GPT-4o 进行。每个部分进行了 10 次转换,表格中的数字表示错误次数。例如,如果显示 7,则意味着 10 次转换中有 7 次出错。

    2. Upsonic-AI智能体框架

            Upsonic 是一个面向数字工作者和垂直 AI 智能体的任务导向型 AI 智能体框架。能够编排大模型调用、智能体和计算机操作完成任务。

    组件描述关键特性
    任务(Tasks)希望完成的工作- 有明确的目标
    - 使用特定工具
    - 融入更大的流程
    - 产生可操作的结果
    智能体(Agents)使用工具完成任务的大模型- 对工具的操作
    - 自我反思
    - 记忆
    - 上下文压缩
    安全运行环境(Secure Runtime)运行代理的隔离环境- 本地部署
    - 云端
    - 定制化
    模型上下文协议(Model Context Protocol)大模型工具标准- 广泛的工具支持

            关于Model Context Protocol(MCP),可以参考我们在2月12日发的《MCP(Model Context Protocol) 大模型智能体第一个开源标准协议》,时下非常火的概念。智能体这一波火热,manus功不可没,虽然最后被证明是一个拼接怪。但我觉得可能是大家对于agent的期望过高,其中能够很好的整合大模型生态工具和资源,非常丝滑流畅完成指令任务,就是一个非常了不起的创造。

            该框架的能力特点,主要有:

    1. 任务

        完成需要实现的任务,并以多种方式运行它们以获取结果,专注于任务本身,而非流程。

    2. 自动角色配置:

        Upsonic框架自动生成角色并分配相应任务。

    3. MCP支持

        直接集成由社区和企业开发的全面工具池。通过官方工具实现稳定性保障。

    4. 可扩展性

        最关键的核心组件部署在服务端,可通过Docker部署服务器,并以无状态方式在客户端与应用程序进行轻量级集成。

    5. 直接调用大模型

        如果任务简单且无需子任务,无需使用智能体流程。可直接调用大模型并即时获取结果。

    6. 对象化响应

        与大模型协作时,为获得更精确的结果,响应具备可编程性。

    3. 可靠性

            Upsonic相对其他的智能体框架,比较有特色的,可能就是Reliability Layer。可靠性是AI智能体最关键的概念。使用AI智能体来持续执行自身工作中一些小型、重复性的任务。在这种应用场景下,如果AI智能体无法正确完成任务并提供高质量的结果,就无法将其融入自己的工作流程。

            Upsonic 在这一点上提供了一个增强智能体可靠性的分层系统。该系统按照特定级别进行强化和细化,使用户能够根据自身使用场景创建可靠的AI智能体

            大模型输出的可靠性至关重要,特别是在数值运算和执行操作方面。Upsonic 是通过采用多层次的可靠性体系来解决,采用控制智能体和验证轮次以确保输出的准确性。

    • Verifier Agent: 负责验证输出、任务和格式,检测不一致性、数值错误和幻觉现象。
    • Editor Agent: 根据验证智能体的反馈修订和优化输出,直至达到质量标准。
    • Rounds: 通过评分验证循环实施迭代式质量改进。
    • Loops: 在关键的可靠性检查点,通过受控反馈循环确保准确性。

    后续我们将会逐步带来AI智能体的实战分享,敬请期待!

    4.参考材料

    【1】Introduction - Upsonic

    【2】https://github.com/Upsonic/Upsonic

    【3】LLM Agents | Prompt Engineering Guide


    http://www.ppmy.cn/embedded/172706.html

    相关文章

    【实战ES】实战 Elasticsearch:快速上手与深度实践-附录-2-性能调优工具箱

    👉 点击关注不迷路 👉 点击关注不迷路 👉 点击关注不迷路 附录-性能调优工具箱 2-Elasticsearch 性能调优工具箱深度指南一、性能诊断工具集1.1 实时监控工具1.2 慢查询分析 二、硬件与基础架构优化2.1 存储方案选型2.2 JVM调优参数 三、索引…

    使用curl随机间隔访问URL-使用curl每秒访问一次URL-nginx

    ### 脚本 1: 使用 nohup 和随机间隔访问 URL bash nohup bash -c "while true; do curl -I http://10.254.1.1:80 >/dev/null 2>&1; sleep \$((RANDOM%30060)); done" & #### 解释 - **nohup**:表示 "no hang up"&#xff0c…

    vulnhub靶场之healthcare靶机

    前言 靶机:healthcare靶机,IP地址为192.168.10.11 攻击:kali,IP地址为192.168.10.6 靶机和攻击机都采用VMware虚拟机,都采用桥接网卡模式 文章涉及的靶机及工具,都可以自行访问官网或者项目地址进行获取…

    一个差劲的软件设计

    项目概况: 之前自己设计并开发了一个用C#开发的上位机软件,整个软件只有一个Form,一个TabControl,3个TabControlPanel,总共100多个lable、textbox、ListBox等控件都放在这3个TabControlPanel里。 问题: 1.…

    复试难度,西电卓越工程师学院(杭研院)考研录取情况

    01、卓越工程师学院各个方向 02、24卓越工程师学院(杭研院)近三年复试分数线对比 PS:卓越工程师学院分为广研院、杭研院 分别有新一代电子信息技术、通信工程、集成电路工程、计算机技术、光学信息工程、网络信息安全、机械,这些…

    wlwrap 与 rlwrap 的区别对比:图形显示协议的演变

    在 Linux 系统中,许多工具和程序依赖于命令行界面(CLI)来进行交互,尤其是对于那些没有图形用户界面的应用程序。在这种情况下,命令行编辑、历史记录和自动补全等功能是提升工作效率和用户体验的关键。rlwrap 和 wlwrap…

    RocketMQ 性能优化与调优策略(一)

    RocketMQ:分布式消息中间件的璀璨之星 在当今数字化时代,分布式系统已成为构建大型应用的核心架构。随着业务规模的不断扩大和用户量的持续增长,系统间的通信和数据交互变得愈发复杂。为了解决这些挑战,消息中间件应运而生&#x…

    网络安全信息收集[web子目录]:dirsearch子目录爆破全攻略以及爆破字典结合

    目录 一、dirsearch 工具详细使用攻略 1. 安装 前提条件 安装步骤 可选:直接下载预编译版本 2. 基本用法 命令格式 参数说明 示例 3. 核心功能与高级用法 3.1 多线程加速 3.2 自定义字典 3.3 递归扫描 3.4 过滤响应 3.5 添加请求头 3.6 代理支持 3…