根据Markets & Markets的预测,到2030年,AI Agent的市场规模将从2024年的50亿美元激增至470亿美元,年均复合增长率为44.8%。
Gartner预计到2028年,至少15%的日常工作决策将由AI Agent自主完成,AI Agent在企业应用中的重要性正在飞速上升。
可以预见,今后几年AI Agent的应用开发还将继续爆发!
建议先收藏此清单,以方便需要时能快速定位所需要的信息!
我们一共总结了26个热门Agent开源框架,由于篇幅过长,预计会分为5期发布。这里是第二期。
在整理这些开源框架时,也一起整理了相关的Agent框架设计论文,阅读这些论文可更深入全面的了解相关理论和对应Agent的设计思路。
前期回顾:
26个开源Agent开发框架调研总结(1)
本期主要介绍MetaGPT,Open Assistant,Haystack,AgentGPT,以及AutoGen这5个Agent开源开发框架。
06 MetaGPT
开源地址:
https://github.com/geekan/MetaGPT (46.6k stars)
MetaGPT是一个面向自然语言编程的开源多代理(Multi-Agents)开发框架,该框架可以模拟软件开发涉及的相应角色,并给不同角色分配相应AI Agent,如产品经理、架构师、项目经理、工程师和质量保障工程师。实现智能化、自动化的全流程软件开发。
Agents之间通过一个共享的消息池实现协作通信。每个Agent都从此消息池订阅和消费与自身角色相关的消息,并把自己的处理结果或需要的后续任务再以结构化消息的形式发生到消息池,供其他Agent订阅消费。
以编写一个完整的2048数字游戏为例,只需输入项目需求目标,然后:
-
产品经理Agent会自动理解并拆解需求,还能做竞品分析,最后输出完整的产品需求逻辑;
-
项目经理Agent拆解并列出所有项目任务,以保障项目能满足需求设计;
-
架构师Agent就会自动解析需求,生成对应的架构设计;
-
工程师Agent按照架构设计编写相应代码;
-
最后QA 工程师Agent根据需求进行测试。
总体上来说,MetaGPT借助LLM,基本上实现了AI全自动化开发软件的设想,特别是对于一些不太复杂的需求,已经能节省相当一部分人力。
功能亮点:
-
多代理协作机制,适合复杂任务的处理和团队协作。
-
强化学习驱动的优化策略,提高任务执行效率。
-
集成外部工具,支持广泛的应用场景。
-
高度可扩展,能够根据需求定制多种任务和工具。
面向场景:
-
自动化软件开发、项目管理与执行。
-
复杂任务的分解与协作场景。
-
自适应学习与任务优化场景。
07 Open Assistant
开源地址:
https://github.com/LAION-AI/Open-Assistant ( 37.2k stars)
Open Assistant 是由一家德国非营利组织 LAION 运营。项目开始于 2022 年 12 月, 目标是创建一个和 ChatGPT 具有相同能力的开源人工智能助手。
看看他们的愿景(摘自官网):
“我们不会止步于复制 ChatGPT。我们希望建立未来的助手,不仅能够写电子邮件和求职信,而且能够做有意义的工作,使用 API、动态研究信息等,并能够由任何人进行个性化定制和扩展。我们希望以一种开放和可访问的方式做到这一点,这意味着我们不仅要建立一个伟大的 AI 助手,而且要使它足够小和高效,能够在消费者硬件上运行。”
功能亮点:
- 自我学习能力: 具备机器学习和深度学习能力,能够根据用户反馈不断优化自身性能,以提高智能水平和响应准确性;
- 自动扩充知识:通过搜索引擎自动提取外部相关知识;
- 多语言支持: Open Assistant 支持多达 35 种语言;
- 集成交互能力:与第三方系统对接交互,自动提取相关信息;
面向场景:
-
个性化的虚拟助手;
-
客服系统‘
-
自动化工作流与任务执行。
-
语音助手与多模态对话系统。
08 Haystack
开源地址:
https://github.com/deepset-ai/haystack ( 18.5k stars)
Haystack 是由 deepset.ai 开发的一款开源Agent开发框架,能够帮助快速构建基于RAG的知识问答系统、语义搜索或聊天类Agent, 支持与多种中间件集成,如 Elasticsearch、FAISS 等,形成灵活的管道或代理,以与数据互动,用于实现诸如检索增强生成(RAG)、问答、语义搜索或对话式聊天机器人等功能。
Haystack提供开箱即用的文档分片和预处理功能(例如基于段落分段);支持关键词检索、语义检索(向量化)、Hybrid 检索(结合关键词和向量),并提供两种问答模式:Extractive QA(从文档中提取答案)和 Generative QA(基于 LLM 生成答案);而且对于大型企业文档,优化了检索性能,能够快速处理百万级文档集合。
功能亮点:
-
模块化设计:Haystack 提供了多种组件(如文本搜索、文档检索、答案生成、模型微调等),可以根据需求自由组合。
-
支持多种后端:支持 Elasticsearch、FAISS 等流行的索引和检索后端。
-
多种问答模式:支持从简单的查询响应到更复杂的上下文感知型问答。
-
集成多种模型:包括支持最新的 transformer 模型(如 BERT、T5、GPT 系列等)
-
支持多种文档类型:原生支持PDF、Word、Excel、HTML等类型;
面向场景:
-
企业级大规模文档搜索和信息提取;
-
大规模知识库的问答系统(FAQ 系统、法律/医疗文档智能搜索);
-
客户支持系统(如自动回复、智能客服)
在构建企业知识库这个场景,之前有详细对比过Haystack与Langchain的区别:全面对比Haystack 和 LangChain 构建企业知识库智能问答Agent
09 AgentGPT
开源地址:
https://github.com/reworkd/AgentGPT (32.4k stars)
AgentGPT是一个Agent创建平台, 基于FastAPI Python框架开发,可以直接在网页浏览器中创建和部署自主AI Agent。它利用大语言模型,包括GPT-3.5和GPT-4,使这些Agent能够在最小的人为干预下执行各种任务。
用户可以为其Agent命名并分配特定目标,从而实现针对不同需求的个性化解决方案。
利用向量数据库,AgentGPT增强了长期记忆能力,使代理能够保留执行历史并访问长期信息,这对于复杂任务至关重要。
不过,它在企业级功能方面仍有不足之处,如缺乏托管环境和团队协作支持等。
之前看到网上有人将Auto-GPT 和Agent GPT混为一谈,但其实他们两个是面向不同用户群体的,区别还挺大的两个工具。这里顺便做下对比:
功能亮点:
-
自动化生成多步骤任务和子任务,完成复杂工作流。
-
支持跨代理协作,适合大规模系统与任务执行。
-
可以与外部工具和 API 进行深度集成,增强系统能力。
-
自适应反馈机制,可以根据执行结果调整策略。
适应场景:
-
任务调度与自动化执行。
-
企业级项目管理与工作流自动化。
-
多代理协作系统。
10 AutoGen
开源地址:
https://github.com/microsoft/autogen (37k stars)
AutoGen 是一个多代理协作(multi-agent)和任务自动化框架,提供了强大的任务管理、调度和优化功能。它通过多个智能代理的协同工作,支持跨平台、多环境的任务执行。该框架适合应用于智能客服、企业自动化、跨平台任务调度等场景。
AutoGen生态系统提供创建AI Agent的全栈工具,特别是多代理工作流程,包括框架、开发者工具和应用程序。
AutoGen框架采用了分层且可扩展的设计,每一层都拥有明确的职责,并以下层为基础逐步构建。层级包括:
-
Core API: 实现了消息传递、事件驱动代理以及本地和分布式运行时,具备灵活性和强大的功能。它还支持.NET和Python的跨语言兼容。
-
AgentChat API: 提供了一种简单但高度定制的API,用于快速原型开发。该API构建于核心API之上,与v0.2版本用户熟悉的多代理模式最为接近,支持诸如双代理对话或群聊等常见模式。
-
Extensions API: 支持第三方扩展,不断增强框架功能。它支持LLM客户端的特定实现(例如OpenAI、AzureOpenAI)以及代码执行等功能。
AutoGen Studio提供了界面化的构建multi-agent应用的能力。不需要编写一行代码,只需在页面上拖拽设置就可构建出功能强大的应用。
功能亮点:
-
多代理协作:支持多个智能代理同时工作,共同推动任务的执行,适用于需要团队合作的任务。
-
自动化任务生成与调度:根据用户需求或预定义目标,自动生成并调度任务
-
智能任务决策:利用自学习和智能决策系统,不断优化任务执行过程和策略。
-
自适应反馈机制:根据任务执行过程中的反馈,系统能够自动调整决策和执行策略,提高任务完成的成功率。
面向场景:
-
企业自动化工作流
-
智能客服与支持
-
跨平台任务调度与管理
-
多任务协同与项目管理
关注AI应用探索,探索更多AI应用!
更多阅读:
26个开源Agent开发框架调研总结(1)
全面对比Haystack 和 LangChain 构建企业知识库智能问答Agent
全面对比AI Agent 与 Agentic AI
全面分析Agentic AI 在医疗健康行业应用场景