让AI像人一样思考和使用工具,reAct机制详解

embedded/2024/10/15 22:18:25/

reAct机制详解

  • reAct是什么
  • reAct的关键要素
  • reAct的思维过程
  • reAct的代码实现
    • 查看效果
    • 引入依赖,定义模型
    • 定义相关工具
    • 集合工具创建代理
    • 启动测试
    • 完整代码
  • 思考

reAct是什么

reAct的核心思想是将**推理(Reasoning)和行动(Acting)**结合起来。具体来说,reAct 赋予了 AI agent 思维链Cot的思考能力和使用工具Action的能力。对于一个复杂问题agent首先利用其强大的推理能力对环境进行分析和理解,识别出需要解决的问题和可用的资源。然后,它根据推理结果制定行动计划,并选择合适的工具或方法来执行计划。最后达到像人一样分析和使用工具最后解决问题的效果。

reAct的关键要素

  • 强大的推理能力
  • 丰富的工具库
  • 灵活的行动策略
  • 持续的反馈机制

reAct的思维过程

举个例子比如问模型一个问题羊村旁边的地方是什么?它的面积加上它的面积是多少?,正常模型肯定回答不了,可是添加上reAct他就被赋予了思考和使用工具获取信息的能力,分析过程大概如下:

分析1:我需要先搜索羊村旁边的地方,然后获取该地方的面积,最后计算面积的总和,首先我得先知道羊村旁边是什么地方行动1:调用地点搜索工具分析2:获取到的地点是狼堡,我需要搜索狼堡的面积,然后计算面积的总和行动2:调用地点面积搜索工具分析3:获取到面积是500,我已经获取了狼堡的面积,现在需要计算面积的总和。行动3:调用数字相加计算工具(如果数字比较复杂可能需要专业的数学工具计算)分析4:计算出结果是1000行动4:进行最终答复:羊村旁边的地方是狼堡,狼堡的面积是500,加上它的面积是1000。

就这样模型通过reAct完成了一整个复杂问题的拆解和逐步解决。我们可以通过代码来实现并查看一整个过程

reAct的代码实现

我们用langChain搭配deepseek模型去实现reAct的一整个过程,我们先来看看最终结果。

查看效果

在这里插入图片描述
可以看到利用reAct机制LLM确实跟我们预想的一样完成了推理和使用工具。下面我们来看实现。

引入依赖,定义模型

注意key换成deepseek的key

python">from langchain import hub
from langchain.agents import create_structured_chat_agent, AgentExecutor
from langchain.memory import ConversationBufferMemory
from langchain.tools import BaseTool
from langchain_openai import ChatOpenAImodel = ChatOpenAI(model='deepseek-chat', openai_api_key='xxx',openai_api_base='https://api.deepseek.com',max_tokens=4096
)

定义相关工具

python"># 定义数字计算工具
class SumNumber_tool(BaseTool):name = "数字相加计算工具"description = "当你被要求计算数字相加时,使用此工具"def _run(self, a, b):return a + b  # 直接返回两个数的和# 模拟地点搜索工具(实际使用可以调用内置的google-serper)
class PlaceSearch_tool(BaseTool):name= "地点搜索工具"description = "当你需要搜索地点时,使用这个工具"def _run(self, query):return "狼堡"# 创建地点面积搜索工具
class AreaSearch_tool(BaseTool):name= "地点面积搜索工具"description = "当你需要搜索地点面积时,使用这个工具"def _run(self, query):return 500

集合工具创建代理

python"># 工具集合
tools = [SumNumber_tool(), PlaceSearch_tool(), AreaSearch_tool()]
# 提示词,langchain hub内置提示词,之后文章会再做详细分析
prompt = hub.pull("hwchase17/structured-chat-agent")
# 定义AI Agent
agent = create_structured_chat_agent(llm=model,tools=tools,prompt=prompt
)
# 记录上下文
memory = ConversationBufferMemory(memory_key='chat_history',return_messages=True
)
# 创建一个代理执行器
agent_executor = AgentExecutor.from_agent_and_tools(agent=agent, tools=tools, memory=memory, verbose=True, handle_parsing_errors=True
)

启动测试

python"># 测试场景
agent_executor.invoke({"input": "羊村旁边的地方是什么?它的面积加上它的面积是多少?"}) 

完整代码

python">from langchain import hub
from langchain.agents import create_structured_chat_agent, AgentExecutor
from langchain.memory import ConversationBufferMemory
from langchain.tools import BaseTool
from langchain_openai import ChatOpenAI# 模型
model = ChatOpenAI(model='deepseek-chat', openai_api_key='xxx',openai_api_base='https://api.deepseek.com',max_tokens=4096
)# 定义数字计算工具
class SumNumber_tool(BaseTool):name = "数字相加计算工具"description = "当你被要求计算数字相加时,使用此工具"def _run(self, a, b):return a + b  # 直接返回两个数的和# 模拟地点搜索工具(实际使用可以调用内置的google-serper)
class PlaceSearch_tool(BaseTool):name= "地点搜索工具"description = "当你需要搜索地点时,使用这个工具"def _run(self, query):return "狼堡"# 创建地点面积搜索工具
class AreaSearch_tool(BaseTool):name= "地点面积搜索工具"description = "当你需要搜索地点面积时,使用这个工具"def _run(self, query):return 500# 工具集合
tools = [SumNumber_tool(), PlaceSearch_tool(), AreaSearch_tool()]
# 提示词,langchain hub内置提示词,之后文章会再做详细分析
prompt = hub.pull("hwchase17/structured-chat-agent")
# 定义AI Agent
agent = create_structured_chat_agent(llm=model,tools=tools,prompt=prompt
)
# 记录上下文
memory = ConversationBufferMemory(memory_key='chat_history',return_messages=True
)
# 创建一个代理执行器
agent_executor = AgentExecutor.from_agent_and_tools(agent=agent, tools=tools, memory=memory, verbose=True, handle_parsing_errors=True
)# 测试场景
agent_executor.invoke({"input": "羊村旁边的地方是什么?它的面积加上它的面积是多少?"})

思考

reAct是AI agent很重要的一个概念,它赋予了agent能够逐步推理和执行任务的能力。通过将复杂的任务分解为一系列简单的步骤,并通过使用工具去解决问题,让agent能够更高效地解决问题,最终让agent像人一样能够处理复杂问题。


http://www.ppmy.cn/embedded/128105.html

相关文章

Java面试宝典-WEB学习

Java web学习 目录 Java web学习 1、说说 Servlet 的基本架构 2、说一说 Servlet 的生命周期? 3、如何实现一个自定义的 servlet? 4、servlet中有哪些核心类?都有什么特点? 5、什么情况下调用 doGet()和 doPost()? 6、request.ge…

猜数字小游戏

前言 猜数字游戏是一款经典且简单的互动游戏,常常用于提高逻辑思维能力和锻炼数学技巧。本文将深入探讨一段用 JavaScript 编写的猜数字游戏代码,帮助读者理解游戏的基本逻辑和实现方法。这段代码不仅适合初学者练习编程技巧,也是了解用户交…

暴雨液冷服务器实现轻量化部署

在数据中心领域,随着计算密度的不断增加和能效要求的日益严格,传统的风冷散热方式已经逐渐无法满足需求。液冷技术以其高效散热、节能降耗和高密度部署的优势,成为了数据中心散热新选择。 据IDC最新发布的《中国半年度液冷服务器市场&#x…

springboot+vue家政服务管理平台

作者:计算机学长阿伟 开发技术:SpringBoot、SSM、Vue、MySQL、ElementUI等,“文末源码”。 系统展示 【2024最新】基于JavaSpringBootVueMySQL的,前后端分离。 开发语言:Java数据库:MySQL技术:…

Ethernet IP 转 Profinet网关在流量计中的应用

Ethernet/IP 和 Profinet 都是在工业自动化领域占据重要地位的工业以太网标准。 Ethernet/IP 是由美国罗克韦尔自动化公司开发的一种基于以太网的工业自动化通信协议。它采用 TCP/IP 协议栈,支持以太网和 TCP/IP 网络,具有高速、开放、互操作性强等特点…

python机器学习(网络搜索和交叉验证)

""" 网格搜索: 指的是 GridSearchCV这个工具的功能, 可以帮助我们寻找最优的 超参数. 超参数解释: 在机器学习中, 我们把需要用户手动传入的参数称之为: 超参数. 交叉验证: 指的是对数据集进行划分, 即: 把数据分成N份进行验证 第1次:…

蓝禾,汤臣倍健,三七互娱,得物,顺丰,快手,游卡,康冠科技,途游游戏,埃科光电25秋招内推

蓝禾,汤臣倍健,三七互娱,得物,顺丰,快手,游卡,康冠科技,途游游戏,埃科光电25秋招内推 ①蓝禾 【岗位】国内/国际电商运营,设计,研发,营…

I\O进程线程(Day27)

一、学习内容 IO基础 概念 程序与外部设备进行交换的信息过程 分类 标准IO 封装好的相关库函数、有缓冲区、文件指针eg:fprintf、fscanf、fputc、fgetc、fputs、fgets、fopen、fclose... 操作流程 FILE *fp通过fopen打开文件 使用fprintf、fputc、fputs、fwrite把在…