文章目录
- Function Calling介绍
- **核心原理**
- 1. **动态扩展模型能力**
- 2. **JSON结构化交互**
- **实现步骤**(以支持Function Calling的模型为例)
- 1. **定义可用函数**
- 2. **模型匹配与生成**
- 3. **开发者执行函数**
- 4. **结果反馈给模型**
- **DeepSeek R1的当前限制**
- **替代方案建议**
- 1. **自定义流程控制**
- 2. **关注更新动态**
- 💡 **扩展阅读**
- Function Calling调用流程
- **Function Calling 核心流程**
- 1. **用户输入请求**
- 2. **模型解析意图**
- 3. **生成函数调用请求**
- 4. **执行外部函数**
- 5. **返回函数结果**
- 6. **生成最终响应**
- **流程图**
- **关键点说明**
- 1. **两次模型交互(如OpenAI)**
- 2. **结构化参数验证**
- 3. **错误处理**
- **参考案例(天气查询)**
- 1. **用户输入**
- 2. **模型返回函数调用**
- 3. **执行天气API查询**
- 4. **模型生成最终响应**
- **扩展阅读**
- Function Calling Python代码示例(以调用OpenAI模型为例)
- 代码
- 代码解析:
- 1. **函数定义**
- 2. **API交互流程**
- 3. **关键参数说明**
- 执行示例输出:
- 注意事项:
- 1. 需替换为有效的OpenAI API密钥(`sk-your-api-key-here`)
- 2. GPT-3.5-turbo版本需 >= 0613 才能支持函数调用
- 3. 实际生产环境需要:
Function Calling介绍
根据官方文档和搜索结果,DeepSeek的 Function Calling(函数调用) 功能允许模型通过调用外部工具来增强其能力。以下是其核心原理与实现步骤:
核心原理
1. 动态扩展模型能力
通过预定义函数,模型可将用户查询映射到具体操作(如调用API、执行计算等),从而突破纯文本生成的限制。
2. JSON结构化交互
模型不直接执行函数,而是生成包含函数名和参数的JSON对象,开发者据此执行外部逻辑。
实现步骤(以支持Function Calling的模型为例)
1. 定义可用函数
开发者在API请求中声明函数列表,包括:
- 函数名(如
get_weather
) - 参数描述(如
{"location": "string", "unit": "celsius|fahrenheit"}
)
2. 模型匹配与生成
用户输入查询后,模型判断是否需要调用函数。若需要,则生成JSON对象,例如:
{"tool_calls": [{"function": {"name": "get_weather", "arguments": "{\"location\": \"北京\"}"}}]
}
3. 开发者执行函数
解析JSON并调用对应函数,获取结果(如调用天气API返回数据)。
4. 结果反馈给模型
将执行结果返回给模型,模型整合信息生成最终回复(如“北京今天晴天,25℃”)。
DeepSeek R1的当前限制
🔴 注意:根据官方文档(DeepSeek API Docs),DeepSeek R1目前不支持Function Calling,且旧版模型(如 deepseek-chat
)的此功能存在以下问题:
- 可能出现循环调用(模型重复生成函数请求)
- 返回空响应或无意义JSON
- 开发团队正在修复,预计下一版本改进。
替代方案建议
1. 自定义流程控制
通过Prompt Engineering引导模型输出结构化文本,开发者手动解析后调用外部工具。
示例Prompt:
若需查询天气,请以JSON格式回复:{"action": "weather", "location": "城市名"}
2. 关注更新动态
建议定期查阅DeepSeek GitHub仓库或官方文档,获取Function Calling支持进展。
💡 扩展阅读
- OpenAI式Function Calling详解: OpenAI函数调用机制
- DeepSeek工具调用优化方向: Reddit讨论
Function Calling调用流程
好的,用户需要理解Function Calling的流程,并希望有一个流程图来辅助理解。我之前提供的搜索结果里提到,Function Calling的基本流程包括用户输入、模型解析、生成函数调用请求、执行函数、返回结果和生成响应。用户可能已经了解了一些基本步骤,但可能对具体细节或流程图有疑问。
首先,需要确认用户的实际需求。他们可能是在开发中使用大模型,需要集成外部工具,比如天气API或数据库查询。流程图的请求表明他们希望有一个可视化的步骤说明,可能用于教学或系统设计。
根据搜索结果,尤其是来自CSDN和知乎的链接,流程通常包括两次模型调用:第一次判断是否需要调用函数,生成请求;第二次根据函数返回的结果生成最终响应。例如,OpenAI的流程是先发送用户输入和可用函数列表,模型返回需要调用的函数及参数,执行后再次将结果传给模型生成回答。
需要注意用户提到的DeepSeek R1目前不支持Function Calling,但其他模型如GPT-4有该功能。用户的示例可能基于通用流程,但需要明确说明不同模型的差异。
用户可能遇到的困惑点在于如何将模型和外部系统连接,以及具体步骤间的数据传递。流程图应清晰展示从用户输入到最终响应的闭环过程,包括模型判断和执行函数的环节。
综合搜索结果,可以构建一个包含以下步骤的流程图:
- 用户输入问题。
- 模型解析并判断是否需要调用函数。
- 生成函数调用请求(名称和参数)。
- 应用程序执行函数并获取结果。
- 结果返回给模型。
- 模型整合结果生成最终响应。
需要指出的是,部分实现可能需要两次模型交互,如OpenAI的流程,而有些可能整合为一次。此外,函数参数的验证和错误处理也是重要环节,但可能不在基础流程中体现。
最后,确保流程图简洁易懂,用文字说明每个步骤的关键点,如模型生成结构化请求(JSON),应用程序执行外部API调用等。同时,参考提供的链接中的示意图,但可能无法直接访问图片,需用文字描述结构。
以下是 Function Calling(函数调用) 的详细流程及示意图,结合大模型与外部工具的交互机制:
Function Calling 核心流程
1. 用户输入请求
- 用户提出自然语言请求(如“北京今天的天气如何?”)。
2. 模型解析意图
- 大模型(如GPT-4)分析用户意图,判断是否需要调用外部函数(如天气API)。
3. 生成函数调用请求
- 模型返回结构化请求(JSON格式),包含函数名和参数:
{"tool_calls": [{"function": {"name": "get_weather", "arguments": "{\"location\": \"北京\"}"}}] }
4. 执行外部函数
- 应用程序解析请求,调用对应的函数(如查询天气API)。
5. 返回函数结果
- 函数执行结果(如温度、天气状况)返回给模型。
6. 生成最终响应
- 模型将结果整合为自然语言回复(如“北京今天晴天,25℃”)。
流程图
用户输入│▼
大模型解析意图│▼
是否需要调用函数? ——是→ 生成函数调用请求(JSON)│ │否 ▼│ 执行外部函数(如API、数据库)▼ │
直接生成回答 ▼│ 获取函数结果▼ │
返回用户响应 ←───────────┘
关键点说明
1. 两次模型交互(如OpenAI)
- 第一次请求:发送用户输入 + 可用函数列表,模型返回需调用的函数及参数。
- 第二次请求:发送函数执行结果,模型生成最终回复。
2. 结构化参数验证
- 应用程序需校验参数格式(如参数类型、必填字段),避免错误调用。
3. 错误处理
- 若函数调用失败,模型可能重新生成请求或提示用户修正输入。
参考案例(天气查询)
1. 用户输入
“上海明天会下雨吗?”
2. 模型返回函数调用
{"function": "get_weather", "arguments": {"location": "上海", "date": "2024-06-20"}}
3. 执行天气API查询
调用第三方API获取天气数据(如{"weather": "rain", "temp": 22}
)。
4. 模型生成最终响应
“上海明天有雨,气温22℃。”
扩展阅读
- OpenAI Function Calling 官方文档
- 大模型函数调用原理与实战(CSDN)
- LangChain 函数调用实现
通过流程图和分步解释,可以更清晰地理解大模型如何通过函数调用与外部系统协同工作。
Function Calling Python代码示例(以调用OpenAI模型为例)
代码
以下是使用OpenAI Function Calling的Python代码示例,实现天气查询功能:
import openai
import json# 配置OpenAI API密钥
openai.api_key = "sk-your-api-key-here"def get_current_weather(location, unit="celsius"):"""模拟天气API调用(实际应替换为真实API调用)"""weather_data = {"location": location,"temperature": "25","unit": unit,"forecast": ["sunny", "windy"],}return json.dumps(weather_data)def run_conversation():# 第一步:发送用户查询和函数定义messages = [{"role": "user", "content": "北京今天天气怎么样?"}]functions = [{"name": "get_current_weather","description": "获取指定地区的当前天气","parameters": {"type": "object","properties": {"location": {"type": "string","description": "城市或地区名称,例如:北京",},"unit": {"type": "string", "enum": ["celsius", "fahrenheit"],"description": "温度单位"}},"required": ["location"],},}]# 初始API调用response = openai.ChatCompletion.create(model="gpt-3.5-turbo-0613",messages=messages,functions=functions,function_call="auto",)response_message = response.choices[0].message# 第二步:处理函数调用if hasattr(response_message, "function_call"):# 解析函数调用信息function_name = response_message["function_call"]["name"]function_args = json.loads(response_message["function_call"]["arguments"])# 调用对应函数if function_name == "get_current_weather":function_response = get_current_weather(location=function_args.get("location"),unit=function_args.get("unit", "celsius"))# 第三步:发送函数结果给模型messages.append(response_message) # 添加助理的消息messages.append({"role": "function","name": function_name,"content": function_response,})# 获取最终响应final_response = openai.ChatCompletion.create(model="gpt-3.5-turbo-0613",messages=messages,)return final_response.choices[0].message['content']else:return response_message['content']# 运行对话
print(run_conversation())
代码解析:
1. 函数定义
get_current_weather
:模拟天气API调用(实际开发需替换为真实API)- 参数验证逻辑可在此函数中添加
2. API交互流程
用户输入 → 模型判断需要函数调用 → 生成函数调用请求 →
执行函数 → 返回结果给模型 → 生成最终响应
3. 关键参数说明
functions
:声明模型可用的函数列表function_call
:设置为"auto"让模型自主决策
执行示例输出:
北京今天天气晴朗,当前气温为25摄氏度,风力较大。请注意防晒。
注意事项:
1. 需替换为有效的OpenAI API密钥(sk-your-api-key-here
)
2. GPT-3.5-turbo版本需 >= 0613 才能支持函数调用
3. 实际生产环境需要:
- 添加错误处理(网络错误/参数错误)
- 实现真正的天气API调用
- 设置合理的temperature参数控制输出稳定性
如果需要DeepSeek版本的实现,请关注其API文档的更新,当前(截至2024年6月)DeepSeek R1尚未开放Function Calling支持。