开发基于提示工程的大语言模型(LLM)应用——学习笔记

server/2025/3/1 5:39:20/

本文是学习笔记。学习通过提示工程与大语言模型进行程序化的交互。

将从最基本的开始,比如使用哪些模型,以及如何向它们发送提示词并查看响应。

将逐步构建更复杂的提示词,并学习 LangChain 为我们提供的、用于与大语言模型交互的丰富工具。

Langchain链核心是运行时(runnable),它们能以多种方式组合的为工作流。

如何创建 LangChain 链

 from langchain_nvidia_ai_endpoints import ChatNVIDIAfrom langchain_core.prompts import ChatPromptTemplatefrom langchain_core.output_parsers import StrOutputParser​#创建模型实例base_url = 'http://llama:8000/v1'model = 'meta/llama-3.1-8b-instruct'llm = ChatNVIDIA(base_url=base_url, model=model, temperature=0)​#Langchain运行时template = ChatPromptTemplate.from_template("Answer the following question: {question}")prompt = template.invoke({"question": "In what city is NVIDIA world headquarters?"})​response = llm.invoke(prompt)print(response.content)

LangChain 表达语言(LCEL)

LCEL 用一种声明式的方法将运行时组合成:可复用的功能组合。我们通过 LCEL 的管道 | 操作符将运行时链接在一起,从高层次来看,就是将一个运行时的输出传递给下一个。

对于那些使用过 Unix 命令行的朋友来说,您会熟悉 | 操作符,它是将各种程序的功能链接在一起以服务于整体任务的一种方式。

如果您对 Bash 不是很了解,不用太担心下面的单元。但对于了解的朋友,您会看到我们通过管道操作符创建了一个链,用 echo 打印“hello pipes”,用 rev 反转字符串,然后用 tr 转为大写。

 %%bashecho hello pipes | rev | tr 'a-z' 'A-Z'

同样,我们也可以用 LCEL 的管道操作符将许多 LangChain 的功能方便地链接在一起。

一个简单的链

让我们从一个简单的链开始,这与您之前的工作相关。为了方便查看,我们将再次在这里定义 LLM 实例和一个提示模板。

 llm **=** ChatNVIDIA(base_url**=**base_url, model**=**model, temperature**=**0)template **=** ChatPromptTemplate.from_template("Answer the following question: {question}")

现在我们将通过管道将这两个组合在一起,创建我们的第一个 LCEL 链。一般来说,应该先经过提示模板,然后将生成的提示词发送给 LLM,因此我们将在管道中先放置模板。

 chain = template | llm

可以使用链的辅助方法来可视化由 chain 表示的计算图。

 print(chain.get_graph().draw_ascii())

如您所见,链将期待一个 PromptInput,这个输入将被传递到 ChatPromptTemplate 中,然后再传递到 ChatNVIDIA 模型,最终生成 ChatNVIDIAOutput

此外,我们还可以规定链所期望的输入类型,这次使用一个不同的辅助方法。

 chain.input_schema.schema()

上面是一个 Pydantic 对象,我们现在不会深入探讨,但您会立即注意到它的 required 字段明确指出了我们需要传递给 chain 的任何属性名称。

链是由运行时组成的,但它们自己也是运行时。因此,就像我们对待任何其它运行时一样,可以使用其 invoke 方法。

我们知道链的开始部分需要一个提示输入,而提示模板希望我们为 question 提供一个值,因此我们将在调用链时提供预期的值。

持续更新中,未完待续。。。


http://www.ppmy.cn/server/171475.html

相关文章

使用优化版的编辑距离算法替代ES默认的评分算法

优化版编辑距离算法 public static int minDistance(String str, String str1) {int len str.length(), len1 str1.length();// 预处理char[] arr1 str.toCharArray();char[] arr2 str1.toCharArray();// 动态规划数组int[] dp new int[len1 1];for (int j 0; j < le…

Rust ~ Vec<u8>和[u8]

Vec<u8> 和 &[u8] 是两种不同的数据类型&#xff0c;它们都与字节序列相关&#xff0c;但在所有权、内存管理、使用场景等方面存在明显区别 类型本质 Vec<u8>&#xff1a;Rust 中的动态数组类型&#xff0c;即向量&#xff08;vector&#xff09;。它是一个拥…

二、IDE集成DeepSeek保姆级教学(使用篇)

各位看官老爷好&#xff0c;如果还没有安装DeepSeek请查阅前一篇 一、IDE集成DeepSeek保姆级教学(安装篇) 一、DeepSeek在CodeGPT中使用教学 1.1、Edit Code 编辑代码 选中代码片段 —> 右键 —> CodeGPT —> Edit Code, 输入自然语言可编辑代码&#xff0c;点击S…

Python的PyTorch+CNN深度学习技术在人脸识别项目中的应用

人脸识别技术是一种基于人脸特征进行身份识别的生物识别技术&#xff0c;其核心原理包括人脸检测、人脸对齐、特征提取、特征匹配、身份识别。 一、应用场景 安防&#xff1a;门禁、监控。 金融&#xff1a;刷脸支付、身份验证。 社交&#xff1a;自动标注、美颜。 医疗&am…

深入解析:使用Python爬虫获取京东商品详情原数据API接口

在电商数据分析、竞品研究以及用户体验优化等领域&#xff0c;获取商品详情数据是至关重要的一步。京东作为国内领先的电商平台&#xff0c;提供了丰富的API接口供开发者使用。本文将详细介绍如何通过Python爬虫技术调用京东商品详情API接口&#xff0c;获取商品的原数据&#…

【Day48 LeetCode】图论问题 Ⅵ

一、图论问题 Ⅵ 1、拓扑排序–软件构建 拓扑排序是将一个有向图转成线性的排序&#xff0c;需要判断有向图中是否存在环。这个比较经典的问题就是leetcode里207 课程表。和这题异曲同工。 思路就是&#xff1a;记录每个节点的入度&#xff0c;以及当前节点的下一个节点。优先…

java23种设计模式-策略模式

策略模式(Strategy Pattern)学习笔记 编程相关书籍分享:https://blog.csdn.net/weixin_47763579/article/details/145855793 DeepSeek使用技巧pdf资料分享:https://blog.csdn.net/weixin_47763579/article/details/145884039 🌟 模式定义 策略模式是一种行为型设计模式,…

echarts 环形图 指定区域从右侧中心点展开

<!DOCTYPE html> <html lang"en"> <head> <meta charset"UTF-8"> <meta name"viewport" content"widthdevice-width, initial-scale1.0"> <title>ECharts 环形图不合理区域展示<…