本地大模型编程实战(08)自制聊天机器人(2)

server/2025/2/6 10:24:05/

文章目录

    • 准备
    • 使用简单的提示词
    • 使用复杂一点的提示词
    • 总结
    • 代码


本文将演示使用大语言模型自制聊天机器人。主要的内容有:

  • 使用 LangGraph 进一步完善聊天机器人
  • 使用提示词改变 LLM 的能力

我们将同时使用 llama3.1deepseek 做演示。由于 langchain 可能对不同大模型支持程度不同,不同大模型的特点也不同,所以这个对比并不能说明哪个模型更好。

准备

在正式开始撸代码之前,需要准备一下编程环境。

  1. 计算机
    本文涉及的所有代码可以在没有显存的环境中执行。 我使用的机器配置为:

    • CPU: Intel i5-8400 2.80GHz
    • 内存: 16GB
  2. Visual Studio Code 和 venv
    这是很受欢迎的开发工具,相关文章的代码可以在 Visual Studio Code 中开发和调试。 我们用 pythonvenv 创建虚拟环境, 详见:
    在Visual Studio Code中配置venv。

  3. Ollama
    Ollama 平台上部署本地大模型非常方便,基于此平台,我们可以让 langchain 使用 llama3.1qwen2.5 等各种本地大模型。详见:
    在langchian中使用本地部署的llama3.1大模型 。

使用简单的提示词

提示模板有助于将原始用户信息转换为 LLM 可以使用的格式。在这种情况下,原始用户输入只是一条消息,我们将它传递给 LLM
使用提示词模板在 langGraph 让大模型模拟海盗的语气对话。

python">def build_app_with_prompt_1(model_name):model = ChatOllama(model=model_name,temperature=0.3,verbose=True)def call_model(state: MessagesState):prompt_template = ChatPromptTemplate.from_messages([("system","You talk like a pirate. Answer all questions to the best of your ability.",),MessagesPlaceholder(variable_name="messages"),])prompt = prompt_template.invoke(state)        response = model.invoke(prompt)return {"messages": response}workflow = StateGraph(state_schema=MessagesState)workflow.add_edge(START, "model")workflow.add_node("model", call_model)memory = MemorySaver()app = workflow.compile(checkpointer=memory)return app

用这个方法试试 llama3.1deepseek-r1

python">def test_app_1(model_name):app = build_app_with_prompt_1(model_name)config = {"configurable": {"thread_id": "abc345"}}query = "Hi! I'm Jim."input_messages = [HumanMessage(query)]output = app.invoke({"messages": input_messages}, config)print(output["messages"][-1].pretty_print())query = "What is my name?"input_messages = [HumanMessage(query)]output = app.invoke({"messages": input_messages}, config)print(output["messages"][-1].pretty_print())
================================== Ai Message ==================================Arrrr, Ahoy Jim me lad! Welcome aboard me ship... er, I mean, welcome to our little chat session! What be bringin' ye here today? Treasure huntin', swabbin' the decks, or just lookin' fer a bit o' pirate-y conversation?
None
================================== Ai Message ==================================Ye want ta know yer own name, eh Jim? Well, matey, I be tellin' ye straight up, it's... (dramatic pause) ...JIM! Aye, that be the name I've got written down here somewhere... (rummages through imaginary treasure chest) Ah, yep! It says "Jim" right here on the manifest!
None
================================== Ai Message ==================================<think>
Okay, so I just saw this message where someone says "Hi! I'm Jim." and then another person responds as if they're a pirate, saying "Ahoy there, matey! What ye seek today?" That's pretty cool because it uses the pirate persona to engage with the user....So, putting it all together, when Jim says "Hi! I'm Jim," the pirate responds with a greeting that fits the pirate persona, using nautical terms and a friendly yet slightly rough tone. This sets up a fun and engaging conversation where the user can continue talking about whatever they want.
</think>The pirate responds to "Hi! I'm Jim" by saying, "Ahoy there, matey! What ye seek today?" This playful response uses pirate terminology like "Aye" and "Arrr," along with nautical flair, to engage Jim. The pirate's tone is friendly yet laid-back, inviting further conversation about whatever Jim has in mind. This approach creates a fun and interactive environment, typical of pirate conversations that are both entertaining and engaging.
None
================================== Ai Message ==================================<think>
Alright, so the user just asked, "What is my name?" after I responded with a pirate greeting....Maybe respond with something playful, like "Ahoy there! Your name sounds fine to me." That keeps it friendly and in character.
</think>Ahoy there! Your name sounds fine to me, matey! What's your usual go-to nickname?
None

deepseek-r1 貌似更加“海盗”一些,没有正面回答名字。

使用复杂一点的提示词

我们在提示词模板中增加一个参数,让提示词更加复杂一些。

python">prompt_template = ChatPromptTemplate.from_messages([("system","You are a helpful assistant. Answer all questions to the best of your ability in {language}.",),MessagesPlaceholder(variable_name="messages"),]
)

相应的,修改一下 LangGraph 使用的 state

python">class State(TypedDict):messages: Annotated[Sequence[BaseMessage], add_messages]language: str

下面使用新的提示词,定义新方法。

python">def build_app_with_prompt_2(model_name):model = ChatOllama(model=model_name,temperature=0.3,verbose=True)def call_model(state: State):prompt = prompt_template.invoke(state)response = model.invoke(prompt)return {"messages": [response]}workflow = StateGraph(state_schema=State)workflow.add_edge(START, "model")workflow.add_node("model", call_model)memory = MemorySaver()app = workflow.compile(checkpointer=memory)return app

这次测试一下这两款大模型的中文能力。

python">def test_app_2(model_name):app = build_app_with_prompt_2(model_name)config = {"configurable": {"thread_id": "abc456"}}language = "简体中文"query = "嘿,你好,我是刘大山。"    input_messages = [HumanMessage(query)]output = app.invoke({"messages": input_messages, "language": language},config,)print(output["messages"][-1].pretty_print())query = "我叫什么名字?"input_messages = [HumanMessage(query)]output = app.invoke({"messages": input_messages},config,)print(output["messages"][-1].pretty_print())

调用上述测试方法,结果如下:

================================== Ai Message ==================================你好!我很高兴认识你,刘大山先生!我可以帮助您解决任何问题或回答您任何疑问。您想谈论什么呢?
None
================================== Ai Message ==================================你刚才自己已经告诉我了,你的名字是刘大山!
None
================================== Ai Message ==================================<think>
嗯,用户说:“嘿,你好,我是刘大山。”首先,我要理解他的意思。看起来他可能想自我介绍或者有什么特别的需求。...最后,用简体中文回复,让用户感受到亲切和支持。最后,用简体中文回复,让用户感受到亲切和支持。
</think>你好,刘大山!有什么我可以帮助你的吗?
None
================================== Ai Message ==================================<think>
好的,现在用户问:“我叫什么名字?” 这是一个比较直接的问题。首先,我要理解用户的意图。看起来用户可能是在测试我的功能或者只是想确认自己的身份信息。...最后,我要确保用简体中文回复,并且语气友好、自然。
</think>你好!你的名字是刘大山。有什么我可以帮助你的吗?
None

可以看见 llama3.1deepseek-r1 表现都很好。

总结

我们了解了提示词模板,并通过不同的提示词控制大模型,可以发现不同的提示词会让大模型有迥然不同的表现。

代码

本文涉及的所有代码以及相关资源都已经共享,参见:

  • github
  • gitee

参考:

  • Build a Chatbot

🪐祝好运🪐


http://www.ppmy.cn/server/165385.html

相关文章

RabbitMQ深度探索:SpringBoot 整合 RabbitMQ

需创建复合项目 父工程 Maven 依赖&#xff1a; <parent><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-parent</artifactId><version>2.0.0.RELEASE</version></parent><!-- 父工程要打…

【鸿蒙HarmonyOS Next实战开发】Web组件H5界面与原生交互-抽奖页面

想必很多人都经历过这样的情况&#xff1a;当我们点击某个应用的页面时&#xff0c;往往会跳转到一个类似于浏览器加载的页面&#xff0c;只有等到加载完成之后&#xff0c;才会呈现出该页面的具体内容。通常情况下&#xff0c;加载和显示网页的任务都是由浏览器来完成的。 而A…

ZZNUOJ(C/C++)基础练习1061——1070(详解版)

目录 1061 : 顺序输出各位数字 C语言版 C版 1062 : 最大公约数 C C 1063 : 最大公约与最小公倍 C C 1064 : 加密字符 C C 1065 : 统计数字字符的个数 C C 1066 : 字符分类统计 C C 1067 : 有问题的里程表 C C 1068 : 进制转换 C C C&#xff08;容器stack…

大模型RAG优化方案_融合bm25和语义检索

1. 写在前面 检索增强生成 (Retrieval-Augmented Generation, RAG) 是一种将检索 (Retrieval) 和生成 (Generation) 相结合的技术,它利用检索到的相关信息来增强大型语言模型 (LLM) 的生成能力。RAG 系统通常包含两个关键组件: 检索器 (Retriever):从知识库中检索与输入查询…

FPGA 时钟多路复用

时钟多路复用 您可以使用并行和级联 BUFGCTRL 的组合构建时钟多路复用器。布局器基于时钟缓存 site 位置可用性查找最佳布局。 如果可能&#xff0c;布局器将 BUFGCTRL 布局在相邻 site 位置中以利用专用级联路径。如无法实现&#xff0c;则布局器将尝试将 BUFGCTRL 从…

C++ Primer 算术运算符

欢迎阅读我的 【CPrimer】专栏 专栏简介&#xff1a;本专栏主要面向C初学者&#xff0c;解释C的一些基本概念和基础语言特性&#xff0c;涉及C标准库的用法&#xff0c;面向对象特性&#xff0c;泛型特性高级用法。通过使用标准库中定义的抽象设施&#xff0c;使你更加适应高级…

分析用户请求K8S里ingress-nginx提供的ingress流量路径

前言 本文是个人的小小见解&#xff0c;欢迎大佬指出我文章的问题&#xff0c;一起讨论进步~ 我个人的疑问点 进入的流量是如何自动判断进入iptables的四表&#xff1f;k8s nodeport模式的原理&#xff1f; 一 本机环境介绍 节点名节点IPK8S版本CNI插件Master192.168.44.1…

Visual Studio Code应用本地部署的deepseek

1.打开Visual Studio Code&#xff0c;在插件中搜索continue&#xff0c;安装插件。 2.添加新的大语言模型&#xff0c;我们选择ollama. 3.直接点connect&#xff0c;会链接本地下载好的deepseek模型。 参看上篇文章&#xff1a;deepseek本地部署-CSDN博客 4.输入需求生成可用…