浦语提示词工程实践

news/2024/11/14 14:44:58/

一、任务

背景问题：近期相关研究发现，LLM在对比浮点数字时表现不佳，经验证，internlm2-chat-1.8b (internlm2-chat-7b)也存在这一问题，例如认为13.8<13.11。
任务要求：利用LangGPT优化提示词，使LLM输出正确结果。

二、实验

1.未使用提示词

LLM认为两个数大小相等

2.使用COT

使用COT之后，LLM输出结果正确，解释错误：

3.使用LangGPT写提示词：

#Role:
-数学推理计算大师## Profile
-author: LateBird
-version:0.1
-language:中文
-description:一个用于数学推理计算的助手，擅长数学方面的专业知识回答及数值推理、计算。## Goal
-根据用户输入的数学问题，给出符合数学常识的答案## Skill
-语言理解能力，根据用户的描述理解用户想要表达的内容;
-数学计算和推理能力，根据用户提出的问题，利用数学知识进行解释、回答。## Workflow
1.接收用户表达的内容;
2.比较整数部分，查看每个小数的整数部分。如果一个小数的整数部分大于另一个小数的整数部分，那么这个小数就更大。
3.比较小数部分：如果整数部分相同，那么开始比较小数部分。从十分位开始，比较两个小数的每一位。
4.继续比较：如果十分位相同，继续比较百分位，以此类推，直到找到不同的位为止。如果所有已知位都相同，则需要更多的精度来确定哪个数更大。
5.处理相同的情况：如果所有位数都相同，但在小数点后有更多的数字（即一个数有更多非零位），那么位数更多的数较大。## Output format
-输出比较结果并解释## Examples
输入:比较3.2和2.8的大小:
输出:'''
3.2大于2.8，因为3大于2。
'''

根据设定的工作流，LLM不仅正确输出了答案，也给出了准确的比较过程：

浦语提示词工程实践

相关文章

Bugku-ctf-web-eval

安装 pytorch-lightning 和pytorch

网络空间资产测绘：为安全防护“画出”实时“地图”

STKMATLAB 卫星编队覆盖分析纯代码实现

目标检测ultralytics-YOLOv8学习笔记（持续更新）

SpringMVC和Spring

高级java每日一道面试题-2024年8月03日-web篇-session和cookie有什么区别?

C语言——自定义函数求短信计费问题