浦语提示词工程实践

news/2024/11/14 14:44:58/

一、任务

  • 背景问题:近期相关研究发现,LLM在对比浮点数字时表现不佳,经验证,internlm2-chat-1.8b (internlm2-chat-7b)也存在这一问题,例如认为13.8<13.11

  • 任务要求:利用LangGPT优化提示词,使LLM输出正确结果。

二、实验

1.未使用提示词

LLM认为两个数大小相等

2.使用COT

使用COT之后,LLM输出结果正确,解释错误:

3.使用LangGPT写提示词:

#Role:
-数学推理计算大师## Profile
-author: LateBird
-version:0.1
-language:中文
-description:一个用于数学推理计算的助手,擅长数学方面的专业知识回答及数值推理、计算。## Goal
-根据用户输入的数学问题,给出符合数学常识的答案## Skill
-语言理解能力,根据用户的描述理解用户想要表达的内容;
-数学计算和推理能力,根据用户提出的问题,利用数学知识进行解释、回答。## Workflow
1.接收用户表达的内容;
2.比较整数部分,查看每个小数的整数部分。如果一个小数的整数部分大于另一个小数的整数部分,那么这个小数就更大。
3.比较小数部分:如果整数部分相同,那么开始比较小数部分。从十分位开始,比较两个小数的每一位。
4.继续比较:如果十分位相同,继续比较百分位,以此类推,直到找到不同的位为止。如果所有已知位都相同,则需要更多的精度来确定哪个数更大。
5.处理相同的情况:如果所有位数都相同,但在小数点后有更多的数字(即一个数有更多非零位),那么位数更多的数较大。## Output format
-输出比较结果并解释## Examples
输入:比较3.2和2.8的大小:
输出:'''
3.2大于2.8,因为3大于2。
'''

根据设定的工作流,LLM不仅正确输出了答案,也给出了准确的比较过程:


http://www.ppmy.cn/news/1504205.html

相关文章

Bugku-ctf-web-eval

<?phpinclude "flag.php";$a $_REQUEST[hello];eval( "var_dump($a);");show_source(__FILE__); ?> include "flag.php"; 这行代码尝试包含一个名为flag.php的文件。这个文件可能包含一些配置信息或其他代码&#xff0c;但是没有提供这…

安装 pytorch-lightning 和pytorch

&#xff08;1&#xff09;要注意版本对齐&#xff1a;[env]pytorch_lightning和pytorch对应版本问题_pytorch-lightning版本对应-CSDN博客 &#xff08;2&#xff09;要注意安装的是什么 pip install pytorch-lightning has been deprecated and will stop being updated Ju…

网络空间资产测绘:为安全防护“画出”实时“地图”

网络空间已成为继海、陆、空、天之后的“第五疆域”&#xff0c;对其空间布局进行摸排并形成“地图”&#xff0c;是维护网络空间安全的基础性工作。近日在2024全球数字经济大会上发布的DayDayMap全球网络空间资产测绘平台&#xff0c;能为用户提供全面、精准、实时的全球网络空…

STKMATLAB 卫星编队覆盖分析纯代码实现

任务描述 设置卫星编队&#xff08;沿航迹编队&#xff0c;大斜视角&#xff0c;幅宽100km&#xff0c;下视角30&#xff0c;斜视角26&#xff09;&#xff0c;设置分析区域&#xff08;中国全境&#xff09;&#xff0c;设置FigureOfMerit&#xff08;展示覆盖率&#xff09;…

目标检测ultralytics-YOLOv8学习笔记(持续更新)

目录 YOLOV8官方文档示例命令格式各项参数解释总结 上述命令输出性能指标输出类别性能指标速度指标输出总结 IOU阈值1. mAP502. mAP50-95区别总结&#xff1a;实际应用中的选择&#xff1a;示例&#xff1a; 精度与召回率精度&#xff08;Precision&#xff09;召回率&#xff…

SpringMVC和Spring

1.AOP 1.基础内容 AOP是面向切面的的编程&#xff0c;AOP 是一种编程思想&#xff0c;是面向对象编程&#xff08;OOP&#xff09;的一种补充。 面向切面编程&#xff0c;实现在不修改源代码的情况下给程序动态统一添加额外功能的一种技术&#xff08;增强代码&#xff09;&…

高级java每日一道面试题-2024年8月03日-web篇-session和cookie有什么区别?

如果有遗漏,评论区告诉我进行补充 面试官: session和cookie有什么区别? 我回答: 在Java Web开发中&#xff0c;session和cookie是两种常用的状态管理技术&#xff0c;它们主要用于跟踪用户的会话状态&#xff0c;但它们在存储位置、安全性、数据量和生命周期等方面存在显著…

C语言——自定义函数求短信计费问题

用手机发短信&#xff0c;一条短信资费为0.1元&#xff0c;但限定一条短信的内容在70个字以内&#xff08;包括70个字&#xff09;。如果你一次所发送的短信超过了70个字&#xff0c;则会按照每70个字一条短信的限制把它分割成多条短信发送。假设已经知道你当月所发送的短信的字…