对话大模型Prompt是否需要礼貌点?

news/2024/9/11 3:57:18/ 标签: prompt, python, 大模型

大模型相关目录

大模型,包括部署微调prompt/Agent应用开发、知识库增强、数据库增强、知识图谱增强、自然语言处理、多模态等大模型应用开发内容
从0起步,扬帆起航。

  1. 基于Dify的QA数据集构建(附代码)
  2. Qwen-2-7B和GLM-4-9B:大模型届的比亚迪秦L
  3. 文擎毕昇和Dify:大模型开发平台模式对比
  4. Qwen-VL图文多模态大模型微调指南
  5. 从零开始的Ollama指南:部署私域大模型
  6. 基于Dify的智能分类方案:大模型结合KNN算法(附代码)
  7. OpenCompass:大模型测评工具
  8. 一文读懂多模态大模型基础架构
  9. 大模型管理平台:one-api使用指南
  10. 大模型RAG、ROG、RCG概念科普
  11. RAGOnMedicalKG:大模型结合知识图谱的RAG实现
  12. DSPy:变革式大模型应用开发
  13. 最简明的Few-shot Prompt指南
  14. Semantic Kernel:微软大模型开发框架——LangChain 替代
  15. 对话大模型Prompt是否需要礼貌点?

文章目录


随着人工智能技术的飞速发展,对话大模型如GPT-3、ChatGLM等已经能够以极高的准确性和流畅度与人类进行交互。这些模型在提升生产效率、优化用户体验等方面发挥着重要作用。在使用这些模型时,一个值得探讨的问题是:否需要在与语言模型的交往中体现基本的礼貌,给予合理的尊重?礼貌的用语会不会提升大模型表现?

有研究就摘要总结、偏见检测两部分内容对大模型进行了检测。

在这里插入图片描述
最终得出的结论可能与你的认知有所出入:

提示语句的礼貌程度为最高(8分)时,模型的得分为60.02%,明显高于最低礼貌程度(1分)时的51.93%。另一个值得关注的现象是,过于谦卑的语气在有些情况下也会影响模型的表现。以中文测试为例,当礼貌程度达到最高(8分)时,ChatGLM3在C-Eval测试中的分数为20.58%,低于6-7分时的21%左右。这或许与中国文化中"逊于人"的传统价值观有关,过于卑躬屈膝反而会让人产生不自信、不专业的印象。

在与对话大模型交互时,研究发现,无论输入的礼貌程度如何,ROUGE-L和BERTScore这两种评估文本生成质量的指标分数都保持稳定。然而,对于不同的模型,输出的长度会随着礼貌程度的变化而变化。例如,对于GPT模型,当输入的礼貌程度降低时,输出的长度也会相应减少。对于Llama模型,降低礼貌程度通常会导致对话长度的缩短,但如果是极其不礼貌的输入,对话长度反而会显著增加。这种趋势可能是因为在需要详细描述或指令的场景中,人们更倾向于使用礼貌和正式的语言,从而导致输出内容更长。

因此,在设计提示语句时,我们需要格外注意语气的得体程度。追求一种"中庸之道",既不过于简陋粗鲁,又避免过分谦卑逊色,让语气保持在一个恰到好处的亲和且专业的程度。这不仅有利于优化语言模型的输出质量,也更加贴合不同文化背景下的沟通习惯。

从更深层次来看,这个研究结果启发我们反思了语言模型与人类的关系。语言模型之所以能模仿人性化行为,根源在于它们是通过学习海量人类语料而训练出来的。它们所体现出的特质,其实就是对人类文明的一种映射与延伸。所以,如果你的用户群跨越许多不同的文化和语言,那么在开发提示时你应该牢记这一点。


http://www.ppmy.cn/news/1474722.html

相关文章

6-6 Ant.design配置(react+区块链实战)

6-6 Ant.design配置(react区块链实战) https://ant.design/index-cn 直接点击开始使用ant进行button等按钮的样式 https://ant.design/docs/react/use-with-create-react-app-cn 在 create-react-app 中使用 安装antd,在react项目woniu-pet-…

react学习——29react之useState使用

useState 是 React Hooks 中的一个重要函数,它用于在函数组件中添加状态。在类组件中,我们通常使用 this.state 和 this.setState 来管理组件的状态,而在函数组件中,我们可以使用 useState 来达到同样的目的。 1、导入 useState&…

MyBatis(35)如何在 MyBatis 中实现软删除

实现软删除在MyBatis中通常意味着更新数据库记录的某个字段,而不是真正地从数据库中删除记录。这个字段(通常是is_deleted、deleted或status等)被用来标记记录是否被删除。下面我们将详细探讨如何在MyBatis中实现软删除,包括数据库…

Hadoop-25 Sqoop迁移 增量数据导入 CDC 变化数据捕获 差量同步数据 触发器 快照 日志

章节内容 上节我们完成了如下的内容: Sqoop MySQL迁移到HiveSqoop Hive迁移数据到MySQL编写脚本进行数据导入导出测试 背景介绍 这里是三台公网云服务器,每台 2C4G,搭建一个Hadoop的学习环境,供我学习。 之前已经在 VM 虚拟机…

在分布式环境中,怎样保证 PostgreSQL 数据的一致性和完整性?

文章目录 在分布式环境中保证 PostgreSQL 数据的一致性和完整性一、数据一致性和完整性的重要性二、分布式环境对数据一致性和完整性的挑战(一)网络延迟和故障(二)并发操作(三)数据分区和复制 三、保证 Pos…

解读网络安全公司F5:助企业高效简化多云和应用部署

伴随企业加速数字化转型工作、扩展到新的基础设施环境并采用微服务架构,企业正拥抱混合和多云基础设施所带来的灵活性。Ernst & Young调查数据显示,84%的企业正处于向现有网络安全解决方案套件添加多种新技术的早期阶段。企业同样意识到,…

Perl语言之标量

Perl对于变量的定义,分为三种类型:标量、数组和哈希。   标量是 Perl 语言中最简单的一种数据类型。标量中可以存储整数、字符串、浮点数、字符等,数据格式不做严格区分。在使用标量时需要再变量前面加$,如: #! /us…

Chain-of-Verification Reduces Hallucination in Lagrge Language Models阅读笔记

来来来,继续读文章了,今天这个是meta的研究员们做的一个关于如何减少LLM得出幻觉信息的工作,23年底发表。文章链接:https://arxiv.org/abs/2309.11495 首先,这个工作所面向的LLM的问答任务,是list-based q…

使用Nginx实现高效负载均衡

概述 Nginx是一款高性能的HTTP和反向代理服务器,广泛用于Web服务的负载均衡。它能有效分发流量至多个后端服务器,提高网站的可用性和响应速度,同时增强系统的可扩展性和安全性。本文将介绍如何配置Nginx进行负载均衡,并提供具体的…

服务发现与注册:Eureka与Consul

在微服务架构中,服务发现与注册是一个非常重要的部分。通过服务发现机制,微服务能够相互找到并进行通信,而不需要了解彼此的具体地址。本文将详细介绍两种主流的服务发现与注册框架:Eureka和Consul,并提供相应的代码示…

Web开发 —— 放大镜效果(HTML、CSS、JavaScript)

目录 一、需求描述 二、实现效果 三、完整代码 四、实现过程 1、HTML 页面结构 2、CSS 元素样式 3、JavaScript动态控制 (1)获取元素 (2)控制大图和遮罩层的显隐性 (3)遮罩层跟随鼠标移动 &…

C# Winform 系统方案目录的管理开发

在做一个中等复杂程度项目时,我们通常有系统全局配置,还要有对应的方案目录的管理和更新。 比如我们有如下需求:开发一个方案管理,可以新建、打开和保存方案,同时还需要保存方案中的各种文件。我设计的采用目录管理和…

【YashanDB知识库】表收集统计信息默认阈值引起SQL执行效率差

【问题分类】性能优化 【关键字】统计信息,阈值,执行计划 【问题描述】表新增87w数据自动收集统计信息任务没有启动导致SQL执行计划变差 【问题原因分析】 CUS_REGISTER_READ 数据总量是18374074,插入81万,统计信息失效的阈值是…

流程图怎么做?有三种制作方法

流程图怎么做?在日常生活和工作中,流程图作为一种直观展示步骤、流程或决策路径的工具,扮演着不可或缺的角色。它不仅能够帮助我们理清思路、规划任务,还能促进团队协作与沟通。那么,如何高效地绘制流程图呢&#xff1…

Objective-C 自定义渐变色Slider

文章目录 一、前情概要二、具体实现 一、前情概要 系统提供UISlider,但在开发过程中经常需要自定义,本次需求内容是实现一个拥有渐变色的滑动条,且渐变色随着手指touch的位置不同改变区域,类似如下 可以使用CAGradientLayer实现渐…

Web开发:一个可拖拽的模态框(HTML、CSS、JavaScript)

目录 一、需求描述 二、实现效果 三、完整代码 四、实现过程 1、HTML 页面结构 2、CSS 元素样式 3、JavaScript动态控制 (1)获取元素 (2)显示\隐藏遮罩层与模态框 (3)实现模态框拖动效果 一、需求…

VMware安装Ubuntu以及利用vscode远程Ubuntu

一、VMware安装Ubuntu (1)VMware安装Ubuntu主要参考此文VMware虚拟机安装Ubuntu22.04图文教程(超详细!!!)。 (2)VMware密钥参考此文24年VMware 17密钥(附下载链接&#…

《C++并发编程实战》笔记(一、二)

一、简介 抽象损失&#xff1a;对于实现某个功能时&#xff0c;可以使用高级工具&#xff0c;也可以直接使用底层工具。这两种方式运行的开销差异称为抽象损失。 二、线程管控 2.1 线程的基本控制 1. 创建线程 线程相关的管理函数和类在头文件&#xff1a; #include <…

Memcached高并发挑战:性能优化与实战策略

标题&#xff1a;Memcached高并发挑战&#xff1a;性能优化与实战策略 在高并发的网络应用场景中&#xff0c;Memcached作为一项高效的分布式内存缓存系统&#xff0c;其性能表现尤为关键。然而&#xff0c;面对海量的请求和数据&#xff0c;Memcached的性能如何&#xff0c;以…

Spring Boot 框架知识汇总

1、什么是SpringBoot&#xff1f; 通过Spring Boot&#xff0c;可以轻松地创建独立的&#xff0c;基于生产级别的Spring的应用程序&#xff0c;您可以“运行"它们。大多数Spring Boot应用程序需要最少的Spring配置&#xff0c;集成了大量常用的第三方库配置&#xff0c;使…