【GPT入门】第8课 大语言模型的自洽性

embedded/2025/3/11 9:00:36/

【GPT入门】第8课 大语言模型的自洽性

  • 1.自洽性概念
  • 2.代码(观察执行结果)
  • 3.自洽性核心思想

1.自洽性概念

大模型的自洽性(self - consistency)是指在推理阶段,大模型通过生成多个答案并选择出现频率最高的那个,来提高模型输出的准确性 。以下为你详细介绍:
**核心原理:**其基于的理念是一致性胜于一切。当模型针对一个问题生成多个答案时,出现频率高的答案被认为更有可能是正确的。因为错误答案往往是随机产生、彼此不一致的,而多次生成相同或相似的答案,说明模型在推理过程中达到了某种共识,这种共识体现了答案的可靠性。
在这里插入图片描述

2.代码(观察执行结果)

from openai import OpenAI# 加载 .env 文件到环境变量
from dotenv import load_dotenv, find_dotenv
_ = load_dotenv(find_dotenv())client = OpenAI()prompt = "当我6岁时,我的妹妹是我一半年龄,现在我60岁,我的妹妹多少岁?"
prompt2 = "当我6岁时,我的妹妹是我一半年龄,我现在60岁,我的妹妹多少岁?"
prompt3 = "当我6岁时,我的妹妹是我一半年龄,我现在60岁啦,我的妹妹多少岁?"
def get_completion(prompt, model='gpt-3.5-turbo'):messages = [{"role":"user","content":prompt}]response = client.chat.completions.create(model=model,messages=messages)return response.choices[0].message.contentprint("-----第一次问:")
print(get_completion(prompt))
print("-----第二次问:")
print(get_completion(prompt2))
print("-----第三次问:")
print(get_completion(prompt3))

答案:

-----第一次问:
53岁。
-----第二次问:
当你6岁时,你的妹妹是你一半的年龄,即3岁。因此,年龄差为3年。现在你60岁,妹妹的年龄是60 - 3 = 57岁。所以,你的妹妹现在57岁。
-----第三次问:
妹妹现在应该是54岁。

再次运行(什么都不改):

-----第一次问:
当我6岁时,我的妹妹是我一半年龄,也就是3岁。现在我60岁,根据这个逻辑,我的妹妹现在应该是57岁。
-----第二次问:
如果当你6岁的时候,你妹妹是你一半的年龄,那么她当时就是3岁。现在你60岁了,所以你妹妹应该是60-6+3=57岁。
-----第三次问:
当你6岁时,你的妹妹是你一半的年龄,即3岁。你比妹妹大3岁。现在你60岁,所以你的妹妹是60 - 3 = 57岁。

3.自洽性核心思想

核心思想:多数投票胜出


http://www.ppmy.cn/embedded/171720.html

相关文章

Spring Boot 多数据源解决方案:dynamic-datasource-spring-boot-starter 的奥秘(上)

在 Spring Boot 生态中,dynamic-datasource-spring-boot-starter 是一个非常实用的组件,它为我们在多数据源场景下提供了便捷的解决方案。在上一篇文章《一分钟上手:如何创建你的第一个 Spring Boot Starter》中,我们学习了如何创…

deepseek的regflow安装mac版本

deepseek的ragflow部署安装 一:ollama安装,自行完成,我本地已安装 二:查看大模型情况oll::命令ollama list,我本地无ragflow 三:docker安装:命令docker version ,自行完成,我本地已安装 四:安装知识库软件ragflow: 简单科普下Ragflow 是一个基于深度学习模型的问答生成工具&…

WPS条件格式:B列的值大于800,并且E列的值大于B列乘以0.4时,这一行的背景标红

一、选择数据区域 选中需要应用条件格式的区域(例如A2:E100 )。 二、打开条件格式 点击“开始”选项卡,选择“条件格式” > “新建规则”。 三、选择规则类型 选择“使用公式确定要设置格式的单元格”。 四、输入公式 在公式框中输入以…

远程监控项目描述以及总体框架

远程监控项目基于之前的本地渲染项目做了一个扩展。本地渲染项目没有涉及到解码部分,是直接从rv126拿到摄像头的vi数据,做转换就刷新到了上面去。 uvc摄像头用ffmpeg做推流,所以这个远程是先拿到我们这个uvc摄像头的数据进行解码才能刷新到网…

React之userEffect的使用

一、userEffect是什么 在React组件中,副作用操作是指那些会被影响的其他的组件,而且不能在渲染过程中完成相关操作。其中,常见的副作用就是从API接口中获取数据。而 useEffect 提供了一种在函数组件中处理副作用的方式,使得函数组…

工业数据采集与控制:ARM一体机的低功耗高可靠性方案

在工业4.0和智能化转型的浪潮下,传统工业现场的数据采集与控制方式正在被颠覆。过去,工业现场的数据采集和控制往往依赖于分散的设备和复杂的系统集成,而如今,ARM工业现场采集控制看板显示一体机的出现,为工业自动化带…

2线性表之链表

1.链表 链表是一种 物理存储结构上非连续、非顺序 的存储结构,数据元素的 逻辑顺序 是通过链表中的 指针链接 次序实现的 。 关于顺序表的不足: 扩容有性能消耗且有可能存在空间浪费。 扩容时,如果扩小了,大量插入数据时&#xff…

Python大数据可视化:基于大数据技术的共享单车数据分析与辅助管理系统_flask+hadoop+spider

开发语言:Python框架:flaskPython版本:python3.7.7数据库:mysql 5.7数据库工具:Navicat11开发软件:PyCharm 系统展示 管理员登录 管理员功能界面 场地信息界面 单车信息界面 归还信息界面 共享单车界面 系…