【GPT入门】第8课 大语言模型的自洽性

news/2025/3/11 2:01:15/

【GPT入门】第8课 大语言模型的自洽性

  • 1.自洽性概念
  • 2.代码(观察执行结果)
  • 3.自洽性核心思想

1.自洽性概念

大模型的自洽性(self - consistency)是指在推理阶段,大模型通过生成多个答案并选择出现频率最高的那个,来提高模型输出的准确性 。以下为你详细介绍:
**核心原理:**其基于的理念是一致性胜于一切。当模型针对一个问题生成多个答案时,出现频率高的答案被认为更有可能是正确的。因为错误答案往往是随机产生、彼此不一致的,而多次生成相同或相似的答案,说明模型在推理过程中达到了某种共识,这种共识体现了答案的可靠性。
在这里插入图片描述

2.代码(观察执行结果)

from openai import OpenAI# 加载 .env 文件到环境变量
from dotenv import load_dotenv, find_dotenv
_ = load_dotenv(find_dotenv())client = OpenAI()prompt = "当我6岁时,我的妹妹是我一半年龄,现在我60岁,我的妹妹多少岁?"
prompt2 = "当我6岁时,我的妹妹是我一半年龄,我现在60岁,我的妹妹多少岁?"
prompt3 = "当我6岁时,我的妹妹是我一半年龄,我现在60岁啦,我的妹妹多少岁?"
def get_completion(prompt, model='gpt-3.5-turbo'):messages = [{"role":"user","content":prompt}]response = client.chat.completions.create(model=model,messages=messages)return response.choices[0].message.contentprint("-----第一次问:")
print(get_completion(prompt))
print("-----第二次问:")
print(get_completion(prompt2))
print("-----第三次问:")
print(get_completion(prompt3))

答案:

-----第一次问:
53岁。
-----第二次问:
当你6岁时,你的妹妹是你一半的年龄,即3岁。因此,年龄差为3年。现在你60岁,妹妹的年龄是60 - 3 = 57岁。所以,你的妹妹现在57岁。
-----第三次问:
妹妹现在应该是54岁。

再次运行(什么都不改):

-----第一次问:
当我6岁时,我的妹妹是我一半年龄,也就是3岁。现在我60岁,根据这个逻辑,我的妹妹现在应该是57岁。
-----第二次问:
如果当你6岁的时候,你妹妹是你一半的年龄,那么她当时就是3岁。现在你60岁了,所以你妹妹应该是60-6+3=57岁。
-----第三次问:
当你6岁时,你的妹妹是你一半的年龄,即3岁。你比妹妹大3岁。现在你60岁,所以你的妹妹是60 - 3 = 57岁。

3.自洽性核心思想

核心思想:多数投票胜出


http://www.ppmy.cn/news/1578228.html

相关文章

openwrt路由系统------lua、uci的关系

1. Luci 的核心组成 (1) Lua 简介:Luci 的界面和逻辑几乎完全使用 Lua 脚本语言编写。Lua 是一种轻量级、高效的嵌入式脚本语言,适合在资源受限的路由器环境中运行。作用: 生成动态 Web 页面(与后端交互渲染 HTML)。处理用户提交的表单数据(如修改 Wi-Fi 密码)。调用系…

在uni-app中使用SQLite实现离线下数据同步:从封装到实践

场景: 在移动应用开发中,确保应用在无网络连接时仍能正常运行并进行数据同步至关重要。 对于uni-app开发者而言,SQLite是理想的本地存储解决方案,支持结构化数据的存储和检索。本文将介绍如何在uni-app项目中使用SQLite实现离线…

【AI学习从零至壹】Pytorch逻辑回归

Pytorch逻辑回归 线性回归简单线性回归的参数估计概率和似然的区别 最⼤似然估计似然函数对数似然函数 逻辑回归梯度下降法下⼭问题梯度与学习率学习率 梯度下降法的模拟与可视化学习率对梯度的影响学习率的最佳取值 梯度更新逻辑回归模型构建及训练流程 线性回归 线性回归的⽬…

创建Electron35 + vue3 + electron-builder项目,有很过坑,记录过程

环境: node v20.18.0 npm 11.1.0 用到的所有依赖: "dependencies": {"core-js": "^3.8.3","vue": "^3.2.13","vue-router": "^4.5.0"},"devDependencies": {"ba…

React基础之useInperativehandlle

通过ref调用子组件内部的focus方法来实现聚焦 与forwardRef类似,但是forwardRef是通过暴露整个Ref来实现,而useInperativehandle是通过对外暴露一个方法来实现的 import { forwardRef, useImperativeHandle, useRef, useState } from "react";…

软件测试の概念之测试分类质量模型测试用例

什么是软件测试 使用技术手段验证软件是否满足使用需求的过程 软件测试用于保证软件质量的可靠性 设计对软件系统进行评估,发现其中的错误,缺陷和问题,并确保软件符合规范和用户需求。 软件测试目的 减少软件缺陷(bug),保证软件的质量 软件测试工程…

R语言和RStudio安装

整体还是比较简单的,主要是记录个流程。 官方镜像站列表R语言官网 1 安装R(2025/3/6) R语言官网:The R Project for Statistical Computing 打开之后就Hello world一下吧 配置环境变量 2 安装RStudio 下载地址:htt…

通义万相2.1开源版本地化部署攻略,生成视频再填利器

2025 年 2 月 25 日晚上 11:00 通义万相 2.1 开源发布,前两周太忙没空搞它,这个周末,也来本地化部署一个,体验生成效果如何,总的来说,它在国内文生视频、图生视频的行列处于领先位置&#xff0c…