LLM论文笔记 25: Chain-of-Thought Reasoning without Prompting

embedded/2025/3/17 5:26:27/
  • Arxiv日期:2024.5.31
  • 机构:Google DeepMind

关键词

  • cot-decoding
  • 推理路径
  • pretrain

核心结论

1. LLMs 不需要prompting就可以生成链式推理路径,prompting只是将这些能力显性化的一种手段

2. cot path 往往与更高的model confidence相关,可以用作可靠性的metric

3. 探索多样化的解码路径能有效挖掘模型的内在推理能力,而不仅仅依赖于模型规模或训练数据的多样性

4. CoT-Decoding 可以弥补模型未经过指令调优时的推理能力缺陷,并在指令调优的模型中进一步优化性能

5. Cot-Decoding适用于多种任务和语言模型,显示出显著的通用性和鲁棒性

主要方法

(验证了内在推理能力的存在)使用pretrain模型,不使用greedy decoding,而是在第一个token预测使用top-k发现内化cot推理能力,且带cot的答案置信度更高

置信度衡量标准:

answer中每一个token在NTP时当前token和下一个token的概率差异

注:本系列不包括基础的知识点讲解,为笔记/大纲性质而非教程,用于论文知识点和思想和快速记忆和回顾,更多细节建议阅读论文原文


http://www.ppmy.cn/embedded/173257.html

相关文章

DeepSeek-R1:开源大模型的技术革命与行业影响分析

一、发布背景与开发者定位 DeepSeek-R1由幻方量化旗下AI公司深度求索(DeepSeek)于2025年1月20日正式发布,标志着中国AI公司在生成式大模型领域取得突破性进展。该模型的推出具有多重战略意义: 技术突破性:作为全球首…

使用 Docker 部署前端项目全攻略

文章目录 1. Docker 基础概念1.1 核心组件1.2 Docker 工作流程 2. 环境准备2.1 安装 Docker2.2 验证安装 3. 项目配置3.1 项目结构3.2 创建 Dockerfile 4. 构建与运行4.1 构建镜像4.2 运行容器4.3 访问应用 5. 使用 Docker Compose5.1 创建 docker-compose.yml5.2 启动服务5.3 …

数学建模历程之初见

第一次接触数学建模是在上大学前,当时只是听过。起源于我在大学的老乡群里聊天,由于当时年轻有点傻,说的话太多了,什么都问哈哈哈哈哈。 后来有个学长从老乡群里加我,问我怎么话那么多,你们懂当时对我幼小…

从Online Softmax到FlashAttention

目录 前言0. Abstract1. The Self-Attention2. (Safe) Softmax3. Online Softmax4. FlashAttention结语参考 前言 最近在学习 FlashAttention,看到一份不错的手稿分享下🤗 manuscript:From Online Softmax to FlashAttention 0. Abstract Fl…

golang开发支持onlyoffice的token功能

一直都没去弄token这块,想着反正docker run的时候将jwt置为false即可。 看了好多文章,感觉可以试试,但是所有文件几乎都没说思路。 根据我的理解和成功的调试,思路是: 我们先定义2个概念,一个是文档下载…

电子招采软件系统,如何实现10年可追溯审计

一、在当前经济环境下,中小企业面临着巨大的生存压力,传统产业的数字化转型迫在眉睫。AI技术为企业的低成本高效发展提供了新机会,混合办公成为新常态,数据安全法的深入落实则进一步推动企业重视数据安全。区块链存证技术凭借独特…

Mac下安装Zed以及Zed对MCP(模型上下文协议)的支持

Zed是当前新流行的一种编辑器,支持MCP(模型上下文协议) Mac下安装Zed比较简单,直接有安装包,在这里: brew install --cask zedMac Monterey下是可以安装上的,亲测有效。 配置 使用CtrlShiftP…

游戏引擎学习第157天

今天的计划 目标是完整制作一款游戏,从头到尾的开发过程完全展示。过程中没有使用任何游戏引擎或库,目的是展示一个全面的游戏开发过程,包括每一个细节,从最基础的像素开始,直到最终的视觉效果。在整个过程中&#xf…