【GPT入门】第9课 思维树概念与原理

server/2025/3/11 5:05:35/

【GPT入门】第9课 思维树概念与原理

  • 1.思维树概念与原理
  • 2. 算24游戏的方法

1.思维树概念与原理

思维树(Tree of Thought,ToT )是一种大模型推理框架,旨在解决更加复杂的多步骤推理任务,让大模型能够探索多种可能的解决方案路径 ,并选出最优解。以下为你详细介绍:

  • 起源与背景:由普林斯顿和谷歌DeepMind联合提出。在大模型发展中,前谷歌大脑华人科学家Jason Wei提出的思维链(CoT)能增强大模型推理能力,但存在局限性。现有使用大模型解决通用问题的方法,局部上未充分探索思维过程的不同延续,总体上缺乏计划、前瞻或回溯机制。为解决这些问题,研究者提出了思维树框架。
  • 核心原理 :将问题解决视为在一棵思维树上进行搜索,每个节点都是一个状态,代表输入和思维序列的部分解。具体执行任务时需回答4个关键问题:
    • 思维分解:根据问题属性,将中间过程分解为合适的思维步骤。想法的粒度要恰当,既不能过大导致大模型难以连贯生成,也不能过小而无法评估其对解决问题的作用。
    • 思维生成器:基于树的当前状态,通过从思维链提示采样思维,或直接提出不同想法这两种策略,为下一个思维步骤生成多个候选者。
    • 状态求值器:评估不同状态在解决问题上的进展情况,以此作为搜索算法的启发式算法,来判断哪些状态值得继续探索以及探索的先后顺序。可以对每个状态独立赋值,也可以跨状态投票。
    • 搜索算法:根据思维树的结构,选用合适的搜索算法,如广度优先搜索(BFS)和深度优先搜索(DFS) 。BFS每一步维护一组最有希望的状态;DFS先探索最有希望的状态,必要时回溯到父状态继续探索。
  • 与思维链的关系:思维链是让大模型生成一系列中间推理步骤来增强逻辑推理,而思维树是在思维链基础上的进一步发展。思维链是线性的推理路径,思维树则允许模型尝试多种不同的推理思路,进行自我评估、选择下一步行动方案,还能在必要时回溯,使大模型思维更加灵活和全面。
  • 应用案例
    • 24点游戏:将模型的思维过程分解为3个步骤,每个步骤是一个中间方程。利用思维树进行宽度优先搜索,每一步保留最好的若干候选项,并让大模型评估每个思维候选项达成目标的可能性,基于常识消除不可能的部分,最终大幅提升问题解决成功率。
    • 创意写作:对于给定多个随机句子,要求输出连贯段落的任务。构建深度为2的思维树,大模型先生成中间思维步骤,探索不同写作思路,然后基于这些思路生成最终的连贯段落,激发创造性思维以及高级规划能力。
    • 迷你填字游戏 :思维树可以帮助大模型在填字过程中,探索不同的单词选择和填写顺序,通过评估每个状态来逐步完成填字任务,提高填字的准确率和效率。
      在这里插入图片描述

2. 算24游戏的方法

在这里插入图片描述


http://www.ppmy.cn/server/174098.html

相关文章

RPA 职业前景:个人职场发展的 “新机遇”

1. RPA职业定义与范畴 1.1 RPA核心概念 机器人流程自动化(RPA)是一种通过软件机器人模拟人类操作,自动执行重复性、规则性任务的技术。RPA的核心在于其能够高效、准确地处理大量数据和流程,减少人工干预,从而提高工作…

【单片机】ARM 处理器简介

ARM 公司简介 ARM(Advanced RISC Machine) 是英国 ARM 公司(原 Acorn RISC Machine) 开发的一种精简指令集(RISC) 处理器架构。ARM 处理器因其低功耗、高性能、广泛适用性,成为嵌入式系统、移动…

单例模式:确保一个类只有一个实例

目录 引言 1. 单例模式的核心思想 2. 单例模式的实现方式 2.1 饿汉式单例 2.2 懒汉式单例 2.3 线程安全的懒汉式单例 2.4 双重检查锁定(Double-Checked Locking) 2.5 静态内部类实现单例 2.6 枚举实现单例 3. 单例模式的使用场景 4. 单例模式…

Vue 系列之:Vuex 和 Pinia

前言 每一个 Vuex 应用的核心就是 store(仓库)。“store”基本上就是一个容器,它包含着你的应用中大部分的状态 (state)。Vuex 和单纯的全局对象有以下两点不同: Vuex 的状态存储是响应式的。当 Vue 组件从 store 中读取状态的时…

数据分析和可视化课程实验报告一(数据分析基础)

实验题目: 数据分析基础 实验目的:1.掌握 Anaconda与 Jupyter Notebook的安装与使用方法 2.掌握 NumPy 创建数组、矩阵的方法以及常用的方法 3.掌握 NumPy 统计分析方法 …

C++ 滑动窗口

前言 C 中滑动窗口分两种,一种是给定窗口长度,还有一种是不定长窗口长度。 本篇文章主要讲解这两种状态的滑动窗口,结合例题让读者更好的理解 一、给定窗口长度K 一般的,对于给定窗口长度的题,通常要求我们对窗口内…

新型神经网络KAN:准确性高且易于解释

人工神经网络(ANN)是现代人工智能的核心技术,广泛应用于聊天机器人、图像生成器等领域。然而,传统的神经网络由于其复杂的结构和大量的神经元连接,往往被视为“黑匣子”,难以解释其内部工作原理。近年来&am…

nginx配置反向代理服务器,实现在https网站中请求http资源

文章目录 一、前言二、Nginx反向代理的工作原理三、Nginx反向代理的主要功能‌四、Nginx反向代理的配置和使用场景五、实战配置5.1 首先,修改宝塔面板配置5.2 接着配置代理服务器5.3 完成上面所有配置后5.4最后还要在原来的index.html文件里添加5.5 或者可以操作服务…