自然语言处理: RAT = CoT + RAG

ops/2024/10/11 11:21:18/

Retrieval Augmented Thoughts (RAT) 是一种协同思维链 (CoT) 和检索增强生成 (RAG) 的 AI 提示策略,助力解决具有挑战性的长任务推理和生成。

RAG

有关于RAG的介绍可以参考我之前的博文: 自然语言处理: 第十五章RAG(Retrieval Augmented Generation)
开发能够像人类一样思考、推理并解决复杂问题的模型一直是人工智能研究的关键目标。大规模语言模型(LLM)处于此类研究的最前沿,旨在模拟人类对概念的理解和表达。然而,LLM在确保长任务推理中的事实准确性方面仍然面临着巨大挑战,经常会出现所谓的“幻觉”(hallucination)——模型会生成看似合理但实际上并不准确的信息。这种现象在需要一系列逻辑推理的场景中尤其明显,凸显了LLM在长任务推理过程中、精确推理和理解上下文的能力方面的差距。

为弥合这一差距,研究人员提出了各种方法旨在改进 LLM 的推理过程。一些较早的方法尝试将外部信息检索与模型生成的内容相结合,以确保模型输出的事实准确性。然而,这些方法通常无法动态地改进推理过程,导致产生的结果虽然有所改善,却仍然未能达到理想的上下文理解和准确性水平。

来自北京大学、加州大学洛杉矶分校和北京通用人工智能研究院的研究人员提出的 Retrieval Augmented Thoughts (RAT) 方法,旨在直接解决 LLM 中的事实准确性问题。RAT 是一种着重于迭代修正模型生成思路的新方法。通过利用与初始查询以及模型推理过程相关变动的信息,RAT 有效地缓解了幻觉问题。具体实现方法为:用从大型数据库中检索到的相关信息,去修正模型生成思维链的每一步,确保每个推理步骤都基于准确和相关的事实。

RAT 方法在各种长任务生成任务中表现出色,从生成复杂的代码到解决复杂的数学问题,以及撰写创意叙事、规划模拟环境中的行动方案。RAT 能稳定地提升 LLM 的性能,带来显著的性能提升。例如,代码生成任务的评分平均提高了 13.63%,数学推理的评分提高了 16.96%,创意写作的评分提高了 19.2%,在具体任务规划中的表现更是提升了 42.78%。这些成绩凸显了 RAT 作为一种通用解决方案在增强 LLM 推理能力方面的有效性和潜力。

在这里插入图片描述

RAT 的实现显示了LLM有可能达到一种更接近人类的推理和生成响应的能力。**通过使用与上下文相关的信息去迭代优化思考过程,该方法拓展了 LLM 可以实现目标的边界,**为人工智能生成内容的准确性、可靠性和语境意识设定了新的标准。
在这里插入图片描述

Retrieval Augmented Thoughts (RAT) 方法可以概括为以下几点:

  • 缩小了 LLM 在长任务推理中维持事实准确性能力方面的差距。
  • 通过用相关的检索信息来修正每个推理步骤,缓解了幻觉问题,确保输出结果高度贴合语境。
  • 在各种任务中展示了通用性,包括代码生成、数学推理、创意写作和任务规划,具有广泛的应用潜力。 为 LLM
  • 输出的性能、准确性和可靠性设定了新的基准,为 AI 推理能力的未来发展铺平了道路。

http://www.ppmy.cn/ops/34556.html

相关文章

百度下拉框负面信息如何删除?

百度头条360等搜索引擎,作为人们获取信息的主要途径之一。然而,一些知名的企业或个人可能会面临在搜索的下拉框中出现负面信息的问题,这可能对其声誉和形象造成不良影响。小马识途营销顾问根据自身从业经验,针对这类情况提出以下建…

发那科Fanuc数控网络IP配置设定教程

1.在主面板如图按system键,进入系统界面 2.按右翻页切换键,切换到内嵌选项,按内嵌按钮跳转至设置IP界面,设置ip 3.按Focas2按钮,跳转至设置端口号和超时时间界面。设置端口号和时间之后,重启设备。注意&…

[论文笔记]Longformer: The Long-Document Transformer

引言 今天带来论文Longformer: The Long-Document Transformer的笔记。 基于Transformer的模型由于其自注意力操作而无法处理长序列,该操作随着序列长度呈二次扩展。为了解决这一限制,本篇工作提出了Longformer,其注意力机制随着序列长度呈…

C#窗体控件ColorDialog

介绍 可以获取颜色,然后对其他控件的颜色属性进行设置。 构造方式 直接把ColorDialog控件拖动到Form窗口。 常用属性 AllowFullOpen 可以控制是否使用自定义颜色,true表示可使用,否,表示不可使用。 AnyColor 如果为tr…

如何评价2023年第八届数维杯数学建模ABC题?

2024年第九届数维杯大学生数学建模挑战赛将于北京时间2024年5月10日08:00至5月13日09:00举行,竞赛倒计时17天,近期准备参加的同学还是很迷茫,不知道如何选题解题,今天整理数维杯选题策略,这里也预祝同学们在竞赛中取得好成绩! 竞赛特点 数维杯大学生数学建模挑战赛每年分…

文件传送协议

壹、文件传输协议FTP 一、FTP简介 文件传送协议FTP曾是互联网上使用最广泛的协议; 在互联网发展的早期阶段,用FTP传送文件约占整个互联网的通信量的三分之一;知道1995年,www的通信量才首次超过FTP。 FTP实现的是通过网络实现异…

01-JDK安装(Window环境和Linux环境)

1. Windows环境安装JDK 1.1 Oracle官网下载需要版本的JDK 官网传送门https://www.oracle.com/java/technologies/downloads/#java8-windows下载完成之后 以管理员身份(管理员!管理员!)运行下载的exe文件 期间修改需要安装的路径…

C#知识|面向对象编程中实例方法的封装与应用总结

哈喽,你好,我是雷工! 本节学习面向对象编程中实例方法的封装与应用,以下为学习笔记。 01 方法定义 访问修饰符 返回值类型 方法名(参数1,参数2……) {//此处编写方法的主要内容,功能实现的具体过程 return 返回值;//如果方法有返回值需要此语句,如果没有返回值,那…