大语言模型RAG,transformer和mamba

news/2025/2/10 17:22:53/

1、RAG技术流总结

在这里插入图片描述
在这里插入图片描述

第一张图是比较经典的RAG知识图谱,第二张图是更加详细扎实的介绍图。

1.1 索引

坦白来说这部分的技术并不是大模型领域的,更像是之前技术在大模型领域的应用;早在2019年我就做过faiss部分的尝试,彼时索引技术已经在互联网领域得到了广泛的应用。

1、大模型需要通过向量化去建立语义理解。

通过将包含高维信息的知识降维到向量空间里,这些知识就变成了一堆数字串;此时,当用户去提问时,先将提问的知识向量化变成一串数字后,再从知识库中通过余弦计算等方式找出和用户提问数字串最相似的信息出来,这就完成了所谓的语义理解。

2、分块能够有效提升检索效率和缓解上下文长度限制。

理想状态下,在检索时将每个信息都遍历一遍肯定就不会漏信息了,但是当信息量大且不能让用户等待过久的时候,还是需要更高效和更具性价比的方式;同时,大模型一次能输入的上下文有长度限制,虽然已经有大模型将上下文长度延伸至了更高量级,但似乎实验证明更大的上下文窗口不一定对检索结果更有效。

而分块技术,则可以理解为将一篇50w字的书籍文档按照段落或者语义等方式划分成n个块。这样,既能够有效解决上下文长度限制问题,同时也对于检索有一定的效率提升;但同时也存在可能会丢失文档的全局结构、不同块之间的前后逻辑等问题(这些问题在陆续通过建立重叠上下块内容、建立块的类似索引结构等方式进行优化)。

在这里插入图片描述

1.2 检索Retrieval

当用户提问后,通过检索技术则可以从知识库中召回相关内容块。检索方式将不局限于关键词检索和向量检索,最终的形态一定是多种检索方式的结合和互补。当混合检索结束后,再通过一个Rerank的机制重新对不同渠道的检索结果做一个最终的整合和排序。

1.3 生成(Generation)

将检索得到的前 K 个文本块和用户问题一起送进大模型,让大模型基于给定的文本块来回答用户的问题。

在整个完整的RAG过程中,索引和检索将极大的影响最终生成的质量。其中索引直接决定语义保存的完整度,检索决定提供给大模型的文本质量,值得注意的是检索过程还存在rerank的过程。

在知识库问答,数据越多效果越好吗?中,有道大模型团队提出针对query大连医科大学怎么样,主要原因是第三批加入的某些文档中恰好有大连理工大学 xxx 怎么样?的句子,和 query 大连医科大学怎么样?表面上看起来确实非常像,Embedding 给它打了比较高的分。直接向量检索的情况下因为缺乏语义部分导致

而类似大连医科大学师资介绍这样的片段相关性就稍微低了些。而 LLM 输入 token 有限制,前面两个最相关但是实际并不能回答 query 问题的片段就已经占满了 token 的窗口,只能把他俩送进 LLM 里。结果可想而知,啥都不知道。

RAG知识除了可以参考前面有道团队的介绍,另外也可以参考这一篇:
一文读懂:大模型RAG(检索增强生成)含高级方法


http://www.ppmy.cn/news/1570920.html

相关文章

蓝桥杯之c++入门(一)【C++入门】

目录 前言5. 算术操作符5.1 算术操作符5.2 浮点数的除法5.3 负数取模5.4 数值溢出5.5 练习练习1:计算 ( a b ) ⋆ c (ab)^{\star}c (ab)⋆c练习2:带余除法练习3:整数个位练习4:整数十位练习5:时间转换练习6&#xff…

Tekton 可以代替 Jenkins不

Tekton 和 Jenkins 都是用于实现 CI/CD(持续集成/持续交付)管道的工具,但它们在设计理念、使用场景和功能特性上有所不同。是否可以用 Tekton 代替 Jenkins,取决于你的具体需求和使用场景。以下是对两者的详细比较,帮助…

如何在Docker中运行MySQL容器?

随着容器化技术的普及,Docker已成为开发和部署应用的首选工具之一。MySQL作为最流行的开源关系型数据库,也非常适合在Docker容器中运行。本文将介绍如何在Docker中运行MySQL容器,帮助你快速搭建一个可用的数据库环境。 1. 安装Docker 首先&a…

Proser:分隔符可以变颜色了

本着分隔符功能中关于颜色的设计原则: 打算做个简单的自定义控件,提供几个有限的颜色选择一下即可, 大多数用户,不会在这里浪费太多的心思。 新增了几个简单的自绘控件,出来后整体界面如下图: PS: 回想多年…

开源项目与工具:探索C++中的Boost库及其在网络编程中的应用

在C++的广阔生态系统中,Boost库无疑是一颗璀璨的明珠。作为一个功能强大、广泛使用的C++开源库集合,Boost为开发者提供了丰富的工具和数据结构,极大地提升了开发效率和代码质量。本文将聚焦于Boost库在网络编程领域的应用,通过实例展示如何利用Boost.Asio等组件构建高效、可…

torch.roll演算及代码测试

文章目录 1. torch.roll2. pytorch代码 1. torch.roll torch.roll 的作用是可以将矩阵A中的元素按照指定的维度移动指定步长 excel 图示: 2. pytorch代码 import torch import torch.nn as nn import torch.nn.functional as Fif __name__"__main__"…

Linux——基础命令1

$:普通用户 #:超级用户 cd 切换目录 cd 目录 (进入目录) cd ../ (返回上一级目录) cd ~ (切换到当前用户的家目录) cd - (返回上次目录) pwd 输出当前目录…

Spider 数据集上实现nlp2sql训练任务

NLP2SQL(自然语言处理到 SQL 查询的转换)是一个重要的自然语言处理(NLP)任务,其目标是将用户的自然语言问题转换为相应的 SQL 查询。这一任务在许多场景下具有广泛的应用,尤其是在与数据库交互的场景中&…