RAG是“Retrieval-Augmented Generation”的缩写,这是一种自然语言处理(NLP)技术,用于增强生成式模型的性能,尤其是在问答、文本摘要、对话系统等任务中。RAG结合了检索(Retrieval)和生成(Generation)两个阶段,以提高模型对信息的处理和回应的质量。
在RAG系统中,首先使用检索组件在一个大型的文档集合中寻找与输入查询相关的信息或文档。这一步骤的目的是从广泛的知识源中快速提取出相关信息,这些信息随后将作为上下文或证据,辅助生成组件产生回答或输出。
检索到的信息之后会被传递到生成模型,如基于Transformer的语言模型(例如GPT系列、BART等)。生成模型利用检索到的内容和原始查询共同生成回答或输出文本。这种方法允许模型访问和利用检索到的外部知识,从而生成更准确、更丰富的回答。
RAG技术的一个典型应用是在问答系统中,它能够提供比传统生成式模型更准确的答案,因为它结合了大量的外部知识。同时,RAG也在其他领域显示出潜力,如文本摘要、文章生成、对话系统等。
搜索系统也可利用这些信息,喂给大型语言模型(LLM)进行训练。RAG在LLM已有的强大能力之上,进一步增强了其访问特定行业或机构内部知识库的功能,而且无须对模型执行重新训练。这种做法为经济有效地提升LLM输出质量提供了途径,确保其输出在多种场合下都维持着相关性、准确性和可用性。