使用Azure AI Search和LlamaIndex构建高级RAG应用

devtools/2024/10/18 16:49:57/

RAG 是一种将公司信息合并到基于大型语言模型 (LLM) 的应用程序中的常用方法。借助 RAG,AI 应用程序可以近乎实时地访问最新信息,团队可以保持对其数据的控制。

RAG 中,您可以评估和修改各个阶段以改进结果,它们分为三类:预检索、检索和检索后。

  1. 预检索可提高使用查询重写等技术检索的数据的质量。
  2. 检索使用混合搜索和语义排序等高级技术改进结果。
  3. 检索后侧重于优化检索信息和增强提示。

LlamaIndex 为初学者和有经验的开发人员提供了一个全面的框架和生态系统,以在其数据源上构建 LLM 应用程序。

Azure AI Search是一个信息检索平台,具有尖端的搜索技术和无缝的平台集成,专为任何规模的高性能生成式 AI 应用程序而构建。

我们在预检索中使用LlamaIndex 进行查询转换,并使用 Azure AI 搜索进行高级检索,可以生成构建更好的RAG应用程序。

预检索技术和优化查询编排

为了优化预检索,LlamaIndex 提供了查询转换,这是一项优化用户输入的强大功能。一些查询转换技术包括:

  • 路由:保持查询不变,但标识查询应用到的相关工具子集。将这些工具输出为相关选项。
  • 查询重写:保持工具不变,但以各种不同的方式重写查询,以针对相同的工具执行。
  • 子问题:将查询分解为不同工具上的多个子问题,由其元数据标识。
  • ReAct 代理工具选取:给定初始查询,确定 (1) 要选取的工具,以及 (2) 要在工具上执行的查询。

以查询重写为例:查询重写使用 LLM 将初始查询重新表述为多种形式。这使开发人员能够探索数据的不同方面,从而产生更细致和准确的响应。通过重写查询,开发人员可以生成多个查询,用于集成检索和融合检索,从而获得更高质量的检索结果。利用 Azure OpenAI,可以将初始查询分解为多个子查询。

请考虑以下初始查询:

“作者怎么了?”

如果问题过于宽泛,或者似乎不太可能在我们的语料库文本中找到直接的比较,建议将问题分解为多个子查询。

子查询:

  1. “作者最近写的一本书是什么?”
  2. “作者获得过什么文学奖吗?”
  3. “有没有即将举行的活动或对作者的采访?”
  4. “作者的背景和写作风格是什么?”
  5. “围绕作者有什么争议或丑闻吗?”

子问题查询引擎

LlamaIndex 的一大优点是,像这样的高级检索策略是内置在框架中的。例如,可以使用子问题查询引擎在一个步骤中处理上述子查询,该引擎将问题分解为更简单的问题,然后将答案组合成一个响应。

 response = query_engine.query("What happened to the author?")

  

使用 Azure AI 搜索进行检索

为了增强检索功能,Azure AI 搜索提供混合搜索和语义排名。混合搜索同时执行关键字和向量检索,并应用融合步骤(倒数秩融合 (RRF))从每种技术中选择最佳结果。

语义排名器在初始 BM25 排名或 RRF 排名结果上添加辅助排名。该二级排名使用多语言深度学习模型来推广语义上最相关的结果。

通过将“query_type”参数更新为“semantic”,可以很容易地启用语义排名器。由于语义排名是在 Azure AI 搜索堆栈中完成的,因此我们的数据显示,语义排名器与混合搜索相结合是提高相关性的最有效方法。

此外,Azure AI 搜索还支持矢量查询中的筛选器。您可以设置筛选器模式,以便在矢量查询执行之前或之后应用筛选器:

  • 预筛选模式:在查询执行前应用筛选,减少向量搜索算法查找相似内容的搜索表面积。预滤波通常比后滤波慢,但有利于召回率和精确度。
  • 筛选后模式:在查询执行后应用筛选器,缩小搜索结果范围。后过滤比选择更注重速度。

总结

通过与 LlamaIndex 的协作,可以提供更简单的方法来优化预检索和检索,以实现高级 RAG应用。


http://www.ppmy.cn/devtools/10011.html

相关文章

jenkins修改全局安全配置之后登录错误

教训(流泪) 事情是这样的,第一次我需要用单点登录集成jenkins,jenkins可以通过插件的方式支持cas协议,我当时也不很懂,经过我学网上的一顿乱配置,jenkis上不去了,虽然这是公司本地环…

如何将本地项目上传到gitlab

具体步骤如下: 1. 登录 gitLab账号,成功创建一个项目文件,生成对应的http/https地址 2.打开本地项目,初始化git $ git init 3.将本地git和服务器上的连接(确保项目没有其他远程连接的服务器端口) $ gi…

LINUX固定USB设备名称

在Linux系统中,USB串口设备的名称通常是根据设备连接的顺序动态分配的。因此,当设备重新连接时,它可能会被分配不同的设备文件名(如/dev/ttyUSB0、/dev/ttyUSB1等)。要固定USB串口设备的名称,你可以使用ude…

抖音ip切片带货靠谱吗?抖音切片带货怎么拿授权?切片视频带货详细教程来了,单条视频收益500~800

今天分享一个真正做到让关注我们的粉丝朋友,学到、学懂、能落地,每一次项目分享都秉承高收益、低风险,可行性,有结果的原则,新手朋友可以直接按照我们分享的流程快速上手操作项目,项目老鸟们能够掌握更多信…

【Web前端笔记14】函数与对象

提示:本文开始正式进入JavaScript的重点学习,各位友友们看完别忘了点赞收藏哦,以防下次找不到咯! 文章目录 前言一、函数概述1.函数的声明2.函数名的提升3.函数的属性和方法4.函数作用域5.函数参数6.函数返回值7.自执行函数二、对象概述

【Spring Cloud】服务容错中间件Sentinel进阶——五大规则

文章目录 Sentinel的概念和功能基本概念资源规则 重要功能流量控制熔断降级系统负载保护 SentineI 规则流控规则简单配置配置流控模式直接流控模式关联流控模式链路流控模式 配置流控效果 熔断规则慢调用比例异常比例异常数 热点规则热点规则简单使用热点规则增强使用 授权规则…

类似nohup在windows通过cmd后台运行进程方法

Linux后台运行进程时,通常使用如下方法: nohup "运行的内容" &windows相应功能的命令行如下(此方法进程有页面,可能会在桌面展示,关闭窗口后进程消失。 call start /min "n" "运行的内容"cmd…

WEB攻防-ASP安全-ASP后门植入连接

windows2003环境搭建,可参考上一篇WEB攻防-ASP安全-MDB下载-CSDN博客 将aspcms解压到C:\inetpub\wwwroot,创建网站并赋予internet来宾用户权限 配置启用父路径和主页指向 上一篇文章提到,数据库文件后缀为asp、asa会被执行解析,所以当进行访…