记录些RAG-Fusion、Agent、NL2SQL的问题

devtools/2024/9/20 4:00:23/ 标签: 人工智能, 自然语言处理, 语言模型

RAG-Fusion 

RAG-Fusion 的实现原理

  1. Query Duplication with a Twist:用 LLM 根据用户的 Query 生成几个相关的但不同的 Queries。
  2. Vector Search Unleashed:对原 Query 和生成的 Queries 都进行向量(或者其他方式的)搜索。
  3. Intelligent Reranking:使用 Reciprocal Rank Fusion 对搜索结果进行重新排序,挑选前 N 个。
  4. Eloquent Finale:把挑选的结果和问题一起,发给 LLM 让他生成最终的结果。

代码实现:GitHub - Raudaschl/rag-fusion 

关键就是两步:生成多个 Queries,以及整合排序

Reciprocal Rank Fusion (RRF)

使用不同的 query 去检索知识(doc),然后用 RRF 把搜索结果统一起来。

RRF 算法很简单,就是把 doc 在不同的排序中的排名汇总起来。

RRF论文地址:https://plg.uwaterloo.ca/~gvcormac/cormacksigir09-rrf.pdf

RAG-Fusion 的优缺点

优点:能更全面理解用户的意图,能获得更相关的知识。

缺点:Prompt的长度,可能让 LLM 迷失,另一方面则是要适应 LLM 上下文窗口的长度。

LangChain 实现

rag-fusion | 🦜️🔗 LangChain

LlamaIndex 实现

Rag fusion query pipeline - LlamaIndex

四种 Agent 设计模式

  1. 自我反思(Reflection):可以自我修正;
  2. 使用工具(Tool Use):链接其他系统去做一些事情,比如把电脑里面的未归档文件做好归档;
  3. 规划(Planning):类似于思维链,分解复杂任务,找到路径;
  4. 协作(Multiagent Collaboration):不同类型的助理(agent),可以通过协作组成一个团队。

NL2SQL的准确性问题和框架

NL2SQL的准确性问题 


http://www.ppmy.cn/devtools/24504.html

相关文章

Oracle 表分区

1.概述 分区表就是将表在物理存储层面分成多个小的片段,这些片段即称为分区,每个分区保存表的一部分数据,表的分区对上层应用是完全透明的,从应用的角度来看,表在逻辑上依然是一个整体。 目的:提高大表的查…

前端实现base64编码图片的导出、图片添加描述文字导出

1. base64编码图片的导出 调用handleDownload方法,传入图片的base64编码,将图片进行导出保存: // base64 转换blob对象 const base64ToBlob (base64: string) > {// 将Base64编码的字符串按;base64,拆分,得到内容类型和二进…

知识图谱:技术维度与应用实践

知识图谱是一种交叉技术领域,它结合了自然语言处理(NLP)、机器学习、计算机视觉(CV)等多种技术,用于构建和应用丰富的数据结构。本文将详细介绍知识图谱的技术维度、核心算法、以及在不同领域的应用实践。 …

摇杆控制电机

参考: 摇杆电位器控制步进电机正反转调速-Arduino中文社区 - Powered by Discuz! 一个基于树莓派和Python的无人机视觉跟踪系统_ 北漠苍狼的专栏(QQ:1746430162)-CSDN博客

junit组件的使用

JUnit 是一个广泛使用的 Java 单元测试框架,它帮助开发者编写可重复运行的测试用例来验证代码的正确性。下面是使用 JUnit 进行单元测试的基本步骤和一些关键概念: 安装与配置 依赖管理:如果你使用的是 Maven 或 Gradle 等构建工具&#xff…

JavaEE 初阶篇-深入了解特殊文件(Properties 属性文件、XML)

🔥博客主页: 【小扳_-CSDN博客】 ❤感谢大家点赞👍收藏⭐评论✍ 文章目录 1.0 Properties 属性文件概述 1.1 Properties 属性文件特性与作用 1.2 使用 Properties 把键值对数据写出到属性文件中 1.3 使用 Properties 读取属性文件里的键值对数…

稳扎稳打 部署丝滑 开源即时通讯(IM)项目OpenIM源码部署流程(linux windows mac)

背景 OpenIM包含多个关键组件,每个都是系统功能必不可少的一部分。具体来说,MongoDB 用于持久化存储;Redis 用作缓存;Kafka 用于消息队列;Zookeeper 用于服务发现;Minio 用于对象存储。这些组件的众多可能会…

ChatGPT使用指南:Prompt简单提示词

在使用ChatGPT或其他基于AI的聊天模型时,有效地构建prompt(提示词或指令)是非常重要的。好的prompt可以帮助模型更准确地理解您的需求,并提供更贴切的回答。以下是一些构建高效prompt的技巧和示例。 1. 明确具体 当您向ChatGPT提…

C# wpf 运行时替换方法实现mvvm自动触发刷新

文章目录 前言一、如何实现?1、反射获取属性2、定义替换方法3、交换属性的setter方法 二、完整代码1、接口2、项目 三、使用示例1、倒计时(1)、继承ViewModelBase(2)、定义属性(3)、属性赋值&am…

TCP协议在物联网中实战

一、TCP协议介绍 网上对TCP协议介绍众多,本人按照自己的理解简单介绍一下。 TCP(Transmission Control Protocol, 传输控制协议)是一种面向连接的、可靠的、基于字节流的传输控制层通信协议。 1.1 协议机制 1.1.1 三次握手 &…

$nextTick源码解析

this.$nextTick 是 Vue.js 内部使用的一个方法,用于在下一个 DOM 更新循环结束之后执行回调函数。 原理: nextTick 方法被调用后,会将回调函数存储在一个队列中Vue.js 会利用浏览器的异步队列机制,在 DOM 更新循环结束后执行这个队列中的所有回调函数。源码: /*** Defer…

LT1964ES5-5 低压差稳压器 200mA 贴片SOT-23-5 使用案例

LT1964ES5-5 微功耗 线性稳压器 LT1964ES5-5 是一款微功耗、低噪声、低dropout的负电压线性稳压器。它的功能是将输入电压转换为稳定的负输出电压,范围在-1.22V到-20V之间,最大输出电流为200mA。该器件特别适用于需要精密调节和低噪声电源的电路中&#…

对象存储服务的事件通知特性

AWS S3提供了事件通知的能力,即在客户应用访问对象存储时,对象存储服务可提供通知服务,支撑客户的特定应用场景,比如业务审计、计费等。 相关能力可参考官方文档。 相关API,如下: PutBucketNotificationGe…

Python AI库pandas读写数据库的应用操作——以sqlite3为例

Python AI库pandas读写数据库的应用操作——以sqlite3为例 本文默认读者具备以下技能: 熟悉python基础知识,vscode或其它编辑工具 已阅读Pandas基础操作文章,了解pandas常见操作 具备自主扩展学习能力 在数据分析和人工智能领域,pandas库和s…

【JS】找出两个数组中的相同元素与不同元素

一、找出相同元素 &#xff08;1&#xff09;方法一 const filterArr (arr1, arr2) > {let result [];for (let i 0; i < arr1.length; i) {for (let j 0; j < arr2.length; j) {if (arr1[i] arr2[j]) {result.push(arr1[i]);}}}return result; };&#xff08;…

基于迁移学习的语义句子分类器(微调一个预训练模型的案例,即迁移学习)

一、任务&#xff1a;基于迁移学习的语义句子分类器 项目介绍&#xff1a;本任务的目的是利用预训练好的模型来微调自己的微软研究释义语料库数据集&#xff0c;实现文本分类的任务&#xff0c;具体是判断两个句子的意思是否相同。在微调阶段&#xff0c;我们将整个模型的参数…

解析Redis Key Prefix配置之谜:双冒号“::”的由来与作用

前言 在使用Spring Boot集成Redis进行应用开发时&#xff0c;为了增强缓存键的可读性和管理性&#xff0c;我们常常会在配置文件中设定一个全局的key-prefix。如果你发现存储至Redis的键自动附加了“::”&#xff0c;本文将深入探讨这一现象背后的原因&#xff0c;解析Spring …

07_for循环返回值while循环

文章目录 1.循环返回值2.yield接收for返回值3.scala调用yield方法创建线程对象4.scala中的while循环5.scala中的流程控制 1.循环返回值 for循环返回值是Unit 原因是防止产生歧义&#xff1b; 2.yield接收for返回值 // 2.yield关键字打破循环&#xff0c;可以使for循环输出…

Linux抓包工具tcpdump

一、tcpdump抓包工具 1.命令格式解析 命令格式&#xff1a;tcpdump option proto dir type proto&#xff08;协议&#xff09; 1.tcp、udp、icmp 2.ip、ipv6 3.arp dir&#xff08;数据的方向 &#xff09; 1.src 192.168.7.130 只抓取源地址是7.130 2.…

Node.js 的 fs 模块分析及其应用

fs 模块&#xff0c;作为 Node.js 平台中的一个核心组件&#xff0c;主要负责处理文件系统相关的操作。该模块提供了一系列用于文件管理的功能&#xff0c;例如文件的读取、写入、更新以及删除等。 应用场景分析 fs 模块的应用范围广泛&#xff0c;下面是一些典型的使用实例&…