Milvus Cloud 向量数据库Reranker成本比较和使用场景

embedded/2024/9/23 3:52:35/

成本比较:向量检索 v.s. Cross-encoder Reranker v.s. 大模型生成

 

虽然 Reranker 的使用成本远高于单纯使用向量检索的成本,但它仍然比使用 LLM 为同等数量文档生成答案的成本要低。在 RAG 架构中,Reranker 可以筛选向量搜索的初步结果,丢弃掉与查询相关性低的文档,从而有效防止 LLM 处理无关信息,相比于将向量搜索返回的结果全部送进 LLM 可大大减少生成部分的耗时和成本。

5544ee6e26134dc285f76615aa564371.png

 

举一个贴近实际的例子:第一阶段检索中,向量搜索引擎可以在数百万个向量中快速筛选出语义近似度最高的 20 个文档,但这些文档的相对顺序还可以使用 Reranker 进一步优化。虽然会产生一定的成本,但 Reranker 可以在 top-20 个结果进一步挑出最好的 top-5 个结果。那么,相对更加昂贵的 LLM 只需要分析这 top-5 个结果即可,免去了处理 20 个文档带来的更高成本和注意力“涣散”的问题。这样一来,我们就可以通过这种复合方案平衡延迟、回答质量和使用成本。

af016d77de344c7796ee8a3e6e0539ff.png

 

哪种情况适合在 RAG 应用中使用 Reranker?


http://www.ppmy.cn/embedded/22848.html

相关文章

Spark调优-解决job任务运行超时或者慢的问题

1 三个参数各自的作用(都配置在spark-default.conf文件中) 1.1 spark.shuffle.io.connectionTimeout (默认值是120s) 这个参数设置了在 shuffle 过程中,当一个 reduce 任务尝试从 map 任务读取数据时,建立连接的超时时间。如果在这个时间内连接没有成功建立,那么 redu…

python利用urllib和xpath爬取并保存图片

概要 在网络时代,图片是信息传递的重要形式之一,而Python作为一种多用途的编程语言,可以用来编写爬虫从网页上获取图片,并保存到本地。本文将介绍如何使用Python爬虫实现这一功能,并探讨一些进阶技巧。 实现 &#x…

深度学习的炼金术:转化数据为黄金的秘密

深度学习的炼金术:转化数据为黄金的秘密 1 引言 在现代深度学习的壮阔疆域中,数据是王冠上耀眼的宝石,而性能优化则是锻造这顶王冠的炼金术。这份融合了数据和算法魔力的艺术,不仅仅依赖于强大的计算资源和复杂的网络结构&#x…

Mysql(数据库)知识详解【6】~{锁,架构}

数据库锁和架构是两个不同的概念,但它们都与数据库管理系统(DBMS)的性能和并发控制有关。 数据库锁: 数据库锁是一种同步机制,用于控制多个事务对共享资源的访问。锁可以确保数据的一致性和完整性,防止多个…

vscode 如何断点调试ros1工程

在vscode中断点调试ros1工程主要分为以下几步: 1. 第一步就是修改cmakelist.txt,到调试模式。 将CMAKE_BUILD_TYPE原来对应的代码注释掉,原来的一般都不是调试模式。加上下面一行代码,意思是设置调试模式。 # 断点调试 SET(CMAK…

Redis__数据类型

文章目录 😊 作者:Lion J 💖 主页: https://blog.csdn.net/weixin_69252724 🎉 主题:Redis__数据类型 ⏱️ 创作时间:2024年04月28日 ———————————————— 这里写目录标题 文…

react怎么制作选项卡

在React中制作选项卡(Tabs)是一个常见的需求,下面是一个简单的步骤和示例代码,用于创建一个基本的选项卡组件。 首先,我们需要定义选项卡组件的状态和结构。每个选项卡都有一个标签(label)和一…

HarmonyOS开发案例:【闹钟】

介绍 使用后台代理提醒,实现一个简易闹钟。要求完成以下功能: 展示指针表盘或数字时间。添加、修改和删除闹钟。展示闹钟列表,并可打开和关闭单个闹钟。闹钟到设定的时间后弹出提醒。将闹钟的定时数据保存到轻量级数据库。 相关概念 [Canva…