Milvus vs. ElasticSearch:向量库检索性能测试

embedded/2025/3/26 6:15:57/

目录

    • 1. 构建检索库
    • 2. 测试条件
    • 3. 测试结果
    • 4. 性能分析
    • 5. 结论

1. 构建检索库

  • 构建通用场景库总计约2万张。
  • 构建车辆数据库总计约12万张。
  • 构建公共数据库,包括Flickr30k、COCO、nlvr2、vqa等数据集约43万张。

2. 测试条件

  • 环境说明:分别单机部署Milvus和Elasticsearch。
  • 配置说明:分别基于Milvus和Elasticsearch构建三种不同规模的检索库,Embedding维度为1024,均是采用余弦相似度计算距离,采用ANN方法返回topk检索结果,其他检索条件均相同。

3. 测试结果

检索库类型检索库大小(万)ES检索性能(秒/次)Milvus检索性能(秒/次)Milvus性能优势倍数
通用场景库20.02530.00524.87
车辆数据库120.108250.0064616.76
公共数据库430.366840.0070851.82

4. 性能分析

  1. 小数据量场景(2W)

    • Milvus 性能是 ES 的 4.87 倍,表明即使在小规模数据下,Milvus 的向量检索效率仍显著优于 ES。
  2. 中大数据量场景(12W/43W)

  • 12W 数据量时,Milvus 性能提升倍数扩大至 16.76
  • 43W 数据量时,Milvus 性能优势达到 51.82
  • ES 的检索耗时随数据量增长呈非线性上升(从 0.0253s → 0.36684s),而 Milvus 仅从 0.0052s → 0.00708s,增长幅度极小。
  1. 扩展性差异
  • ES 的检索性能与数据量高度相关,说明其底层架构对大规模向量数据的处理效率存在瓶颈。

  • Milvus 则展现出优异的扩展性,其检索耗时几乎不受数据量增长影响,体现了专用向量数据库的设计优势。

5. 结论

  • Milvus 优势:专为向量检索优化,采用列式存储、近似最近邻(ANN)算法和分布式架构,在大规模场景下性能显著优于 ES。
  • ES 局限性:基于倒排索引的架构对非结构化向量数据处理效率较低,适合文本检索为主的混合场景。
  • 选型建议
    ✔️ 纯向量检索场景(尤其是数据量 >10W 时)优先选择 Milvus
    ✔️ 文本+向量混合检索场景可考虑 ES,但需接受向量性能折损

http://www.ppmy.cn/embedded/174622.html

相关文章

SVN简明教程——下载安装使用

SVN教程目录 一、开发中的实际问题二、简介2.1 版本控制2.2 Subversion2.3 Subversion的优良特性2.4 工作原理2.5 SVN基本操作 三、Subversion的安装与配置1. 服务器端程序版本2. 下载源码包3. 下载二进制安装包4. 安装5. 配置版本库① 为什么要配置版本库?② 创建目…

STM32 —— MCU、MPU、ARM、FPGA、DSP

在嵌入式系统中,MCU、MPU、ARM、FPGA和DSP是核心组件,各自在架构、功能和应用场景上有显著差异。以下从专业角度详细解析这些概念: 一、 MCU(Microcontroller Unit,微控制器单元) 核心定义 集成系统芯片&a…

【2025】部标JT808、JT1078、苏标主动安全模拟工具

支持JT808-2013、JT808-2019 除了直接客户端,还支持JT808服务端程序、JT808报文解析 下载地址:https://www.lingx.com/download.html

VSCODE右下角切换环境没用

VSCODE惦记右下角python版本,切换别的虚拟环境时,始终切换不了,同时右下角弹出: Client Pylance: connection to server is erroring. 取消继承环境也改了。https://www.cnblogs.com/coreylin/p/17509610.html 还是不行&#xf…

2025-03-19 学习记录--C/C++-C语言-单链表的按位查找和按值查找

C语言-单链表的按位查找和按值查找 ⭐️ 单链表的结构体定义,请查看我的另一篇文章。 一、C语言-单链表的按位查找 🍭 【题目】有一个带头结点的单链表L,请设计一个算法查找其第i个结点位置,若存在则返回该结点的指针,…

数据结构-----队列

顺序队列(Queue) 一、队列核心概念 1. 基本特性 先进先出(FIFO):最早入队的元素最先出队操作限制: 队尾(Rear):唯一允许插入的位置队头(Front)&…

SAP 附件增删改查与文件服务器交互应用

【需求背景】 非SAP标准附件应用,自定义一套,跟公司内部文档服务器交互,支持各个应用场景的附件增删改查等。 每个附件在文件服务器上都有一个文件唯一ID作为关键字。 应用分两块:SAP GUI端,跟WDA Portal端应用 GU…

华为终端销售模式转型变革项目总体汇报方案(183页PPT)(文末有下载方式)

资料解读:华为终端销售模式转型变革项目总体汇报方案 详细资料请看本解读文章的最后内容。 华为终端销售模式转型变革项目总体汇报方案,是一份详尽阐述华为终端销售模式转型的综合性文件。该方案旨在通过构建未来整体架构、识别关键变革点及痛点的解决…