Milvus vs. ElasticSearch：向量库检索性能测试

Milvus vs. ElasticSearch：向量库检索性能测试

embedded/2025/3/26 6:15:57/

目录

- 1. 构建检索库
- 2. 测试条件
- 3. 测试结果
- 4. 性能分析
- 5. 结论

1. 构建检索库

构建通用场景库总计约2万张。
构建车辆数据库总计约12万张。
构建公共数据库，包括Flickr30k、COCO、nlvr2、vqa等数据集约43万张。

2. 测试条件

环境说明：分别单机部署Milvus和Elasticsearch。
配置说明：分别基于Milvus和Elasticsearch构建三种不同规模的检索库，Embedding维度为1024，均是采用余弦相似度计算距离，采用ANN方法返回topk检索结果，其他检索条件均相同。

3. 测试结果

检索库类型	检索库大小（万）	ES检索性能（秒/次）	Milvus检索性能（秒/次）	Milvus性能优势倍数
通用场景库	2	0.0253	0.0052	4.87
车辆数据库	12	0.10825	0.00646	16.76
公共数据库	43	0.36684	0.00708	51.82

4. 性能分析

小数据量场景（2W）
- Milvus 性能是 ES 的 4.87 倍，表明即使在小规模数据下，Milvus 的向量检索效率仍显著优于 ES。
中大数据量场景（12W/43W）

12W 数据量时，Milvus 性能提升倍数扩大至 16.76
43W 数据量时，Milvus 性能优势达到 51.82
ES 的检索耗时随数据量增长呈非线性上升（从 0.0253s → 0.36684s），而 Milvus 仅从 0.0052s → 0.00708s，增长幅度极小。

扩展性差异

ES 的检索性能与数据量高度相关，说明其底层架构对大规模向量数据的处理效率存在瓶颈。
Milvus 则展现出优异的扩展性，其检索耗时几乎不受数据量增长影响，体现了专用向量数据库的设计优势。

5. 结论

Milvus 优势：专为向量检索优化，采用列式存储、近似最近邻（ANN）算法和分布式架构，在大规模场景下性能显著优于 ES。
ES 局限性：基于倒排索引的架构对非结构化向量数据处理效率较低，适合文本检索为主的混合场景。
选型建议：
✔️ 纯向量检索场景（尤其是数据量 >10W 时）优先选择 Milvus
✔️ 文本+向量混合检索场景可考虑 ES，但需接受向量性能折损

http://www.ppmy.cn/embedded/174622.html

相关文章

SVN简明教程——下载安装使用

SVN简明教程——下载安装使用

SVN教程目录一、开发中的实际问题二、简介2.1 版本控制2.2 Subversion2.3 Subversion的优良特性2.4 工作原理2.5 SVN基本操作三、Subversion的安装与配置1. 服务器端程序版本2. 下载源码包3. 下载二进制安装包4. 安装5. 配置版本库① 为什么要配置版本库？② 创建目…

阅读更多...

STM32 —— MCU、MPU、ARM、FPGA、DSP

STM32 —— MCU、MPU、ARM、FPGA、DSP

在嵌入式系统中，MCU、MPU、ARM、FPGA和DSP是核心组件，各自在架构、功能和应用场景上有显著差异。以下从专业角度详细解析这些概念： 一、 MCU（Microcontroller Unit，微控制器单元） 核心定义集成系统芯片&a…

阅读更多...

【2025】部标JT808、JT1078、苏标主动安全模拟工具

【2025】部标JT808、JT1078、苏标主动安全模拟工具

支持JT808-2013、JT808-2019 除了直接客户端，还支持JT808服务端程序、JT808报文解析下载地址：https://www.lingx.com/download.html

阅读更多...

VSCODE右下角切换环境没用

VSCODE右下角切换环境没用

VSCODE惦记右下角python版本，切换别的虚拟环境时，始终切换不了，同时右下角弹出： Client Pylance: connection to server is erroring. 取消继承环境也改了。https://www.cnblogs.com/coreylin/p/17509610.html 还是不行&#xf…

阅读更多...

2025-03-19 学习记录--C/C++-C语言-单链表的按位查找和按值查找

2025-03-19 学习记录--C/C++-C语言-单链表的按位查找和按值查找

C语言-单链表的按位查找和按值查找 ⭐️ 单链表的结构体定义，请查看我的另一篇文章。一、C语言-单链表的按位查找 🍭 【题目】有一个带头结点的单链表L，请设计一个算法查找其第i个结点位置，若存在则返回该结点的指针，…

阅读更多...

数据结构-----队列

数据结构-----队列

顺序队列（Queue） 一、队列核心概念 1. 基本特性先进先出（FIFO）：最早入队的元素最先出队操作限制： 队尾（Rear）：唯一允许插入的位置队头（Front）&…

阅读更多...

SAP 附件增删改查与文件服务器交互应用

SAP 附件增删改查与文件服务器交互应用

【需求背景】非SAP标准附件应用，自定义一套，跟公司内部文档服务器交互，支持各个应用场景的附件增删改查等。每个附件在文件服务器上都有一个文件唯一ID作为关键字。应用分两块：SAP GUI端，跟WDA Portal端应用 GU…

阅读更多...

华为终端销售模式转型变革项目总体汇报方案（183页PPT）（文末有下载方式）

华为终端销售模式转型变革项目总体汇报方案（183页PPT）（文末有下载方式）

资料解读：华为终端销售模式转型变革项目总体汇报方案详细资料请看本解读文章的最后内容。华为终端销售模式转型变革项目总体汇报方案，是一份详尽阐述华为终端销售模式转型的综合性文件。该方案旨在通过构建未来整体架构、识别关键变革点及痛点的解决…

阅读更多...

最新文章