向量数据库的行业标准逐渐清晰!Vector DB Bench 正式开源!

news/2025/2/22 19:27:13/

大模型带火了向量数据库赛道,也让各式各样的向量数据库进入开发者视野。

对于开发者而言,如何选择一个适合自己的向量数据库至关重要。不过,向量数据库的选型并不简单,开发者不仅需要对市面上各种开源和闭源的数据库进行全面的性能评估,还要根据自己的业务数据设计测试方案……为了让更多开发者可以匹配到适合自己业务的向量数据库,我们开发了一个全新的开源性能测试工具——Vector DB Bench,它可以通过测量关键指标来衡量向量数据库的性能,使得向量数据库发挥出最大的潜能。

本文将从 Vector DB Bench 的特点和优点出发,帮助开发者全面、客观、高效地评估向量数据库。

01.开发背景

在设计 Vector DB Bench 的过程中,我们考虑了很多因素,包括测试目的、用例精确定义要求、数据的形状等。

首先是测试目的,性能测试旨在测量和比较不同情况下系统、应用程序或组件的性能。开发者可以使用它来评估不同方法的有效性和效率,并了解如何改进。

用例精确定义要求对性能测试同样十分重要。例如,如果用户正在处理大型数据集,可能会想要了解数据库可以处理多少向量或数据库搜索性能(检索相关数据的速度)。此外,测试过滤性能可以帮助查看系统如何处理大型数据集的复杂查询。

最后是数据的形状。数据的形状是指开发者计划在向量数据库中存储和使用的向量数量和向量维度。在设计性能测试时,数据形状可以影响系统的性能。

02.设计目标

以下是我们在构建开源性能测试工具时考虑的一些设计目标:

  • 灵活、可扩展:基准测试工具应灵活、可扩展。它应支持多个向量数据库系统,以便开发者能够轻松地进行性能测试和比较不同选项。此外,该工具应具有模块化架构,以支持添加更多向量数据库、指标和自定义测试场景,使开发者能够根据具体要求自定义评估。

  • 真实负载模拟:基准测试工具应利用开发者的工作负载作为真实负载模拟,以确保准确的性能评估。模拟开发者的实际用例和查询模式可以提供有关各种情况下数据库行为的见解。这种模拟有助于衡量向量数据库在实际情况下的表现,确定其适用性。

  • 交互式报告和可视化:该工具应具有生成报告和可视化的直观系统,以便轻松识别性能瓶颈、比较数据库,并了解如何优化。这些报告将是重要的决策资源,可促进有效的团队沟通。

  • 开源社区协作:该工具应是开源的,以促进向量数据库用户和开发人员的协作。通过共享见解、最佳实践和性能结果,社区共同为改进和完善该工具做出贡献,最终帮助开发人员选择适合工作的正确工具。

03.Vector DB Bench - 开源基准测试工具

Vector DB Bench 是为追求高性能数据存储和检索系统的用户设计的开源性能测试工具,它允许用户测试和比较不同向量数据库系统的性能,以确定最适合的数据库系统。使用 Vector DB Bench 后,用户可以根据他们正在评估的数据库系统的实际性能做出明智的决策,而不是依赖于营销宣传。

Vector DB Bench 是用 Python 编写的,已获得 MIT 开源许可证授权,任何人都可以自由使用、修改这一工具。相关的开发人员也在积极改进其功能和性能中。

04.快速开始

使用 pip 下载 Vector DB Bench 并使用以下命令进行安装:pip install vectordb-bench。 然后运行以下命令:init_bench。

我们将看到屏幕显示“Vector Database Benchmark”页面。此页面显示当前月份已经进行的测试结果。从这个页面,可以跳转至“QPS with Pricing”页面,按云服务的定价排序查看结果。这些测试已经涵盖不同规模的数据集进行了全面的测试。

要执行自己的测试,可以转到“Run Your Test”页面进行设置。

05.如何设置 Vector DB Bench 自行测试?

如需自行测试,请跳转至“Run Your Test”页面,并选择要测试的向量数据库,并添加这些向量数据库的配置。选择不同数据库还将显示不同 uri、用户名、密码和 db 标签。Vector DB Bench 目前支持六个向量数据库:Milvus、Zilliz Cloud、Pinecone、WeaviateCloud、QdrantCloud 和 ElasticCloud。设置要运行的测试类型(容量或搜索性能)、索引类型、用例(搜索、低或高过滤)和数据集大小(小、中和大)。

alt

在选择所需配置后,可以运行测试并等待结果。

alt

在结果页面上,可以查看测试结果。如果选择了多个数据库进行测试,将看到对比结果。开发者还可以自由分享在本地示例上运行的测试结果。

欢迎大家分享对 Vector DB Bench (https://github.com/zilliztech/VectorDBBench)的使用体验,当然也可以加入我们的 GitHub 或 Vector DB Bench slack 频道(https://milvusio.slack.com/?redir=%2Fapp_redirect%3Fchannel%3Dvector-db-bench),点击链接感受测试工具的便捷!

🌟全托管 Milvus SaaS/PaaS 即将上线,由 Zilliz 原厂打造!覆盖阿里云、百度智能云、腾讯云、金山云。目前已支持申请试用,企业用户 PoC 申请或其他商务合作请联系 business@zilliz.com。


  • 如果在使用 Milvus 或 Zilliz 产品有任何问题,可添加小助手微信 “zilliz-tech” 加入交流群。 •
  • 欢迎关注微信公众号“Zilliz”,了解最新资讯。 alt

本文由 mdnice 多平台发布


http://www.ppmy.cn/news/487785.html

相关文章

Jmeter使用||接口测试实战

标题 Jmeter与postman一样,都可以用来进行接口测试。 前面的文章( 测试工具介绍||Jmeter的简单使用),介绍了jmeter的下载、安装及简单使用。基于此背景,通过实例的形式,来介绍下如何利用jmeter进行接口测试…

云台控制界面

云台控制界面 <div class"col-sm-3 col-xs-3 col-md-3"><div> <%-- <div >--%> <%-- <a style"margin-left: 15px" id"ytkz" href"javascript:void(0)" title"…

大疆口袋相机美颜怎么设置_飞宇发布Pocket口袋云台相机,怎么看着像大疆

遂不及防呀&#xff0c;飞宇终于发布新品了&#xff0c;而这次的新品有点意思&#xff0c;因为造型像极了大疆的osmo pocket口袋相机&#xff0c;但价格却比大疆要便宜近千元。 作为VLOG神器&#xff0c;大疆的osmo pocket收获了不少好评&#xff0c;毕竟这样的造型设计十分有利…

开源俄版三轴云台软硬件、调参软件调试可用,代码开源,入门说明

本方案采用开源方案&#xff0c;云台嵌入式软件采用simpleBGC开源代码&#xff0c;并参考了网上“SimpleBGC32- 开源三轴无刷云台算法完全解说”修改而成&#xff0c;程序在STorM32 BGC V1.31硬件开源板卡中调试成功并通过实测。调参软件采用storm32-bgc开源调参软件程序修改而…

m100(2) 云台自动跟踪

大疆 210云台控制 https://developer.dji.com/onboard-sdk/documentation/sample-doc/advanced-sensing-target-tracking.html 0 开启图像端 0.1 图像跟踪 http://www.cnblogs.com/kekeoutlook/p/8353357.html 图像鼠标选取目标&#xff0c;之后不断保存目标信息&#xff0c;…

自搭的基于Frida一体化采集框架

提示&#xff1a;本文仅分享框架设计思路和大体的使用&#xff0c;全是博主自己个人的设计思路&#xff0c;转载请注明出处 文章目录 前言一、cpfrida的功能1.日志收集2.设备操作3.异常告警4.模板处理5.进程维护6.自动运维7.快速生成项目8.频率可调控9.服务端快速部署10.hook脚…

1.8安装大华相机SDK及测试

不同工业相机的sdk不同&#xff0c;可以到相应的官网下载&#xff0c;我使用的是大华相机 下载SDK&#xff1a; 官方下载地址&#xff1a;http://download.huaraytech.com/pub/sdk/我使用的是2.2.5的Linux的x86的版本 点击下载 安装&#xff1a; 将下载的压缩包中.run文件提取…

C语言学习笔记:单链表

✨博文作者&#xff1a;烟雨孤舟 &#x1f496; 喜欢的可以 点赞 收藏 关注哦~~ ✍️ 作者简介: 一个热爱大数据的学习者 ✍️ 笔记简介&#xff1a;作为大数据爱好者&#xff0c;以下是个人总结的学习笔记&#xff0c;如有错误&#xff0c;请多多指教&#xff01; 目录 单链表…