向量数据库

news/2025/1/30 6:39:44/

向量数据库可以做哪些事情

  • 存储和索引向量
  • 检索相似向量,还具有过滤功能
  • 自动将文档转变成向量,所以会自动化分词、向量化、索引等操作

目前存在的向量数据库:

名称github开源协议
chromahttps://github.com/chroma-core/chromaApache 2.0
Milvushttps://github.com/milvus-io/milvusApache 2.0
Pinecone未开源/
weaviatehttps://github.com/weaviate/weaviateBSD-3-Clause license
qdranthttps://github.com/qdrant/qdrantApache 2.0
vespahttps://github.com/vespa-engine/vespaApache 2.0
zilliz基于Milvus的商业版向量数据库/

其他跟向量数据库相关,严格来说不算向量数据库

  • Faiss 是一个提供高维向量相似性搜索和聚类的算法库,不算向量数据库,向量数据库的相似性检索可以使用到Faiss中的算法。
  • ScaNN 是google开源的相似向量搜索方法
  • vald 是一个可扩展的向量搜索引擎
  • pgvector 为Postgres 提供向量相似度搜索的库
  • typesense 可替代ElasticSearch, 也有向量搜索功能

对于文本,如何挑选向量类型,可参考比较基准:MTEB: Massive Text Embedding Benchmark


参考资料

  1. https://towardsdatascience.com/milvus-pinecone-vespa-weaviate-vald-gsi-what-unites-these-buzz-words-and-what-makes-each-9c65a3bd0696
  2. https://byby.dev/vector-databases
  3. https://platform.openai.com/docs/guides/embeddings/what-are-embeddings

http://www.ppmy.cn/news/91258.html

相关文章

WIN10:Cognos10.2_x32安装

一、Cognos BI Server 10.2 32Bit 二、Cognos Transformer 10.2 三、Cognos Framework Manager 10.2 四、环境 1、如果使用Cognos自带的Tomcat web容器,将E:\common\Cognos\c10\webcontent下的所有文件拷贝到E:\common\Cognos\c10\webapps\p2pd 下面.(一般我们就使…

在阿里干了6年自动化测试,30岁即将退休的我,告诉你自动化测试工程师有多吃香...

测试人员需要具备自动化测试或者测试开发能力,已经成为测试行业内容的一种显在趋势,而且这种趋势呈放大态势,其发展前景是十分明朗的。 2022这种疫情期间,就业大环境不是很理想,目前呢,企业倾向于招自动化…

【嵌入式Linux】源码菜单配置 | 编译 | 菜单配置的实现 | 源码编译的实现

源码配置编译 源码配置编译,要把中间各个环节都理清楚 厂商把自己增加的东西专门放了个文件独立,方便开发者发现变化 1.菜单配置 移植的第一步,就是选配,通过make menuconfig图形化界面选配 //载入配置 $ make ARCHarm64 tegra_defconfi…

python+django乡村居民数据的可视化平台

本论文主要论述了如何使用Django框架开发一个乡村振兴数据的可视化平台 ,本系统将严格按照软件开发流程进行各个阶段的工作,采用B/S架构,面向对象编程思想进行项目开发。在引言中,作者将论述乡村振兴数据的可视化平台的当前背景以…

九章云极DataCanvas公司诚邀您共享AI基础软件前沿技术盛宴

“杭州通用人工智能论坛暨AIIA人工智能产业发展大会”将于2023年5月30日-31日在杭州举办。本次人工智能产业发展大会由中国信息通信研究院、中国人工智能产业发展联盟主办,杭州城西科创大走廊管委会、杭州市经济和信息化局、杭州未来科技城管理委员会、人工智能关键…

【HISI IC萌新虚拟项目】test_core模块方案文档

该文档为test_core spec,仅为参考,如果在进行本系列虚拟项目的学习与实践,请自行完成本部分内容。 1.Introduction 用于对 SRAM 实现自动的可配置地址线、数据线故障检测。 1.CPU 控制 CPU 向芯片的工作模式选择寄存器写入0xXXXX_XX55后,芯片进入扫描工作模式, 并启动…

基于最新SolVES 模型与多技术融合【QGIS、PostgreSQL、ARCGIS、MAXENT、R】实现生态系统服务功能社会价值评估及拓展案例分析

目录 第一章 理论基础与研究热点 第二章 SolVES 4.0 模型运行环境配置 第三章 SolVES 4.0 模型运行 第四章 数据获取与入库 第五章 环境变量与社会价值的相关分析 第六章 拓展案例分析 SolVES模型(Social Values for Ecosystem Services)全称为生态…

VuePress + GitHub Actions 自动部署

文章目录 前言背景GitHub Actions简介基本概念引用 Actionworkflow 文件 自动部署创建 Action权限问题 小结参考文献 前言 我的第二本开源书籍《后台开发命令 365》上线啦。 为了方便阅读,使用 VuePress 将之前记录的后台常用 Linux 命令博文整理成一个系统的开源…