pymilvus执行多向量搜索

从 Milvus 2.4 开始，引入了多向量支持和混合搜索框架，单个collection可以支持10个向量字段。不同的向量字段可以表示不同的方面、不同的embedding模型甚至表征同一实体的不同数据模态。该功能在综合搜索场景中特别有用，例如根据图片、语音、指纹等各种属性来识别向量库中最相似的人。

多向量搜索支持在多个向量字段上执行搜索请求，并使用重排名策略（例如RRF和加权评分）组合结果。

客户端pymilvus需要2.4版本。

准备数据

集合hello_milvus有2个向量字段embeddings1、embeddings2

创建多个 AnnSearchRequest 实例

每个AnnSearchRequest代表指定向量字段上的单个搜索请求。

以下示例创建两个AnnSearchRequest实例对两个向量字段执行单独的相似性搜索。

query_vector1 = [[0.9425935745239258,0.7893211245536804,0.6682707071304321,0.6769697070121765,0.9508556127548218]]search_param_1 = {"data": query_vector1, # Query vector"anns_field": "embeddings1", # Vector field name"param": {"metric_type": "L2", # This parameter value must be identical to the one used in the collection schema"params": {"nprobe": 10}},"limit": 2 # Number of search results to return in this AnnSearchRequest
}
request_1 = AnnSearchRequest(**search_param_1)query_vector2 = [[0.7958434224128723,0.18576304614543915,0.650543212890625,0.3026141822338104,0.7158203125]]
search_param_2 = {"data": query_vector2, # Query vector"anns_field": "embeddings2", # Vector field name"param": {"metric_type": "L2", # This parameter value must be identical to the one used in the collection schema"params": {"nprobe": 10}},"limit": 2 # Number of search results to return in this AnnSearchRequest
}
request_2 = AnnSearchRequest(**search_param_2)reqs = [request_1, request_2]

配置重排名策略

创建AnnSearchRequest实例后，配置重排名策略以组合结果并重新排名。目前有两个选项：WeightedRanker和RRFRanker。

from pymilvus import WeightedRanker
rerank = WeightedRanker(0.8, 0.2)

执行混合搜索

使用hybrid_search()方法执行多向量搜索。

from pymilvus import (connections,Collection,AnnSearchRequest,WeightedRanker
)collection_name = "hello_milvus"
host = "192.168.230.71"
port = 19530
username = ""
password = ""query_vector1 = [[0.9425935745239258,0.7893211245536804,0.6682707071304321,0.6769697070121765,0.9508556127548218]]search_param_1 = {"data": query_vector1, # Query vector"anns_field": "embeddings1", # Vector field name"param": {"metric_type": "L2", # This parameter value must be identical to the one used in the collection schema"params": {"nprobe": 10}},"limit": 2 # Number of search results to return in this AnnSearchRequest
}
request_1 = AnnSearchRequest(**search_param_1)query_vector2 = [[0.7958434224128723,0.18576304614543915,0.650543212890625,0.3026141822338104,0.7158203125]]
search_param_2 = {"data": query_vector2, # Query vector"anns_field": "embeddings2", # Vector field name"param": {"metric_type": "L2", # This parameter value must be identical to the one used in the collection schema"params": {"nprobe": 10}},"limit": 2 # Number of search results to return in this AnnSearchRequest
}
request_2 = AnnSearchRequest(**search_param_2)reqs = [request_1, request_2]rerank = WeightedRanker(0.8, 0.2)print("start connecting to Milvus")
connections.connect("default", host=host, port=port,user=username,password=password)
coll = Collection(collection_name, consistency_level="Bounded")res = coll.hybrid_search(reqs, # List of AnnSearchRequests created in step 1rerank, # Reranking strategy specified in step 2output_fields=['pk'],limit=2 # Number of final search results to return
)print(res)

返回结果:

['[
"id: 0, distance: 1.0, entity: {'pk': 0}", 
"id: 568, distance: 0.7705678939819336, entity: {'pk': 568}"
]']

pymilvus执行多向量搜索

pymilvus执行多向量搜索

准备数据

创建多个 AnnSearchRequest 实例

配置重排名策略

执行混合搜索

相关文章

可重构柔性装配产线：AI边缘控制技术的崭新探索

sql连续登录

粤嵌gec6818开发板-播放视频、音频文件（管道文件控制）

【综述】多核处理器芯片

搭建vue3组件库(一): Monorepo架构搭建

数据结构(八)——排序

Java设计模式 _结构型模式_过滤器模式

CUDA内存模型