深度分析 es multi_match 中most_fields、best_fields、cross_fields区别

news/2024/12/26 18:31:02/

文章目录

      • 1. `multi_match` 查询的类型
        • 1.1 `best_fields`(默认)
        • 1.2 `most_fields`
        • 1.3 `cross_fields`
      • 2. 不同类型的示例
        • 查询示例数据:
      • 3. 示例 1: 使用 `best_fields`
        • 查询:
        • 说明:
      • 4. 示例 2: 使用 `most_fields`
        • 查询:
        • 说明:
      • 5. 示例 3: 使用 `cross_fields`
        • 查询:
        • 说明:
      • 6. 返回的结果对比
      • 7. 总结对比
      • 8. 总结

Elasticsearch 中,multi_match 查询是用来在多个字段中查找匹配的文本。它有不同的 type(类型),例如 most_fieldsbest_fieldscross_fields,这些类型在多字段查询时的匹配策略不同。了解这些类型的区别有助于在不同的场景下做出正确的查询选择。

1. multi_match 查询的类型

1.1 best_fields(默认)

best_fields默认类型。它在多个字段上查找匹配项,并返回与单个字段最匹配的结果。也就是说,ES 会计算每个字段的相关性,然后返回最佳的字段匹配结果。

  • 适用场景:当你希望查询中的单个字段更重要时,best_fields 适合。
  • 匹配逻辑:多个字段参与查询,但只会选取最好的字段结果。
1.2 most_fields

most_fields 会把多个字段的匹配结果合并到一起,计算最匹配的字段的相关性。每个字段会被视为一个独立的匹配源,并且它们的分数会累加在一起。

  • 适用场景:当你希望多个字段的匹配对结果有较大影响时,most_fields 适合。
  • 匹配逻辑:多个字段的匹配结果累加,最终的得分是字段得分的总和。
1.3 cross_fields

cross_fields 适用于对多个字段中的数据进行组合查询。它将多个字段合并在一起,类似于一个字段查询。这对于多字段中包含相同概念的情况(例如多个单词分布在不同的字段)尤其有用。

  • 适用场景:当你希望将多个字段视为同一个字段的组合时,cross_fields 适合。
  • 匹配逻辑:多个字段被视为一个大的字段进行匹配。

2. 不同类型的示例

假设你有一个包含以下字段的 products 索引:

{"product_name": "Wireless Mouse","description": "A wireless mouse with ergonomic design","category": "Electronics"
}

你想要对这几个字段进行查询,可以使用 multi_match 来搜索多个字段。

查询示例数据:
POST /products/_bulk
{ "index": { "_id": 1 } }
{ "product_name": "Wireless Mouse", "description": "A wireless mouse with ergonomic design", "category": "Electronics" }
{ "index": { "_id": 2 } }
{ "product_name": "Wired Keyboard", "description": "A keyboard with ergonomic design", "category": "Electronics" }
{ "index": { "_id": 3 } }
{ "product_name": "Wireless Keyboard", "description": "Wireless keyboard for gaming", "category": "Electronics" }

3. 示例 1: 使用 best_fields

best_fields 是默认类型,表示从多个字段中选取相关性最强的字段。

查询:
POST /products/_search
{"query": {"multi_match": {"query": "wireless mouse","fields": ["product_name", "description"],"type": "best_fields"}},"explain": true
}
说明:

在这里插入图片描述

  • 这个查询会在 product_namedescription 字段上查找匹配,并根据相关性返回最佳的字段匹配结果。
  • 如果 product_name 字段匹配度最高,ES 会选择 product_name 字段作为最终匹配字段。

4. 示例 2: 使用 most_fields

most_fields 会将多个字段的相关性累加。

查询:
POST /products/_search
{"query": {"multi_match": {"query": "wireless mouse","fields": ["product_name", "description"],"type": "most_fields"}},"explain": true
}
说明:

在这里插入图片描述

  • 这个查询会把 product_namedescription 两个字段的匹配结果合并,计算它们的总相关性,并返回结果。
  • 比如,product_namedescription 都与查询的 wireless mouse 匹配时,它们的相关性分数会被加在一起。

5. 示例 3: 使用 cross_fields

cross_fields 用于处理多个字段中包含的同一概念时,可以把它们当作一个大的字段进行匹配。

查询:
POST /products/_search
{"query": {"multi_match": {"query": "wireless mouse","fields": ["product_name", "description"],"type": "cross_fields"}},"explain": true
}
说明:

在这里插入图片描述

  • 这个查询会把 product_namedescription 视为一个联合字段,来匹配查询词 wireless mouse
  • 即使 wireless mouse 分布在多个字段中(例如,product_name 包含 wirelessdescription 包含 mouse),cross_fields 会将它们合并为一个整体进行匹配。

6. 返回的结果对比

假设你使用了相同的查询词 wireless mouse,结果的排序可能会有所不同,具体取决于查询使用的类型。

  1. best_fields:选择一个字段(最匹配的字段),然后返回与该字段最匹配的文档。
  2. most_fields:计算多个字段的得分,并返回得分最高的文档。
  3. cross_fields:将多个字段视为一个字段进行匹配,从而查找多个字段中的联合匹配。

7. 总结对比

类型描述适用场景
best_fields在多个字段上查找匹配,只选择相关性最强的字段作为最终匹配结果(默认)。如果只关注单个最相关字段,适用于精确匹配。
most_fields将多个字段的相关性得分累加,最终返回得分最高的结果。如果多个字段的匹配结果对最终排序有较大影响。
cross_fields将多个字段合并为一个整体进行查询,适用于查询词分布在不同字段中的情况。如果多个字段包含查询的不同部分,且它们属于相同的概念。

8. 总结

  • best_fields 适用于你只关心最相关的字段结果时,通常用于精确匹配查询。
  • most_fields 适用于你希望多个字段的匹配都能影响查询结果时,适合宽松匹配。
  • cross_fields 适用于你希望将多个字段视为一个字段的组合时,尤其是在查询词分布在不同字段中时。

http://www.ppmy.cn/news/1558327.html

相关文章

kkfileview代理配置,Vue对接kkfileview实现图片word、excel、pdf预览

kkfileview部署 官网:https://kkfileview.keking.cn/zh-cn/docs/production.html 这个是官网部署网址,这里推荐大家使用docker镜像部署,因为我是直接找运维部署的,所以这里我就不多说明了,主要说下nginx代理配置&am…

前端编程训练 异步编程篇 请求接口 vue与react中的异步

文章目录 前言代码执行顺序的几个关键点接口请求vue与react中的异步 vue中的异步react的state修改异步 前言 本文是B站三十的前端课的笔记前端编程训练,异步编程篇 代码执行顺序的几个关键点 我们可以理解为代码就是一行一行,一句一句是执行(定义变…

神经网络初学总结(一)

概述 梳理神经网络的核心内容,可以从以下几个方面进行组织,包括神经网络的基本概念、结构、训练方法和优化技术等。以下是一个清晰的框架来帮助你理解神经网络的基础和进阶内容: 1. 神经网络基础 1.1 什么是神经网络 神经网络是由大量的神…

ffmpeg源码分析(九)解协议

本文将聚焦于FFmpeg协议处理模块,以avformat_open_input函数为核心,详细剖析其在最新FFmpeg源码中的实现。 音视频处理流程简介 avformat_open_input概述 avformat_open_input是FFmpeg用于打开输入多媒体数据的关键函数。它通过统一的接口处理多种协议…

python 随笔80%核心笔记(一)

目录 一、海龟 二、pygame 三、函数 四、类与对象 五、列表与元组 六、其他 1、格式化输出 2、最大公约数、最小公倍数 3、print、多变量一起定义赋值、end以及列表的方法 4、序列重复、字符串方法、其他列表方法、input 5、字典的方法、ASCII码转换、返回值、修改私人…

比特币市场震荡:回调背后的机遇与挑战

在刚刚过去的一周,比特币经历了一次显著的回调。从历史高点108,300美元一路下跌,跌幅一度接近15%,最低曾触及92,000美元附近。然而,随着市场情绪逐步趋于平稳,比特币价格已经回升至96,000美元,进入震荡整理…

01驱动钛丝(SMA)在汽车腰托支撑按摩气阀模块的应用

【前言】 形状记忆合金(Shape memory alloy, SMA),也叫形态记忆合金、钛镍记忆合金,它是由Ti(钛)-Ni(镍)材料组成,经过多道工序制成的丝,我们简称钛丝&#…

Vue3:uv-upload图片上传

效果图&#xff1a; 参考文档&#xff1a; Upload 上传 | 我的资料管理-uv-ui 是全面兼容vue32、nvue、app、h5、小程序等多端的uni-app生态框架 (uvui.cn) 代码&#xff1a; <view class"greenBtn_zw2" click"handleAddGroup">添加班级群</vie…