Elasticsearch的搜索命令

文章目录

Elasticsearch的搜索命令
- 数据准备
- URI Search
- - q（查询字符串）
  - analyzer（指定查询字符串时使用的分析器）
  - df（指定查询字段）
  - _source（指定返回文档的字段）
  - sort（排序）
  - timeout（指定查询超时时间）
  - from和size（查询分页）
  - TermQuery（词语查询）
  - PhraseQuery（短语查询）
  - AND、OR、NOT、+、-（布尔查询）
  - 关系运算符
  - 范围查询
  - 通配符查询
- Request Body Search
- - 精确匹配term
  - - exists查询
    - fuzzy查询
    - ids查询
    - prefix查询
    - range查询
    - regexp查询
    - term查询
    - terms查询
    - wildcard查询
  - 模糊匹配match
  - - match_all查询
    - match查询
    - multi_match查询
    - match_phrase查询
    - match_phrase_prefix查询
- 布尔查询

数据准备

PUT /movie
{"settings": {"index": {"analysis.analyzer.default.type": "ik_max_word"}}
}POST /movie/_bulk
{"create":{"_id":1}}
{"id":1,"name":"红海行动","type":"惊悚 剧情 动作","desc":"该片讲述了中国海军“蛟龙突击队”8人小组奉命执行撤侨任务，突击队兵分两路进行救援，但不幸遭到伏击，人员伤亡；同时在粉碎叛军武装首领的惊天阴谋中惨胜的故事","score":7.9}
{"create":{"_id":2}}
{"id":2,"name":"流浪地球","type":"科幻 灾难 冒险","desc":"该片讲述了太阳即将毁灭，毁灭之后的太阳系已经不适合人类生存，而面对绝境，人类将开启“流浪地球”计划，试图带着地球一起逃离太阳系，寻找人类新家园的故事","score":8.2}
{"create":{"_id":3}}
{"id":3,"name":"满江红","type":"悬疑 喜剧 叙事","desc":"该片讲述了南宋绍兴年间，岳飞死后四年，秦桧率兵与金国会谈。会谈前夜，金国使者死在宰相驻地，所携密信也不翼而飞。一个小兵与亲兵营副统领机缘巧合被裹挟进这巨大阴谋之中，宰相秦桧命两人寻找凶手和真相的故事","score":7.4}

URI Search

操作简便，方便通过命令行测试
但是仅包含部分查询语法

使用方法如下，field与value用冒号（:）分隔，多个参数用与号（&）分隔：

GET /索引/_search?参数1=field1:value1&参数2=field2:value2

查询多个索引用逗号（,）分隔：

GET /索引1,索引2/_search?参数1=field1:value1&参数2=field2:value2

模糊匹配索引用星号（*）：

GET /索引*/_search?参数1=field1:value1&参数2=field2:value2

q（查询字符串）

GET /movie/_search?q=name:红海行动

泛查询，不指定字段，对索引中所有字段进行匹配

GET /movie/_search?q=红海行动

analyzer（指定查询字符串时使用的分析器）

GET /movie/_search?q=name:红海行动&analyzer=ik_smart

df（指定查询字段）

GET /movie/_search?q=红海行动&df=name

_source（指定返回文档的字段）

GET /movie/_search?q=name:红海行动&_source=name

sort（排序）

asc升序，desc降序

GET /movie/_search?q=name:红海行动&sort=id:desc

timeout（指定查询超时时间）

默认为永不超时，ms毫秒，s秒，m分钟

GET /movie/_search?q=name:红海行动&timeout=3s

from和size（查询分页）

from默认为0，size默认为10

GET /movie/_search?q=name:红海行动&from=0&size=1

TermQuery（词语查询）

复数查询字符串需要配合空格和括号，并且无前后顺序

GET /movie/_search?q=name:(红海行动)
GET /movie/_search?q=name:红海行动
GET /movie/_search?q=name:(红海行动 满江红)
GET /movie/_search?q=name:(红海行动 OR 满江红)
# 当分析器只能分出一个词语的时候，双引号查询也是TermQuery
GET /movie/_search?q=name:"红海"

PhraseQuery（短语查询）

需要配合双引号，有前后顺序区别

GET /movie/_search?q=name:"满江红 红海行动"
GET /movie/_search?q=name:"红海行动 满江红"
# 当分析器能分出多个词语的时候，双引号查询是PhraseQuery
GET /movie/_search?q=name:"红海行动"

AND、OR、NOT、+、-（布尔查询）

布尔查询基于词语、短语查询，是它们的组合查询

既包含红海行动又包含满江红的所有的数据

GET /movie/_search?q=name:(红海行动 AND 满江红)

包含红海行动或者满江红的所有的数据

GET /movie/_search?q=name:(红海行动 OR 满江红)
等价
GET /movie/_search?q=name:(红海行动 满江红)

包含红，但是不包含行动

GET /movie/_search?q=name:(红 NOT 行动)

关系运算符

GET /movie/_search?q=name:红海行动 AND q=year:(>=2018 AND <2023)

范围查询

[]为闭区间，{}为开区间

GET /movie/_search?q=name:红海行动 AND q=year:{2018 TO 2018]

通配符查询

?代表1个字符，*代表0或多个字符

GET /movie/_search?q=name:红*
GET /movie/_search?q=name:满?

Request Body Search

es最常用的方式，查询丰富
提供的完备查询语法Query DSL（Domain Specific Language）
与URI Search类似有下面等用法

GET /movie/_search
{"query": {"match": {"name": "红"}},"sort": {"id" : {"order":"desc"}},"_source": ["score","name"],"from" : 0,"size" : 2
}

精确匹配term

exists查询

用来判定文档是否存在某一个字段，返回包含字段的任何索引值的文档

GET /movie/_search
{"query": {"exists": {"field": "name"}}
}

fuzzy查询

最大模糊错误必须在0~2个词之间
搜索关键词长度为2，不允许存在模糊
搜索关键词长度为3_{5，允许一次模糊0}1个词
搜索关键词长度大于5，允许最大模糊2个词

GET /movie/_search
{"query": {"fuzzy": {"name": "红"}}
}

ids查询

通过文档id进行查询

GET /movie/_search
{"query": {"ids": {"values": ["1","2"]}}
}

prefix查询

GET /movie/_search
{"query": {"prefix": {"name": {"value": "流"}}}
}

range查询

gt：大于（>）
gte：大于等于（>=）
lt：小于（<）
lte：小于等于（<=）

GET /movie/_search
{"query": {"range": {"score": {"gte": 8,"lt": 10}}}
}

regexp查询

通过正则表达式进行查询

GET /movie/_search
{"query": {"regexp": {"name": "红.*"}}
}

term查询

精确匹配单个分词

GET /movie/_search
{"query": {"term": {"name": "满江红"}}
}

terms查询

一次精确匹配多个分词

GET /movie/_search
{"query": {"terms": {"name": ["满江红", "流浪地球"]}}
}

wildcard查询

?代表1个字符，*代表0或多个字符

GET /movie/_search
{"query": {"wildcard": {"name": "红*"}}
}

模糊匹配match

match_all查询

没有查询条件，检索文档全部数据

GET /movie/_search
{"query": {"match_all": {}}
}

match查询

匹配查询，会将查询条件分词后查询，多个分词查询关系默认是OR，满足一个分词即可命中

GET /movie/_search
{"query": {"match": {"name": "红海行动"}}
}

也可以指定查询分词关系以及分析器

GET /movie/_search
{"query": {"match": {"name": {"query": "红海行动","analyzer": "ik_max_word","operator": "AND"}}}
}

multi_match查询

与match类似，可以在多个字段中查询

GET /movie/_search
{"query": {"multi_match": {"query": "地球","fields": ["name","desc"]}}
}

match_phrase查询

短语匹配查询，会将查询条件分词后查询，要求必须全部精确匹配，且顺序固定

GET /movie/_search
{"query": {"match_phrase": {"type": {"query": "科幻冒险","slop": 1}}}
}

slop参数指定可以相隔多少分词视为匹配

match_phrase_prefix查询

短语前缀匹配查询，与match_phrase类似，但最后一个分词允许使用前缀匹配

GET /movie/_search
{"query": {"match_phrase_prefix": {"type": {"query": "悬疑喜","max_expansions": 1}}}
}

max_expansions参数指定前缀匹配的分词的数量

布尔查询

是模糊、精确查询的组合操作，共有四种类型，分别是：must，should，must_not和filter：

must：文档必须匹配must查询条件（相当于逻辑与）
should：文档应该匹配should子句查询条件（相当于逻辑或）

若查询语句中有must或者filter，则should只影响评分，文档就算是没有匹配should中的项也会被查到（即：匹配should中的0项）若查询语句中没有must和

filter，文档必须匹配should中的至少1项
must_not：与must相反，匹配该选项下的查询条件的文档不会被返回（相当于逻辑与）
filter：和must—样，匹配filter选项下的查询条件的文档才会被返回；跟must的区别是：filter不评分（即：不影响score），只起到过滤功能。（相当于逻辑与）

GET /movie/_search
{"query": {"bool": {"should": [{"match": {"name": "满江"}},{"match": {"name": "红"}},{"match": {"name": "地球"}}],"minimum_should_match": 2}}
}

minimum_should_match参数指定需要满足的条件数量