Elasticsearch的搜索命令
文章目录
- Elasticsearch的搜索命令
- 数据准备
- URI Search
- q(查询字符串)
- analyzer(指定查询字符串时使用的分析器)
- df(指定查询字段)
- _source(指定返回文档的字段)
- sort(排序)
- timeout(指定查询超时时间)
- from和size(查询分页)
- TermQuery(词语查询)
- PhraseQuery(短语查询)
- AND、OR、NOT、+、-(布尔查询)
- 关系运算符
- 范围查询
- 通配符查询
- Request Body Search
- 精确匹配term
- exists查询
- fuzzy查询
- ids查询
- prefix查询
- range查询
- regexp查询
- term查询
- terms查询
- wildcard查询
- 模糊匹配match
- match_all查询
- match查询
- multi_match查询
- match_phrase查询
- match_phrase_prefix查询
- 布尔查询
数据准备
PUT /movie
{"settings": {"index": {"analysis.analyzer.default.type": "ik_max_word"}}
}POST /movie/_bulk
{"create":{"_id":1}}
{"id":1,"name":"红海行动","type":"惊悚 剧情 动作","desc":"该片讲述了中国海军“蛟龙突击队”8人小组奉命执行撤侨任务,突击队兵分两路进行救援,但不幸遭到伏击,人员伤亡;同时在粉碎叛军武装首领的惊天阴谋中惨胜的故事","score":7.9}
{"create":{"_id":2}}
{"id":2,"name":"流浪地球","type":"科幻 灾难 冒险","desc":"该片讲述了太阳即将毁灭,毁灭之后的太阳系已经不适合人类生存,而面对绝境,人类将开启“流浪地球”计划,试图带着地球一起逃离太阳系,寻找人类新家园的故事","score":8.2}
{"create":{"_id":3}}
{"id":3,"name":"满江红","type":"悬疑 喜剧 叙事","desc":"该片讲述了南宋绍兴年间,岳飞死后四年,秦桧率兵与金国会谈。会谈前夜,金国使者死在宰相驻地,所携密信也不翼而飞。一个小兵与亲兵营副统领机缘巧合被裹挟进这巨大阴谋之中,宰相秦桧命两人寻找凶手和真相的故事","score":7.4}
URI Search
- 操作简便,方便通过命令行测试
- 但是仅包含部分查询语法
使用方法如下,field与value用冒号(:)分隔,多个参数用与号(&)分隔:
GET /索引/_search?参数1=field1:value1&参数2=field2:value2
查询多个索引用逗号(,)分隔:
GET /索引1,索引2/_search?参数1=field1:value1&参数2=field2:value2
模糊匹配索引用星号(*):
GET /索引*/_search?参数1=field1:value1&参数2=field2:value2
q(查询字符串)
GET /movie/_search?q=name:红海行动
泛查询,不指定字段,对索引中所有字段进行匹配
GET /movie/_search?q=红海行动
analyzer(指定查询字符串时使用的分析器)
GET /movie/_search?q=name:红海行动&analyzer=ik_smart
df(指定查询字段)
GET /movie/_search?q=红海行动&df=name
_source(指定返回文档的字段)
GET /movie/_search?q=name:红海行动&_source=name
sort(排序)
asc升序,desc降序
GET /movie/_search?q=name:红海行动&sort=id:desc
timeout(指定查询超时时间)
默认为永不超时,ms毫秒,s秒,m分钟
GET /movie/_search?q=name:红海行动&timeout=3s
from和size(查询分页)
from默认为0,size默认为10
GET /movie/_search?q=name:红海行动&from=0&size=1
TermQuery(词语查询)
复数查询字符串需要配合空格和括号,并且无前后顺序
GET /movie/_search?q=name:(红海行动)
GET /movie/_search?q=name:红海行动
GET /movie/_search?q=name:(红海行动 满江红)
GET /movie/_search?q=name:(红海行动 OR 满江红)
# 当分析器只能分出一个词语的时候,双引号查询也是TermQuery
GET /movie/_search?q=name:"红海"
PhraseQuery(短语查询)
需要配合双引号,有前后顺序区别
GET /movie/_search?q=name:"满江红 红海行动"
GET /movie/_search?q=name:"红海行动 满江红"
# 当分析器能分出多个词语的时候,双引号查询是PhraseQuery
GET /movie/_search?q=name:"红海行动"
AND、OR、NOT、+、-(布尔查询)
布尔查询基于词语、短语查询,是它们的组合查询
既包含红海行动
又包含满江红
的所有的数据
GET /movie/_search?q=name:(红海行动 AND 满江红)
包含红海行动
或者满江红
的所有的数据
GET /movie/_search?q=name:(红海行动 OR 满江红)
等价
GET /movie/_search?q=name:(红海行动 满江红)
包含红
,但是不包含行动
GET /movie/_search?q=name:(红 NOT 行动)
关系运算符
GET /movie/_search?q=name:红海行动 AND q=year:(>=2018 AND <2023)
范围查询
[]为闭区间,{}为开区间
GET /movie/_search?q=name:红海行动 AND q=year:{2018 TO 2018]
通配符查询
?代表1个字符,*代表0或多个字符
GET /movie/_search?q=name:红*
GET /movie/_search?q=name:满?
Request Body Search
- es最常用的方式,查询丰富
- 提供的完备查询语法Query DSL(Domain Specific Language)
- 与URI Search类似有下面等用法
GET /movie/_search
{"query": {"match": {"name": "红"}},"sort": {"id" : {"order":"desc"}},"_source": ["score","name"],"from" : 0,"size" : 2
}
精确匹配term
exists查询
用来判定文档是否存在某一个字段,返回包含字段的任何索引值的文档
GET /movie/_search
{"query": {"exists": {"field": "name"}}
}
fuzzy查询
-
最大模糊错误必须在0~2个词之间
-
搜索关键词长度为2,不允许存在模糊
-
搜索关键词长度为35,允许一次模糊01个词
-
搜索关键词长度大于5,允许最大模糊2个词
GET /movie/_search
{"query": {"fuzzy": {"name": "红"}}
}
ids查询
通过文档id进行查询
GET /movie/_search
{"query": {"ids": {"values": ["1","2"]}}
}
prefix查询
GET /movie/_search
{"query": {"prefix": {"name": {"value": "流"}}}
}
range查询
- gt:大于(>)
- gte:大于等于(>=)
- lt:小于(<)
- lte:小于等于(<=)
GET /movie/_search
{"query": {"range": {"score": {"gte": 8,"lt": 10}}}
}
regexp查询
通过正则表达式进行查询
GET /movie/_search
{"query": {"regexp": {"name": "红.*"}}
}
term查询
精确匹配单个分词
GET /movie/_search
{"query": {"term": {"name": "满江红"}}
}
terms查询
一次精确匹配多个分词
GET /movie/_search
{"query": {"terms": {"name": ["满江红", "流浪地球"]}}
}
wildcard查询
?代表1个字符,*代表0或多个字符
GET /movie/_search
{"query": {"wildcard": {"name": "红*"}}
}
模糊匹配match
match_all查询
没有查询条件,检索文档全部数据
GET /movie/_search
{"query": {"match_all": {}}
}
match查询
匹配查询,会将查询条件分词后查询,多个分词查询关系默认是OR,满足一个分词即可命中
GET /movie/_search
{"query": {"match": {"name": "红海行动"}}
}
也可以指定查询分词关系以及分析器
GET /movie/_search
{"query": {"match": {"name": {"query": "红海行动","analyzer": "ik_max_word","operator": "AND"}}}
}
multi_match查询
与match类似,可以在多个字段中查询
GET /movie/_search
{"query": {"multi_match": {"query": "地球","fields": ["name","desc"]}}
}
match_phrase查询
短语匹配查询,会将查询条件分词后查询,要求必须全部精确匹配,且顺序固定
GET /movie/_search
{"query": {"match_phrase": {"type": {"query": "科幻冒险","slop": 1}}}
}
slop参数指定可以相隔多少分词视为匹配
match_phrase_prefix查询
短语前缀匹配查询,与match_phrase类似,但最后一个分词允许使用前缀匹配
GET /movie/_search
{"query": {"match_phrase_prefix": {"type": {"query": "悬疑喜","max_expansions": 1}}}
}
max_expansions参数指定前缀匹配的分词的数量
布尔查询
是模糊、精确查询的组合操作,共有四种类型,分别是:must,should,must_not和filter:
-
must:文档必须匹配must查询条件(相当于逻辑与)
-
should:文档应该匹配should子句查询条件(相当于逻辑或)
若查询语句中有must或者filter,则should只影响评分,文档就算是没有匹配should中的项也会被查到(即:匹配should中的0项)若查询语句中没有must和
filter,文档必须匹配should中的至少1项
-
must_not:与must相反,匹配该选项下的查询条件的文档不会被返回(相当于逻辑与)
-
filter:和must—样 ,匹配filter选项下的查询条件的文档才会被返回;跟must的区别是:filter不评分(即:不影响score),只起到过滤功能。(相当于逻辑与)
GET /movie/_search
{"query": {"bool": {"should": [{"match": {"name": "满江"}},{"match": {"name": "红"}},{"match": {"name": "地球"}}],"minimum_should_match": 2}}
}
minimum_should_match参数指定需要满足的条件数量