谷粒商城のElasticsearch

ops/2024/9/22 23:57:28/

文章目录

  • 前言
  • 一、前置知识
    • 1、Elasticsearch 的结构
    • 2、倒排索引 (Inverted Index)
      • 2.1、 索引阶段
      • 2.2、查询阶段
  • 二、环境准备
    • 1、安装Es
    • 2、安装Kibana
    • 3、安装 ik 分词器
  • 三、项目整合
    • 1、引入依赖
    • 2、整合业务
      • 2.1、创建索引、文档、构建查询语句
      • 2.2、整合业务代码
  • 后记


前言

  本篇介绍谷粒商城项目检索服务,从搭建es环境到商城检索业务的实现。(不考虑freeMarker模版中的jquery部分)
  对应视频:P173-P192


一、前置知识

1、Elasticsearch 的结构

  同传统的关系型数据库进行类比:

  1. 索引 (Index):相当于关系数据库中的表,由多个文档组成。
  2. 文档 (Document):文档是 Elasticsearch 中存储的基本数据单位,相当于关系数据库中的一行。文档以 JSON 格式存储。每个文档属于一个特定的索引,并具有唯一的 ID。
  3. 映射 (Mapping):类似于数据库中的表结构定义,定义了文档的字段及其数据类型。(DDL建表语句)

2、倒排索引 (Inverted Index)

  在倒排索引中,每个词项都关联到一个倒排列表(Posting List),该列表存储着包含这个词项的所有文档的 ID。倒排索引的构建和查询主要分为以下两个阶段:

2.1、 索引阶段

  当文档被添加到系统中时,首先会进行文档解析(分词),然后将每个词项添加到倒排索引的词典中。词典存储的是文档中所有唯一词项的列表。最后对于每个词项,记录该词项在哪些文档中出现,存储这些文档的 ID 以及该词项在文档中的位置(可选)。这些信息称为倒排列表。
  例如我现在有两个文档:文档一:布偶猫吃鱼和文档二:加菲猫吃鱼,分词后可以得到以下倒排索引(假设目前使用的是ik分词器):

文档ID
布偶1
加菲猫2
1,2
吃鱼1,2

2.2、查询阶段

  首先会进行分词,布偶猫吃鱼会得到词项【布偶吃鱼】,加菲猫吃鱼会得到词项【加菲猫吃鱼】。然后根据分出的词去查找其文档ID:

  • 布偶的文档ID是1。
  • 的文档ID是1,2。
  • 吃鱼的文档ID是1,2。
  • 加菲猫的文档ID是2。
      最后找到同时包含所有查询词项的文档,例如我要搜索布偶猫吃鱼,文档1会作为结果返回。

二、环境准备

1、安装Es

  在本项目中采用docker安装es的方式。es和kibana均采用7.4.2版本
  首先执行:

mkdir -p /mydata/elasticsearch/config
mkdir -p /mydata/elasticsearch/data

  然后执行:

echo "http.host: 0.0.0.0" >> /mydata/elasticsearch/config/elasticsearch.yml

  这条命令的含义是,在 /mydata/elasticsearch/config/elasticsearch.yml 文件的末尾添加一行配置,内容是http.host: 0.0.0.0,会允许服务通过任何 IP 地址访问Elasticsearch 。

chmod -R 777 /mydata/elasticsearch/

  这条命令的含义是,修改指定目录下的所有文件和子目录的权限。777 表示赋予所有用户(文件的所有者、同组用户、其他用户)读取(r)写入(w) 执行(x) 的权限。(权限的 777 是通过组合 rwx(读、写、执行)的权限位来得到的:7 = r + w + x = 4 + 2 + 1,即读、写、执行权限都有。)
  最后执行:

docker run --name elasticsearch -p 9200:9200 -p 9300:9300 \
-e "discovery.type=single-node" \
-e ES_JAVA_OPTS="-Xms64m -Xmx512m" \
-v /mydata/elasticsearch/config/elasticsearch.yml:/usr/share/elasticsearch/config/elasticsearch.yml \
-v /mydata/elasticsearch/data:/usr/share/elasticsearch/data \
-v /mydata/elasticsearch/plugins:/usr/share/elasticsearch/plugins \
-d elasticsearch:7.4.2

- docker run:启动一个新的 Docker 容器。
---name elasticsearch给容器命名为 elasticsearch
--p 9200:9200 -p 9300:9300:-p 选项用于将主机的端口与容器内的端口进行映射。9200:9200:将主机的 9200 端口映射到容器的 9200 端口(Elasticsearch 默认的 HTTP REST API 端口)。9300:9300:将主机的 9300 端口映射到容器的 9300 端口(Elasticsearch 默认的内部节点通信端口)。
- -e "discovery.type=single-node":-e 选项用于设置环境变量。“discovery.type=single-node”:指定 Elasticsearch 以单节点模式运行,即不需要集群节点的发现(通常用于开发或测试环境)。
--e ES_JAVA_OPTS="-Xms64m -Xmx512m":ES_JAVA_OPTS 是用于配置 JVM 的选项。-Xms64m:设置 JVM 的最小堆内存为 64MB。-Xmx512m:设置 JVM 的最大堆内存为 512MB。
--v /mydata/elasticsearch/config/elasticsearch.yml:/usr/share/elasticsearch/config/elasticsearch.yml:-v 选项用于将主机上的目录或文件挂载到容器中。将主机上 /mydata/elasticsearch/config/elasticsearch.yml 文件挂载到容器内的 /usr/share/elasticsearch/configelasticsearch.yml,用于替换容器中的默认配置文件。
- -v /mydata/elasticsearch/config/elasticsearch.yml:/usr/share/elasticsearch/config/elasticsearch.yml:-v 选项用于将主机上的目录或文件挂载到容器中。将主机上/mydata/elasticsearch/config/elasticsearch.yml文件挂载到容器内的 /usr/share/elasticsearch/config/elasticsearch.yml,用于替换容器中的默认配置文件。
--v /mydata/elasticsearch/plugins:/usr/share/elasticsearch/plugins:将主机上的/mydata/elasticsearch/plugins目录挂载到容器的/usr/share/elasticsearch/plugins目录,用于存储和管理 Elasticsearch 插件。
- -d elasticsearch:7.4.2:-d 选项让容器在后台运行(守护模式)。elasticsearch:7.4.2:指定要使用的 Elasticsearch 镜像及其版本号 7.4.2。

2、安装Kibana

  Kibana相当于es的可视化界面和控制台:

docker run --name kibana -e ELASTICSEARCH_HOSTS=http://自己的虚拟机地址:9200 -p 5601:5601 \
-d kibana:7.4.2

- docker run:启动一个新的 Docker 容器。
---name kibana: 给容器命名为kibana。
-e ELASTICSEARCH_HOSTS=http://192.168.56.10:9200:指定 Kibana 连接的 Elasticsearch 集群地址为 http://192.168.56.10:9200。
-p 5601:5601:5601:5601:将主机的 5601 端口映射到容器的 5601 端口。
-d kibana:7.4.2:指定使用 7.4.2 版本的 Kibana 镜像,并使容器在后台运行。

3、安装 ik 分词器

  将ik分词器拷贝到/mydata/elasticsearch/plugins/ik/下,重启es容器,可使用下面的命令验证是否安装成功:

curl -X GET "http://localhost:9200/_cat/plugins?v"

在这里插入图片描述


三、项目整合

1、引入依赖

  在gulimall-search模块中引入依赖:

<dependency><groupId>org.elasticsearch.client</groupId><artifactId>elasticsearch-rest-high-level-client</artifactId><version>7.4.2</version>
</dependency>
<dependency><groupId>org.elasticsearch</groupId><artifactId>elasticsearch</artifactId><version>7.4.2</version>
</dependency>
<dependency><groupId>org.elasticsearch.client</groupId><artifactId>elasticsearch-rest-client</artifactId><version>7.4.2</version>
</dependency>

  后续在项目中使用,只需要注入RestHighLevelClient即可

@Autowired
private RestHighLevelClient client;

2、整合业务

2.1、创建索引、文档、构建查询语句

  在分布式基础篇的后台管理系统中,点击上架,会将商品信息保存在gulimall_product索引中,gulimall_product的映射:(注意,分布式基础篇中,映射是product,和现在的gulimall_product有所不同,需要进行数据迁移)

{"gulimall_product" : {"mappings" : {"properties" : {"attrs" : {"type" : "nested","properties" : {"attrId" : {"type" : "long"},"attrName" : {"type" : "keyword"},"attrValue" : {"type" : "keyword"}}},"brandId" : {"type" : "long"},"brandImg" : {"type" : "keyword"},"brandName" : {"type" : "keyword"},"catalogId" : {"type" : "long"},"catalogName" : {"type" : "keyword"},"hasStock" : {"type" : "boolean"},"hotScore" : {"type" : "long"},"saleCount" : {"type" : "long"},"skuId" : {"type" : "long"},"skuImg" : {"type" : "keyword"},"skuPrice" : {"type" : "keyword"},"skuTitle" : {"type" : "text","analyzer" : "ik_smart"},"spuId" : {"type" : "keyword"}}}}
}

  数据迁移:

# 迁移数据
POST _reindex
{"source": {"index": "product"},"dest": {"index": "gulimall_product"}
}

  在页面上点击搜索时,相当于带着搜索条件去ES中进行检索,并且将检索的结果封装成对象返回给前端页面进行展示,我们需要:

  1. skuTitle进行模糊匹配,高亮显示。
  2. catalogIdbrandIdattrshasStockrange进行过滤。
  3. skuPrice进行排序。
  4. 进行分页。
  5. 根据上面查询的结果进行聚合分析,按照brandIdcatalogIdattrId,查询出共有的部分。
      其中mustfilter的区别:must 中的条件会参与相关性评分(_score)的计算。如果多个条件都出现在 must 中,满足的条件越多,相关性评分就越高。filter 只用于过滤文档,满足条件的文档会返回,但不会参与相关性评分的计算。因此它比 must 更高效,特别适合用于不需要计算评分的精确匹配或过滤。
      什么是相关性评分?
      相关性评分是 Elasticsearch 在返回搜索结果时,用来衡量每个文档与查询条件的匹配程度的一个分值。每个文档返回时都有一个 _score 值,表示这个文档与查询的匹配程度。分数越高,意味着这个文档与查询条件越相关。
      构建的查询语句:
GET /gulimall_product/_search
{"query": {"bool": {"must": [{"match": {"skuTitle": "iphone"}}],"filter": [{"term": {"catalogId": {"value": "225"}}},{"terms": {"brandId": ["8","9"]}},{"nested": {"path": "attrs","query": {"bool": {"must": [{"term": {"attrs.attrId": {"value": "1"}}},{"terms": {"attrs.attrValue": ["5G","4G"]}}]}}}},{"term": {"hasStock": {"value": "false"}}},{"range": {"skuPrice": {"gte": 4999,"lte": 5400}}}]}},"sort": [{"skuPrice": {"order": "desc"}}],"from": 0,"size": 10,"highlight": {"fields": {"skuTitle":{}},"pre_tags": "<b style='color:red'>","post_tags": "</b>"},"aggs": {"brand_agg": {"terms": {"field": "brandId","size": 10},"aggs": {"brand_name_agg": {"terms": {"field": "brandName","size": 10}},"brand_img-agg": {"terms": {"field": "brandImg","size": 10}}}},"catalog_agg":{"terms": {"field": "catalogId","size": 10},"aggs": {"catalog_name_agg": {"terms": {"field": "catelogName","size": 10}}}},"attr_agg":{"nested": {"path": "attrs"},"aggs": {"attr_id_agg": {"terms": {"field": "attrs.attrId","size": 10},"aggs": {"attr_name_agg": {"terms": {"field": "attrs.attrName","size": 10}},"attr_value_agg":{"terms": {"field": "attrs.attrValue","size": 10}}}}}}}
}

  对于其中一些关键点的解释:

  • nested:用于处理文档中的嵌套字段嵌套字段指的是ES文档中存储的对象类型的数据,而普通的对象的ES中会被扁平化处理,可能会导致错误匹配的现象。而定义一个字段为嵌套类型时,Elasticsearch 会将每个嵌套对象视为独立的小文档,但它仍然与父文档保持关联。
#定义嵌套字段
{"mappings": {"properties": {"attrs": {"type": "nested", "properties": {"attrId": { "type": "integer" },"attrValue": { "type": "text" }}}}}
}```bash
# 查询嵌套字段
{"nested": {"path": "attrs","query": {"bool": {"must": [{ "term": { "attrs.attrId": 1 } },{ "term": { "attrs.attrValue": "红色" } }]}}}
}
  • aggs:是一种用于计算统计信息、汇总数据的功能。可以对查询到的结果进行分析、分组、统计等操作,aggs还可以嵌套使用,即在一个聚合内部定义另一个聚合:
#先根据 brandId 字段对文档进行分组,然后对每个 brandId 组计算该组中文档的 price 字段的平均值。
{"aggs": {"brand_agg": {"terms": {"field": "brandId"},"aggs": {"avg_price": {"avg": {"field": "price"}}}}}
}

而对于嵌套字段的聚合,需要进行特殊处理:

# 首先对嵌套字段 attrs 进行聚合,然后对 attrs.attrId 进行 terms 聚合
{"aggs": {"nested_attrs": {"nested": {"path": "attrs"},"aggs": {"attr_id": {"terms": {"field": "attrs.attrId"}}}}}
}

2.2、整合业务代码

  到这里查询语句就已经构建完毕了,但是还需要将查询语句转化成Java语言,利用RestHighLevelClient发送请求进行查询并且解析返回结果:

    /*** 商品上架后信息保存在es->根据前端传递的搜索条件构建dsl去es中搜索->解析并封装查询结果给前端页面* @param searchDTO 条件* @return*/@Overridepublic SearchVO searchForCondition(SearchDTO searchDTO) {//构建查询请求SearchRequest searchRequest = this.getSearchRequest(searchDTO);SearchVO vo;try {//查询SearchResponse searchResponse = client.search(searchRequest, RequestOptions.DEFAULT);System.out.println("返回的结果"+searchResponse.toString());//解析查询结果,封装成SearchVOvo = this.parseSearchRequest(searchResponse,searchDTO);} catch (Exception e) {throw new RuntimeException(e);}return vo;}

  查询:

    private SearchRequest getSearchRequest(SearchDTO searchDTO) {// 构建查询SearchSourceBuilder searchSourceBuilder = new SearchSourceBuilder();// Bool查询BoolQueryBuilder boolQuery = QueryBuilders.boolQuery();// 模糊匹配 skuTitlethis.likeSearch(searchDTO, boolQuery);//过滤查询this.filter(searchDTO, boolQuery, searchSourceBuilder);//分页高亮排序this.sortPageAndHighlight(searchDTO, searchSourceBuilder);//对搜索的结果进行聚合分析this.termsAggregation(searchSourceBuilder);//测试 打印构建结果String s = searchSourceBuilder.toString();System.out.println("构建的 DSL" + s);//创建搜索请求SearchRequest searchRequest = new SearchRequest(newString[]{ESConstants.PRODUCT_INDEX}, searchSourceBuilder);return searchRequest;}

  标题模糊匹配:

    private void likeSearch(SearchDTO searchDTO, BoolQueryBuilder boolQuery) {String keyword = searchDTO.getKeyword();if (StringUtils.isNotBlank(keyword)) {boolQuery.must(QueryBuilders.matchQuery("skuTitle", keyword)); //对应es中的must}}

  过滤查询:

    private void filter(SearchDTO searchDTO, BoolQueryBuilder boolQuery, SearchSourceBuilder searchSourceBuilder) {// catalogId 查询Long catalog3Id = searchDTO.getCatalog3Id();if (!ObjectUtils.isEmpty(catalog3Id)) {boolQuery.filter(QueryBuilders.termsQuery("catalogId", new long[]{catalog3Id})); //对应es中的filter}//bool - filter - 按照品牌 id 查询List<Long> brandId = searchDTO.getBrandId();if (!CollectionUtils.isEmpty(brandId)) {boolQuery.filter(QueryBuilders.termsQuery("brandId",brandId));}//bool - filter - 按照所有指定的属性进行查询List<String> attrs = searchDTO.getAttrs();if (!CollectionUtils.isEmpty(attrs)) {BoolQueryBuilder nestedboolQuery = QueryBuilders.boolQuery(); //对应es中的nested//进行处理//attr=1_5寸:8寸for (String attr : attrs) {String attrId = attr.split("_")[0];String value = attr.split("_")[1];
//                String[] attrValues = s.split(":");nestedboolQuery.must(QueryBuilders.termQuery("attrs.attrId",attrId));nestedboolQuery.must(QueryBuilders.termsQuery("attrs.attrValue",value));//每一个必须都得生成一个 nested 查询NestedQueryBuilder nestedQuery =QueryBuilders.nestedQuery("attrs", nestedboolQuery, ScoreMode.None);boolQuery.filter(nestedQuery);}}//bool - filter - 按照库存是否有进行查询if (searchDTO.getHasStock() != null) {boolQuery.filter(QueryBuilders.termQuery("hasStock",searchDTO.getHasStock() == 1));}//1.2、bool - filter - 按照价格区间if (!StringUtils.isEmpty(searchDTO.getSkuPrice())) {//1_500/_500/500_/*** "range": {* "skuPrice": {* "gte": 0,* "lte": 6000* }* }*/RangeQueryBuilder rangeQuery =QueryBuilders.rangeQuery("skuPrice"); //对应es中的rangeString[] s = searchDTO.getSkuPrice().split("_");if (s.length == 2) {//区间rangeQuery.gte(s[0]).lte(s[1]);} else if (s.length == 1) {if (searchDTO.getSkuPrice().startsWith("_")) {rangeQuery.lte(s[0]);}if (searchDTO.getSkuPrice().endsWith("_")) {rangeQuery.gte(s[0]);}}boolQuery.filter(rangeQuery);}//把以前的所有条件都拿来进行封装searchSourceBuilder.query(boolQuery);}

  分页高亮排序:

    private void sortPageAndHighlight(SearchDTO searchDTO, SearchSourceBuilder searchSourceBuilder) {//排序//sort=hotScore_asc/descString sort = searchDTO.getSort();if (StringUtils.isNotBlank(sort)) {String sortStr = sort.split("_")[1];SortOrder order = sortStr.equalsIgnoreCase("asc") ? SortOrder.ASC : SortOrder.DESC;searchSourceBuilder.sort(sort.split("_")[0], order);}//分页searchSourceBuilder.from((searchDTO.getPageNum() - 1) *ESConstants.PRODUCT_PAGESIZE);searchSourceBuilder.size(ESConstants.PRODUCT_PAGESIZE);//高亮if (!StringUtils.isEmpty(searchDTO.getKeyword())) {HighlightBuilder builder = new HighlightBuilder();builder.field("skuTitle");builder.preTags("<b style='color:red'>");builder.postTags("</b>");searchSourceBuilder.highlighter(builder);}}

  聚合分析:

    private void termsAggregation(SearchSourceBuilder searchSourceBuilder) {/*** 聚合分析*///1、品牌聚合TermsAggregationBuilder brand_agg =AggregationBuilders.terms("brand_agg");brand_agg.field("brandId").size(50);//品牌聚合的子聚合brand_agg.subAggregation(AggregationBuilders.terms("brand_name_agg").field("brandName").size(1));brand_agg.subAggregation(AggregationBuilders.terms("brand_img_agg").field("brandImg").size(1));/*1、聚合 brand*/searchSourceBuilder.aggregation(brand_agg);//2、分类聚合 catalog_aggTermsAggregationBuilder catalog_agg =AggregationBuilders.terms("catalog_agg").field("catalogId").size(20);catalog_agg.subAggregation(AggregationBuilders.terms("catalog_name_agg").field("catalogName").size(1));/*2、聚合 catalog*/searchSourceBuilder.aggregation(catalog_agg);//3、属性聚合 attr_aggNestedAggregationBuilder attr_agg =AggregationBuilders.nested("attr_agg", "attrs");//聚合出当前所有的 attrIdTermsAggregationBuilder attr_id_agg =AggregationBuilders.terms("attr_id_agg").field("attrs.attrId");//聚合分析出当前 attr_id 对应的名字attr_id_agg.subAggregation(AggregationBuilders.terms("attr_name_agg").field("attrs.attrName").size(1));//聚合分析出当前 attr_id 对应的所有可能的属性值 attrValueattr_id_agg.subAggregation(AggregationBuilders.terms("attr_value_agg").field("attrs.attrValue").size(50));attr_agg.subAggregation(attr_id_agg);/*3、聚合 attr*/searchSourceBuilder.aggregation(attr_agg);}

  解析返回结果:

    private SearchVO parseSearchRequest(SearchResponse resp, SearchDTO searchDTO) {SearchVO vo = new SearchVO();//外层hitsSearchHits hits = resp.getHits();//里层hitsSearchHit[] hitsArr = hits.getHits();List<ESPojo> esPojos = Arrays.stream(hitsArr).map(searchHit -> {//_sourceString sourceAsString = searchHit.getSourceAsString();ESPojo esPojo = JSON.parseObject(sourceAsString, ESPojo.class);//判断是否按关键字检索,若是就显示高亮,否则不显示if (!StringUtils.isEmpty(searchDTO.getKeyword())) {//拿到高亮信息显示标题HighlightField skuTitle = searchHit.getHighlightFields().get("skuTitle");String skuTitleValue = skuTitle.getFragments()[0].string();esPojo.setSkuTitle(skuTitleValue);}return esPojo;}).collect(Collectors.toList());//返回的所有商品vo.setProducts(esPojos);//聚合信息ParsedLongTerms brandAgg = resp.getAggregations().get("brand_agg");List<? extends Terms.Bucket> brandAggBuckets = brandAgg.getBuckets();List<SearchVO.BrandsVO> brandsVOS = brandAggBuckets.stream().map(bucket -> {SearchVO.BrandsVO brandsVO = new SearchVO.BrandsVO();//得到品牌idlong brandId = bucket.getKeyAsNumber().longValue();brandsVO.setBrandId(brandId);//得到品牌名字ParsedStringTerms brandNameAgg = bucket.getAggregations().get("brand_name_agg");String brandName = brandNameAgg.getBuckets().get(0).getKeyAsString();brandsVO.setBrandName(brandName);//3、得到品牌的图片ParsedStringTerms brandImgAgg = bucket.getAggregations().get("brand_img_agg");String brandImg = brandImgAgg.getBuckets().get(0).getKeyAsString();brandsVO.setBrandImg(brandImg);return brandsVO;}).collect(Collectors.toList());//封装品牌信息vo.setBrands(brandsVOS);ParsedLongTerms catalogAgg = resp.getAggregations().get("catalog_agg");List<? extends Terms.Bucket> catalogAggBuckets = catalogAgg.getBuckets();List<SearchVO.CatalogsVO> catalogsVOS = catalogAggBuckets.stream().map(bucket -> {SearchVO.CatalogsVO catalogsVO = new SearchVO.CatalogsVO();//得到分类ID//得到品牌idlong catelogId = bucket.getKeyAsNumber().longValue();catalogsVO.setCatalogId(catelogId);//得到品牌名称ParsedStringTerms catalogNameAgg = bucket.getAggregations().get("catalog_name_agg");String catalogName = catalogNameAgg.getBuckets().get(0).getKeyAsString();catalogsVO.setCatalogName(catalogName);return catalogsVO;}).collect(Collectors.toList());//封装分类信息vo.setCatalogs(catalogsVOS);ParsedNested attrsAgg = resp.getAggregations().get("attr_agg");ParsedLongTerms attrIdAgg = attrsAgg.getAggregations().get("attr_id_agg");List<? extends Terms.Bucket> attrsAggBuckets = attrIdAgg.getBuckets();List<SearchVO.AttrsVo> attrsVoList = attrsAggBuckets.stream().map(bucket -> {SearchVO.AttrsVo attrsVo = new SearchVO.AttrsVo();//属性IDlong attrId = bucket.getKeyAsNumber().longValue();attrsVo.setAttrId(attrId);//属性名称ParsedStringTerms attrNameAgg = bucket.getAggregations().get("attr_name_agg");attrsVo.setAttrName(attrNameAgg.getBuckets().get(0).getKeyAsString());//属性值ParsedStringTerms attrValueAgg = bucket.getAggregations().get("attr_value_agg");List<String> attrValues = attrValueAgg.getBuckets().stream().map(item -> item.getKeyAsString()).collect(Collectors.toList());attrsVo.setAttrValue(attrValues);return attrsVo;}).collect(Collectors.toList());//封装属性信息vo.setAttrs(attrsVoList);//封装分页参数vo.setPageNum(searchDTO.getPageNum());int total = (int) resp.getHits().getTotalHits().value;vo.setTotal(total);int totalPages = (int)total % ESConstants.PRODUCT_PAGESIZE == 0 ?(int)total / ESConstants.PRODUCT_PAGESIZE : ((int)total / ESConstants.PRODUCT_PAGESIZE + 1);vo.setTotalPages(totalPages);return vo;}

  到这里为止,构建查询语句,查询ES,解析返回结果的操作就完成了。在高亮展示这一块,有一个很坑的点:如果在对标题进行匹配时,是这样写的:boolQuery.must(QueryBuilders.matchQuery("skuTitle", keyword)).fuzziness(Fuzziness.AUTO)); 实测高亮展示会失效。因为.fuzziness(Fuzziness.AUTO)是模糊匹配的一个配置选项,表示自动确定模糊匹配的程度。下面简单说一下它的工作机制:
  对于长度较短的词(1到2个字符),不进行模糊匹配。对于长度为3到5个字符的词,允许最多一个字符不同。也就是说,输入的词和索引中的词之间最多可以有一个字符的差异。对于长度超过5个字符的词,允许最多两个字符不同,即输入的词和索引中的词之间可以有两处字符差异。
  为什么加上了会使高亮展示失效?因为模糊匹配会容忍一定的字符变化,比如拼写错误或词形变化。高亮显示依赖于精确匹配的词,只有当查询中的词语与索引中的词精确匹配时,ES才会高亮显示。

后记

  本篇主要介绍了ES的组成和基本概念,以及环境搭建,项目业务整合ES。因为项目的重点是后端的逻辑,所以前端模板页面的改造没有写入本篇。在做这个项目之前,去年有曾经专门去看过某马的关于ES的专题教学视频,语法介绍的很详细,当时还跟着敲了一遍。但是工作中至今未遇到使用场景,在做这个项目的时候不出意外地发现几乎全部遗忘了。在这里想说的是,语法并非重点,重点是理解各自项目的业务逻辑,做好笔记,能根据案例和实际的业务场景举一反三。

  下一篇:认证服务


http://www.ppmy.cn/ops/113922.html

相关文章

详解QT元对象系统用法

文章目录 元枚举 QMetaEnum元方法 QMetaMethod元对象构建 QMetaObjectBuilder元属性 QMetaProperty定义元对象属性获取属性信息与信号和槽结合QML属性访问动态属性元类型 QMetaTypeQt的元对象系统是Qt框架中的一个核心特性,它为Qt应用程序提供了一种动态类型信息机制。这种机制…

HarmonyOS开发实战( Beta5.0)橡皮擦案例实践详解

鸿蒙HarmonyOS开发往期必看&#xff1a; HarmonyOS NEXT应用开发性能实践总结 最新版&#xff01;“非常详细的” 鸿蒙HarmonyOS Next应用开发学习路线&#xff01;&#xff08;从零基础入门到精通&#xff09; 介绍 本示例通过ohos.graphics.drawing库和blendMode颜色混合实…

ubuntu系统插入u盘不识别

fdisk -l Disk /dev/sdb&#xff1a;1.84 TiB&#xff0c;2000398934016 字节&#xff0c;3907029168 个扇区 Disk model: Elements SE SSD 和lsblk显示的都不对 sdb 8:16 0 1.8T 0 disk └─sdb1 8:17 0 1.8T 0 part 要用 sudo mount /dev/sdb1 /home/nvidia/usb//dev/sdb1

关于实时数仓的几点技术分享

一、实时数仓建设背景 业务需求的变化&#xff1a;随着互联网和移动互联网的快速发展&#xff0c;企业的业务需求变得越来越复杂和多样化&#xff0c;对数据处理的速度和质量要求也越来越高。传统的T1数据处理模式已经无法满足企业的需求&#xff0c;实时数据处理成为了一种必…

在 PyCharm 中配置 Anaconda 环境

在 PyCharm 中配置 Anaconda 环境&#xff0c;你需要遵循以下步骤&#xff1a; 打开 PyCharm。 创建一个新项目或打开一个现有项目。 在 PyCharm 中&#xff0c;点击 File > Settings (或 PyCharm > Preferences 在 macOS)。 在弹出的设置窗口中&#xff0c;选择 Pro…

vscode 设置

code runner设置运行代码弹出运行窗口 要让VSCode在输cmd窗口&#xff0c;可以按照以下步骤进行设置&#xff1a; 1. 打开VSCode并进入”文件”->”首选项”->”设置”&#xff0c;或者使用快捷键Ctrl ,。 2. 在设置页面的搜索栏中输入”External Terminal”&#xf…

大型语言模型 (LLM) 劫持攻击不断升级,导致每天损失超过 100,000 美元

Sysdig 威胁研究团队 (TRT) 报告称&#xff0c;LLMjacking&#xff08;大型语言模型劫持&#xff09;事件急剧增加&#xff0c;攻击者通过窃取的云凭证非法访问大型语言模型 (LLM)。 这一趋势反映了 LLM 访问黑市的不断增长&#xff0c;攻击者的动机包括个人使用和规避禁令和制…

LLaMA-Factory 使用 sharegpt 格式的数据集

LLaMA-Factory 使用 sharegpt 格式的数据集 flyfish sharegpt 格式的数据集遵循的格式 [{"conversations": [{"from": "human","value": "user instruction"},{"from": "gpt","value": &q…