es在索引中自定义简单的分词器 Analyzer 扩展

news/2025/1/16 23:19:39/

es在索引中自定义简单的分词器 Analyzer 扩展


PUT index1
{
  "settings": {
    "analysis": {
      "analyzer": {
        "ik_max_word_expand": {
          "type": "custom",
          "char_filter": "html_strip",
          "tokenizer": "ik_max_word"
        }
      }
    }
  }
}

 

在索引中自定义简单的分词器 Analyzer

上面各个步骤介绍了Analyzer的构成,以及ElasticSearch为每一部分所提供的默认实现,通过组合这些默认实现,我们可以构建属于自己的 Analyzer。

自定义的 Analyzer 必须关联到一个索引上,其语法格式如下:

PUT 索引名称

{

"settings": {

    "analysis": {
 

      "analyzer": {
 

        "自定义分词器名称":{
 

              自定义分词器具体内部实现
 

        }
 

      }
 

    }
 

  }
}

通过组合 html strip (character filter), ik_max_word(tokernizer)来实现自己的分词器

GET index1


POST /index1/_analyze
{
  "analyzer": "ik_max_word_expand",
  "text": "我们是中国人<html>2</html>

}

 

 


http://www.ppmy.cn/news/38614.html

相关文章

Linux系统之普通用户sudo提权配置

Linux系统之普通用户sudo提权配置一、检查本地系统版本二、创建redhat普通用户1.创建redhat用户2.为redhat用户设置密码3.查询创建用户相关命令的绝对路径三、编辑/etc/sudoers文件四、检查redhat用户权限1.切换到redhat用户2.新建huawei账号3.查看新创建用户4.为huawei账号设置…

手机卡顿、内存不足?360清理大师排忧解难

当下&#xff0c;手机越用越卡已经成为不少用户普遍的困境。然而这些问题的存在并非是手机质量问题&#xff0c;很多时候可能是手机长期没有清理垃圾造成的。所幸&#xff0c;目前市面上已经出现了不少专业的清理软件&#xff0c;如360清理大师就是被更多人推荐的一款。它不仅可…

java代码新增或修改时候的验证字段唯一

java代码新增或修改时候的验证字段唯一 String PLOT_CODE_MSG "地块编码已存在"; //验证plotCode是否唯一&#xff0c;获取id String plotId plotService.getIdByPlotCode(plot.getPlotCode());//新增的时候判断是否存在if (Func.isEmpty(plot.getId())) {if (Fun…

做一个office转pdf的功能

前言: 在实际工作中,有时候我们开发手机app浏览office类型的文件时,开发难度会增加不少,为了减轻开发app同学的负担,这里我使用office类型的文件,统一转换为pdf格式的文件,以减少开发难度。 1、首先导入转换需要的jar 2、在pom文件中引入这几个jar <dependency>…

基于特征模型的全系数自适应控制

摘要&#xff1a; 首先推导了全系数和等于1的证明过程&#xff0c;分析了等效时间常数的概念&#xff0c;然后推导了递推最小二乘公式并用于参数辨识的方法&#xff0c;最后给几个仿真的例子。 全系数之和等于1 被控对象用微分方程 y(n)an−1y(n−1)⋯a0ybn−1u(n−1)⋯b0u(1.…

python 实现简单的KMediod

K-medoids 是 K-means 算法的一种改进算法&#xff0c;可以解决 K-means 中不稳定的问题&#xff0c;是一种基于聚类中心的距离度量方法&#xff0c;因此也被称为 partitioning around medoids &#xff08;PAM&#xff09;。 本篇博客将介绍 K-medoids 算法的原理和实现过程&…

图的遍历-DFS与BFS

图的遍历-DFS与BFS 绪论一.用vector存储图 + dfs二.用数组模拟邻接表存储图 + dfs三.用数组模拟邻接表存储图 + bfs绪论 有个问题:什么时候需要记录该点是否已经遍历过? 1.先说结论: D F S DFS DFS不需要记录该点是否已经遍历过

IOC、AOP、和javca面试题

一、 1、控制反转&#xff08;IOC&#xff09; 将创建管理对象的工作交给容器来做。在容器初始化&#xff08;或在某个时间节点&#xff09;通过反射机制创建好对象&#xff0c;在使用时直接从容器中获取。 控制反转&#xff1a;将对象的控制权反过来交给容器管理。 IOC实现…