Elasticsearch快速入门

devtools/2024/10/18 9:59:49/

文章目录

    • Elasticsearch快速入门
      • 核心概念
      • 倒排索引
      • 基本使用
        • 索引操作
          • 创建索引
            • 类型映射[了解]
            • 数据类型[了解]
          • 查看索引
          • 删除索引
        • 文档操作
          • 添加文档
          • 修改文档
          • 删除文档
          • 查询文档
            • 准备数据
            • 主键查询
            • 精确查询
            • 匹配查询

Elasticsearch快速入门

核心概念

Elasticsearch是面向文档的,以json格式存储数据的NoSQL数据库,也是一个全文搜索引擎。

Elasticsearch关系型数据库(如Mysql)
索引(Index)数据库(Database)
类型(Type)表(Table)
文档(Document)行,记录(Row,Record)
字段(Field)列,字段(Column,Field)
映射(Mapping)约束(Schema)

注意:es中的类型在es7.x版本中已经没有,在后面的8.x版本中被彻底删除掉。

倒排索引

倒排索引(Inverted Index),是Elasticsearch中的索引工作机制。倒排索引是区别于正排索引的概念:

  • 正排索引:是以文档对象的唯一ID作为索引,以文档内容作为记录。
  • 倒排索引:指的是将文档内容中的单词作为索引,将包含该词的文档ID作为记录。

在这里插入图片描述

Elasticsearch的工作流程如下,因为使用倒排索引产生的文档记录要比mysql数据行少多了,所以会比较快。

在这里插入图片描述

基本使用

es提供了retfulAPI风格操作接口给开发者对索引、类型、文档、字段、映射等进行增删查改操作。

索引操作
创建索引

请求格式:

PUT /索引名称
类型映射[了解]

相当于在mysql中创建数据表时的字段类型

# 索引名称必须已经存在!
POST /索引名称/类型名称
{"类型名称": { // 映射的类型名称"properties": {  // 索引中文档的属性"字段名": {           // 属性名或字段名"type": "text"   // 属性值类型或字段类型,text表示文本,如商品标题"index": "analyzed",    // 索引类型"analyzer": "ik_smart"  // 设置使用的分词器[标准分词]},"字段名": {           // 属性名或字段名"type": "text"   // 属性值类型或字段类型,text表示文本,如商品标题"index": "analyzed",    // 索引类型"analyzer": "standard"  // 设置使用的分词器},"字段名": {           // 属性名或字段名"type": "text"   // 属性值类型或字段类型,text表示文本,如商品标题"index": "analyzed",    // 索引类型"analyzer": "standard"  // 设置使用的分词器}}}
}

kinana操作:

POST /indexes1/goods
{"mapping": {"properties": {"id": {"type": "long"},"name": {"type": "text","index": "analyzed","analyzer": "ik_max_word"},"price":{"type": "float"},"created_time":{"type": "date","format":"yyyy-MM-dd HH:mm:ss"}}}
}
数据类型[了解]

elasticsearch中支持的常见字段数据类型:

类型描述
text字符串类型,可以模糊查询, 可以分词查询,不能聚合、排序
keyword字符串类型,只能精准查询, 不能分词查询,可以聚合、排序
long有符号的64位整数, 范围:[−263 ~ 263-1]
Integer有符号的32位整数, 范围: [−231 ~ 231-1]
short有符号的16位整数, 范围: [-32768 ~ 32767]
byte有符号的8位整数, 范围: [-128 ~ 127]
float32位单精度浮点数
double64位双精度浮点数
boolean布尔类型,支持使用字符串,数字等零值表示true/false
date日期类型,
date_nanos日期纳秒类型,
binary二进制类型,Base64编码字符串的二进制值
Range范围类型,有integer_range, float_range, long_range, double_range, date_range等
array数组类型,ES中没有专门的数组类型, 直接使用[ ]定义即可,所有的成员的值必须是同一种数据类型
object对象类型,以json对象为结构

使用默认类型_doc代替映射的创建,es会内部自动推断字段类型。

PUT /indexes2/_doc/文档ID
{"name": "商品的标题","price": 18,"created_time": "2022-01-10 22:00:31"
}

_doc 就是默认类型(default type),type在8.x版本会被彻底删除,以后使用默认类型_doc替代即可。

查看索引
GET /_cat/indices      # 查看所有的索引信息
GET /索引名称           # 查看指定名称的索引信息
删除索引
DELETE /索引名称
文档操作
请求方法/methoduri地址描述
PUT(创建,修改)/索引名称/_doc/文档id创建文档(指定文档id)
POST(创建)/索引名称/_doc/文档id创建文档,如果uri地址只是以_doc结尾,文档id是随机生成的)
POST(修改)/索引名称/_doc/文档id/_update修改文档
DELETE(删除)/索引名称/_doc/文档id删除文档
GET(查询)/索引名称/_doc/文档id查询文档通过文档ID
POST(查询)/索引名称/_doc/文档id/_search查询所有数据
添加文档
POST /索引名称/_doc
{"id": 1,"name": "华为手机","category": "华为","cover": "1.png","price": "3999.00"
}
修改文档
POST /索引名称/_doc/1
{"name": "华为手机mate40","price": "4999.00"
}
删除文档
DELETE /索引名称/_doc/1
查询文档

查询文档有三种方式:

  • 主键查询:根据文档id查询
  • 精确查询:根据关键词查询,也叫term查询 浪潮之巅 -> 浪潮之巅
  • 匹配查询:根据输入的内容先对内容进行分词,再进行分词匹配查询 浪潮 -> 浪潮之巅
准备数据
POST /indexes4/_doc/1
{"created_time":"2022-04-01","title":"浪潮之巅","content":"一部IT人非读不可,而非IT人也应该阅读的作品,讲故事的经典作品","author_id": 119
}POST /indexes4/_doc/2
{"post_date":"2022-03-12","title":"人月神话","content":"一部IT人非读不可,而非IT人也应该阅读的作品,讲人与团队关系作品","author_id": 120
}POST /indexes4/_doc/3
{"post_date":"2021-12-16","title":"代码之髓","content":"小日子过得不错的人写的作品,对代码中各种语言结构的实现进行揭秘","author_id": 110
}
主键查询
# GET /索引名称/_doc/1
GET /indexes4/_doc/3
精确查询
POST /索引名称/_search{"query": {"term": {"字段名": {"value": "字段值"},"字段名": {"value": "字段值"}}}
}# 如果是text格式,无法精确查询的,只能匹配查询

kibana操作:

POST /indexes4/_search
{"query": {"term": {"author_id": {"value": 119}}}
}
匹配查询

查询所有

POST /索引名称/_search
{"query": {"match_all": {}},"sort": [  # 排序,注意:text无法使用排序,keyword才支持# {"字段名":"排序规则,asc正序, desc倒序"}{"title": "asc" }],"from": 0,                       # 分页,查询起始下标"size": 2,                       # 指定返回结果数量"_source": ["title", "content"]  # 指定只返回部分字段
}

kibana操作:

POST /indexes4/_search
{"query": {"match_all": {}},"sort": {"author_id": "desc"},"from": 0,"size": 4,"_source": ["title"]
}

条件查询

格式:

POST /索引名称/_search
{"query": {"match": {"字段名": "查询条件值"}}
}
POST /indexes4/_search
{"query": {"match": {"content": "非读不可"}}
}

若有错误与不足请指出,关注DPT一起进步吧!!!


http://www.ppmy.cn/devtools/117455.html

相关文章

JavaEE:探索网络世界的魅力——玩转UDP编程

文章目录 UDPUDP的特点UDP协议端格式校验和前置知识校验和具体是如何工作的? UDP UDP的特点 UDP传输的过程类似于寄信. 无连接: 知道对端的IP和端口号就直接进行传输,不需要建立连接.不可靠: 没有确认机制,没有重传机制,如果因为网络故障导致该段无法到达对方,UDP协议也不会…

CentOS下安装Kibana(保姆级教程)

前言 Kibana是一个开源的数据分析和可视化平台,通常与Elasticsearch一起使用,用于展示和分析大规模数据集。以下是关于Kibana的一些主要特点和功能: 数据可视化: Kibana允许用户将数据转化为交互式、实时的图形和可视化展示&…

STM32单通道ADC连续采集

0.91寸OLED屏幕大小的音频频谱,炫酷! RTT——一种代替串口打印的调试神器 经典振荡器电路及原理分析(超值文章) 超级简单的画PCB封装技巧,从此告别繁琐计算 前面介绍了关于ADC单通道单次采样软件触发的方式《STM32…

图像面积计算一般方法及MATLAB实现

一、引言 在数字图像处理中,经常需要获取感兴趣区域的面积属性,下面给出图像处理的一般步骤。 1.读入的彩色图像 2.将彩色图像转化为灰度图像 3.灰度图像转化为二值图像 4.区域标记 5.对每个区域的面积进行计算和显示 二、程序代码 %面积计算 cle…

获取 Jupyter Notebook IPython kernel 在电脑中的目录位置

获取 Jupyter Notebook IPython kernel 在电脑中的目录位置 正文 正文 在 VS code 的 terminal 中或者 Windows 的命令行中使用如下代码即可。 ipython locate运行后得到如下结果: 如图所示,我们获取到了 ipython 的位置。 如果大家觉得有用&#xf…

YOLOv5白皮书-第Y2周:训练自己的数据集(云jupyter运行版 )

>- **🍨 本文为[🔗365天深度学习训练营](小团体~第八波) 中的学习记录博客** >- **🍖 原作者:[K同学啊](K同学啊-CSDN博客)** 目录 前言 一、.xml文件里保存的是什么 二、准备好自己的数据 三、创建split_tr…

【jvm】动态链接为什么需要常量池

目录 1. 常量池的作用2. 动态链接与常量池的关系3. 动态链接的必要性 1. 常量池的作用 1.常量池是JVM(Java虚拟机)中用于存储字面量(如字符串常量、整数常量等)和符号引用(如类和接口的完全限定名、字段的名称和描述符…

Vue 入门之 computed 计算属性

文章目录 一、基础语法二、计算属性 vs 方法三、完整写法四、代码样例 在 Vue 开发中,computed计算属性是一个非常强大且常用的特性。它可以帮助我们更高效地处理数据的转换和派生,使代码更加简洁和易于维护。本文将详细介绍 Vue 中computed计算属性的基…