Elasticsearch 8 的详细安装步骤和基本使用

server/2024/10/18 6:30:47/

一、Elasticsearch

简介

Elasticsearch 8 简称 es8 是一款非常强大的开源搜索引擎,具备非常多强大功能,网上对其有非常详细的定义这里不多做赘述,总之它是在你查询语句性能达到瓶颈,并且使用了索引、缓存等手段仍然无法突破的情况下的另一种十分有效的解决方案

基本概念

Elasticsearch 是一个基于 Lucene 的分布式搜索引擎,它不仅可以进行全文搜索,还能够用于分析大量数据。它的核心概念主要包括以下几个:

1. 索引(Index)

IndexElasticsearch 中的最基本单元,类似于关系型数据库中的“数据库”。每个索引都包含许多文档,存储了我们要进行搜索的数据。可以把它理解为数据的集合。

2. 文档(Document)

文档是具体的数据实体,存储在索引中。它类似于数据库中的“行”。每个文档是一个JSON格式的对象,包含了具体的信息,比如用户信息、产品详情等。

3. 类型(Type)

Elasticsearch 6 版本及之前,索引中可以包含不同类型的文档(Type),类似于数据库中的表。但是在 Elasticsearch 7 之后,Type 被逐渐弃用,每个索引只能有一个类型。

4. 字段(Field)

字段(Field),就是JSON文档中的字段,类似数据库中的列(Column

5. 映射(Mapping)

Mapping(映射)是索引中文档的约束,例如字段类型约束。类似数据库的表结构(Schema

6. DSL

DSLelasticsearch 提供的 JSON 风格的请求语句,用来操作 elasticsearch,实现 CRUD


二、安装

我们使用 docker 的方式来安装 es8

https://hub.docker.com/_/elasticsearch/tags

1.拉取 ElasticSearch 镜像

我这边选择的版本是以 8 以上为主,所以使用8.8.1linux 的发行版是 ubantu

docker pull elasticsearch:8.8.1

2.创建并运行容器

使用以下命令创建一个新的 elasticsearch 容器并将其启动:

docker run --name some-elasticsearch -p 9200:9200 -p 9300:9300 -e "discovery.type=single-node" -d elasticsearch:8.8.1
  • --name some-elasticsearch:给容器起个名字 some-elasticsearch ,方便管理。
  • -p 9200:9200:将本地的 9200 端口映射到容器内的 9200 端口(这是 Elasticsearch 对外提供 RESTful 接口的端口)。
  • -p 9300:9300:将本地的 9300 端口映射到容器内的 9300 端口(这是集群节点之间通信的端口)。
  • -e "discovery.type=single-node" 表示 指定 Elasticsearch 节点在单节点模式下运行,即启动一个独立的 Elasticsearch 实例而不是一个多节点集群
  • -d 表示后台运行。

假如 pull 不下来,给配置文件添加以下镜像地址

vim /etc/docker/daemon.json
{"registry-mirrors": ["https://docker.211678.top","https://docker.1panel.live","https://hub.rat.dev","https://docker.m.daocloud.io","https://do.nark.eu.org","https://dockerpull.com","https://dockerproxy.cn","https://docker.awsl9527.cn"]
}

重启 docker

systemctl daemon-reload
systemctl restart docker

3.测试,是否启动成功

注意: es8.0以上默认开启了 ssl 认证

直接访问 : http://xxx.xxx.xxx:9200 是无法访问的,需要访问 https,或者关闭 SSL 认证

Elasticsearch 7.8.0 版本开始,Elasticsearch 不再提供默认的用户名和密码。相反,它采用了内置安全特性,并引入了超级用户(superuser)角色和内置用户(built-in users)概念来管理访问控制。

在新安装的情况下,您需要设置一个初始的内置用户以及相关的登录凭据。可以通过修改 Elasticsearch 的配置文件 elasticsearch.yml 来完成此操作。

  1. 将容器内容的配置文件复制到本地修改:

    docker cp some-elasticsearch:/usr/share/elasticsearch/config/elasticsearch.yml /root/elasticsearch.yml
    
  2. 在本地编辑文件

    vim /root/elasticsearch.yml
    

    打开 elasticsearch.yml 文件 找到 xpack.security.enabled: true 改为 xpack.security.enabled: false ,这样就可以直接使用 http 访问,并且不需要账号密码鉴权,这个设置看个人情况,如果是生产环境建议开始开启 https 和账号密码鉴权

    在这里插入图片描述

  3. 将修改后的文件复制回容器:

    docker cp /root/elasticsearch.yml some-elasticsearch:/usr/share/elasticsearch/config/elasticsearch.yml
    
  4. 重启容器

    docker restart some-elasticsearch
    

    在访问 http://127.0.0.1:9200

    在这里插入图片描述

4. 安装ElastIcSearch 可视化管理界面 Kibana

  1. 拉取Kibana镜像

    docker pull kibana:8.8.1
    
  2. 启动 Kibana

    docker run --name some-kibana -p 5601:5601 -d kibana:8.8.1
    

    5601 表示 Kibana 访问端口,开启主机与容器端口映射

  3. 配置 Kibana

    将容器内容的配置文件复制到本地修改:

    docker cp some-kibana:/usr/share/kibana/config/kibana.yml /root/kibana.yml
    

    在本地编辑文件

    vim kibana.yml
    
    • 打开 kibana.yml 文件 增加 csp.strict: false 设置 CSP 启用 Kibana 模式,如果为 true 那么会对浏览器进行安全检查
    • 增加 i18n.locale: "zh-CN" 配置中文
    • elasticsearch.hosts: [ "http://elasticsearch:9200" ] 改为 具体 Elasticsearch 通信地址

    在这里插入图片描述
    将修改后的文件复制回容器:

    docker cp /root/kibana.yml some-kibana:/usr/share/kibana/config/kibana.yml
    
  4. 重启 kibana

    docker restart some-kibana
    
  5. 访问 Kibana

    http://xxx.xxx.xxx:5601
    

    在这里插入图片描述
    点击左侧边栏开发工具打可以打开控制台

在这里插入图片描述

5. IK 分词器安装

Elasticsearch 在创建倒排索引时,需要对文档进行分词;在搜索时对用户的输入内容进行分词,但默认的分词效果不好,可以安装 IK 分词来处理。

主要有两种方式:在线安装和离线安装

在线安装

1、进入容器内部

docker exec -it some-elasticsearch bash

2、下载安装

注:下载的包一定要和 ElasticSearch 的版本一致。

./bin/elasticsearch-plugin install https://github.com/medcl/elasticsearch-analysis-ik/releases/download/v8.8.1/elasticsearch-analysis-ik-8.8.1.zip

稍等一会,输入y,确认安装

在这里插入图片描述

3、退出并启动

exit
docker restart es

6. 验证分词器

IK 分词主要有两种模式

  • ik_smart 最少切分 粗粒度切分 智能切分
  • ik_max_word 最细切分 最新粒度切分

举例如下:

ik_smart 粗粒度分词,只展示出 程序员

POST /_analyze
{"text":"1024程序员节","analyzer":"ik_smart"
}

在这里插入图片描述

ik_max_word 细粒度分词,展示出 程序员、程序、员

POST /_analyze
{"text":"1024程序员节","analyzer":"ik_max_word"
}

在这里插入图片描述

离线安装

1、查询数据卷目录

// 输入数据卷
docker volume inspect es-plugins

插件安装需要获取 Elasticsearchplugins 目录的挂载位置

2、上传 安装包到 指定位置

下载 elasticsearch-analysis-ik-8.8.1.zip 放到 第一步查询目录下,进行挂载,注意这里的版本选择的是 8.8.1

3、重启容器

// 重启
docker restart es
// 查看日志
docker logs -f es

三、基本操作

3.1 索引操作

Elasticsearch 采用 Rest 风格 API,因此其 API 就是一次 http 请求,你可以用任何工具发起 http 请求

1)创建索引

PUT /索引名称
{"settings":{"属性名":"属性值"}
}

settings:索引库设置,可以定义索引库的属性,例如:分片数、副本数;也可以不设置,采用默认属性。

2)判断索引是否存在

HEAD/索引名称

3)查看单个索引

GET /索引名称

4)批量查看索引

GET /索引名称1,索引名称2...

5)查看所有索引

GET _all

在这里插入图片描述

GET /_cat/indices?v

在这里插入图片描述

6)打开、关闭索引

打开:

POST /索引名称/_open

关闭

POST /索引名称/_close

删除索引

DELETE /索引名称1,索引名称2...

3.2 映射操作

索引创建之后,等于有了关系型数据库中的 databaseElasticsearch7.x 取消了索引 type 类型的设置,不允许指定类型,默认为 _doc,但字段仍然是有的,需要设置字段的约束信息,叫做字段映射(mapping),字段的约束包括但不限于:

  • 字段的数据类型
  • 是否要存储
  • 是否要索引
  • 分词器

1)创建映射字段

PUT /test-index/_mapping
{"properties": {"字段名": {"type": "类型","index": true,"store": true,"analyzer": "分词器"}}
}
  • type:类型,可以是text、long、short、date、integer、object
  • index:是否索引,默认为 true
  • store:是否存储,默认为 false
  • analyzer:指定分词器

示例:

PUT /ygp-company-index
PUT /ygp-company-index/_mapping/
{"properties": {"name": {"type": "text","analyzer": "ik_max_word"},"job": {"type": "text","analyzer": "ik_max_word"},"logo": {"type": "keyword","index": "false"},"payment": {"type": "float"}}
}

2)映射属性详解

Type

Elasticsearch支持的数据类型非常丰富:

  • String类型,可分为两种

    • text: 可分词,不可参与聚合
    • keywork: 不可分词,数据作为完整字段进行匹配,可以参与聚合
  • Numerical:数值类型,分两类

    • 基本数据类型:long、integer、short、byte、double、float、half_float
    • 浮点数的高精度类型: scaled_float
  • Date:日期类型

    • elasticsearch 可以对日期格式化为字符串存储,但是建议存储为毫秒,存储为 long,节省空间。
  • Array: 数组类型

    • 进行匹配时,任意一个元素满足,都认为满足
    • 排序时,如果升序则用数组中最小值来排序,如果降序则用数组中的最大值来排序
      Object:对象
{"name":"Tome","age": 20,"girl":{"name":"Rose","age":20,}
}

如果存储到索引库的是对象类型,例如上面的 girl,会把 girl 变成两个字段:girl.name和girl.age

index

index影响字段的索引情况:

  • true:字段会被索引,则可以用来进行搜索。默认值就是true。
  • false:字段不会被索引,不能用来搜索
store

是否将数据进行独立存储
原始的文本会存储在_source里面,默认情况下其他提取出来的字段都不是独立存储的,是从_source里面提取出来的,页可以独立存储某个字段,设置store:true;获取独立存储的字段要比从_source中解析快得多,但是也会占用更多的空间,所以要根据实际业务需求来设置,默认为false。

analyzer

指定分词器
一般处理中文会选择ik分词器:ik_max_word、ik_smart

3)映射操作

查看单个索引映射关系

GET /索引名称/_mapping

在这里插入图片描述

查看多个索引的映射

# 方式一
GET _mapping
# 方式二
GET all/_mapping

修改索引映射关系

PUT /索引名/_mapping
PUT /ygp-company-index/_mapping
{"properties": {"字段名": {"type": "类型","index": true,"store": true,"analyzer": "分词器"}}
}

同时创建索引和设置映射

PUT /mcs-index
{"settings": {"索引库属性名": "索引库属性值"},"mappings": {"properties": {"字段名": {"映射属性名": "映射属性值"}}}
}

增加映射

POST /activity-index/_mapping
{"properties": {"activityType": {"type": "keyword"}}
}

3.3 文档(doc)操作

文档,类比数据库中的每行数据,会根据规则创建索引,将来用于搜索;可以类比数据库中的一行数据。

1)新增文档

新增文档,id的生成方式有两种,手动指定或者自动生成。

新增文档(手动指定)

POST /索引名称/_doc/{id}
{"field":"value"
}

新增文档(自动生成id)

POST /索引名称/_doc
{"field":"value"
}

可以看到结果显示为: created ,代表创建成功。
另外,需要注意的是,在响应结果中有个 _id 字段,这个就是这条文档数据的 唯一标识 ,以后的增删改查都依赖这个 _id 作为唯一标示,这里是 Elasticsearch 帮我们随机生成的 id

2)查看单个文档

GET /索引名称/_doc/{id}

在这里插入图片描述

文档元数据解读:

元数据项含义
_indexdocument所属的index
_typedocument所属的type,Elasticsearch7.x默认type为_doc
_id代表document的唯一标识,与index一起,可以唯一标识和定位一个document
_versiondocument的版本号,Elasticsearch利用_version (版本号)的方式来确保应用中相互冲突的变更不会导致数据丢失。需要修改数据时,需要指定想要修改文档的version号,如果该版本不是当前版本号,请求将会失败
_seq_no严格递增的顺序号,每个document一个,严格递增,保证后写入的doc的_seq_no大于先写入的_seq_no
_primary_term任何类型的写操作,包括index、create、update和Delete,都会生成一个_seq_no。
foundtrue/false 是否查找到文档
_source存储原始文档

3)查看所有文档

POST /索引名称/_search
{"query": {"match_all": {}}
}

4)_source定制返回字段

某些业务场景下,我们不需要搜索引擎返回 _source 中的所有字段,可以使用 source 进行定制,如下,多个字段之间使用逗号分隔

GET /索引名称/_doc/{id}?_source=name

5)更新文档

更新所有属性

更新文档为PUT操作,更新时需要指定id

id对应的文档存在,则修改,id对应的文档不存在,则新增

PUT /ygp-company-index/_doc/9BlvdZIBo_i9DbGpUNi8
{"name": "更新"
}

在这里插入图片描述

这条记录不存在,返回的 _result 属性显示的时创建

再次执行上面的命令,并将数据修改一下:

PUT /ygp-company-index/_doc/9BlvdZIBo_i9DbGpUNi8
{"name": "更新2"
}

在这里插入图片描述
上面就是 Elasticsearch 使用 PUT 或者 POST 对文档进行更新(全部更新),如果指定 ID 的文档已经存在,则执行更新操作。

全部更新就是,Elasticsearch 首先将旧的文档标记为删除状态,然后添加新的文档,旧的文档不会立即消失,也无法访问;Elasticsearch 会在你继续添加更多数据的时候在后台清理已经标记为删除状态的文档。

局部更新

局部更新就是,只是修改某个字段

POST /ygp-company-index/_update/9BlvdZIBo_i9DbGpUNi8
{"doc": {"name": "更新3"}
}

如果局部更新的文档不存在,则会返回异常

在这里插入图片描述

6)删除文档

根据id进行删除
DELETE /索引名称/_doc/{id}
根据查询条件删除
POST /ygp-company-index/_delete_by_query
{"query": {"match": {"name": "更新3"}}
}
删除所有
POST /ygp-company-index/_delete_by_query
{"query": {"match_all": {}}
}

https://blog.csdn.net/weixin_42612223/article/details/134960356?fromshare=blogdetail&sharetype=blogdetail&sharerId=134960356&sharerefer=PC&sharesource=ShockChen7&sharefrom=from_link

https://blog.csdn.net/u012190388/article/details/120935733?ops_request_misc=&request_id=&biz_id=102&utm_term=%E5%AE%89%E8%A3%85%E5%88%86%E8%AF%8D%E5%99%A8&utm_medium=distribute.pc_search_result.none-task-blog-2allsobaiduweb~default-1-120935733.142v100pc_search_result_base9&spm=1018.2226.3001.4187


http://www.ppmy.cn/server/131696.html

相关文章

动态规划和贪心算法

目录 动态规划和贪心算法 动态规划 贪心算法 两者之间的区别 动态规划和贪心算法 是两种经典的算法设计策略,它们各自具有独特的特点和适用场景。 动态规划 动态规划是一种将复杂问题分解为更简单子问题的求解方法。它特别适用于那些具有重叠子问题和最优子结构特性的问…

Marketo 和 Braze 之间的双向订阅状态同步

要实现 Marketo 和 Braze 之间的双向用户订阅状态同步,我们需要从最基础的环境准备开始,详细逐步展开每一个操作步骤,明确技术准备、操作流程,以及可能遇到的问题。以下是从零开始的详细指南,确保每一个步骤都充分考虑…

Apple Intelligence将于10月28日发布,ChatGPT集成推迟!

大家好,我是木易,一个持续关注AI领域的互联网技术产品经理,国内Top2本科,美国Top10 CS研究生,MBA。我坚信AI是普通人变强的“外挂”,专注于分享AI全维度知识,包括但不限于AI科普,AI工…

uniAPP如何开发?PHP语言的书写该如何制作

开发一个基于uni-app的项目以及与之交互的PHP后端涉及多个步骤和技术栈。以下是一个简要的指南,帮助你理解如何开始这两个部分的开发。 一、uni-app开发 1. 环境准备 Node.js:确保你已经安装了Node.js,这是构建和运行uni-app项目的基础。H…

Nodejs和C#使用ECDH算法交换秘钥

转载于:https://bkssl.com/document/nodejs-csharp-ecdh.html nodejs的ECDH算法在进行computeSecret的时候不会自动进行HASH运算,但C#的ECDH算法必须指定HASH算法。 两边算法必须使用相同的椭圆曲线和Hash算法,例如下面用例都是用的SHA256。…

3.stable-diffusion1.10.0精准控制图-ControlNet插件的安装

安装 Controlnet 插件 注:从网址安装可以保证插件的更新能在 WebUI 中自动显示,如果是下载压缩包文件放进根目录,就无法自动更新。下面执行网址安装。 打开 WebUI,点击“扩展”选项卡,选择“从网址安装”,…

详细分析Redisson分布式锁中的renewExpiration()方法

目录 一、Redisson分布式锁的续期 整体分析 具体步骤和逻辑分析 为什么需要递归调用? 定时任务的生命周期? 一、Redisson分布式锁的续期 Redisson是一个基于Redis的Java分布式锁实现。它允许多个进程或线程之间安全地共享资源。为了实现这一点&…

网站服务器监控:Apache指标解读

监控易是一款专业的IT监控软件,能够实时监控各类IT资源和应用的状态,确保系统的稳定运行。在网站服务器监控中,Apache作为广泛使用的Web服务器软件,其性能和稳定性对于网站的正常运行至关重要。下面,我们将对监控易中A…