【ElasticSearch】学习笔记

【ElasticSearch】学习笔记

server/2025/3/16 23:41:56/

一、lucene的组成

segment是一个具备完整搜索功能的最小单元。

多个segment组成了一个单机文本检索库lucene。

inverted index:倒排索引，用于快速根据关键词找到对应的文章
term index: 构建出关键词的目录树，解决了term dictionary数据量过大，无法加入到内存的问题，通过term index加载到内存中，提高了查询效率
Stored Fields:将数据内容持久化到磁盘中。
Doc Values：基于某种数据（时间、价格）提前排序，用于快速排序查找和聚合。

二、ElasticSearch

1、高性能

一个index name对应一个lucene避免过多的资源争抢
单个index name拆分为shard分片，每个shard分片作为一个独立的Lucene库

2、高扩展

将分片部署在多个机器上，缓解单机压力

3、高可用

存在副本分片，主副封片读写分离，若主分片宕机，副本自动晋升为主分片。
node角色分化，各司其职（处理用户请求、处理数据、处理节点管理）。
每个节点存在raft模块，同步各个结点的信息数据，所以node看到的集群状态一致。

三、ElasticSearch的写流程

用户发送请求到协调节点，协调节点根据哈希路由找到请求对应的node中的分片
写入到对应分片的lucene库里的segment类的inverted index、term index、sorted field、doc value里面
主分片将数据同步到副本
副本携入完成相应主节点发送Ack确认到协调节点，写入操作完成

四、ElasticSearch的读流程

1、Query阶段

用户发送请求到协调节点，协调节点根据index name查询到分片信息将请求转发到数据节点的
分片上的lucene并发搜索多个segment
返回找到的文档ID和聚合结果
返回查询结果

2、Fetch阶段

用户使用拿到的文档ID再次请求拿去数据
协调节点分发到对应Node的Shard分片，读取segment中的sorted fields
返回文档原始信息到用户

http://www.ppmy.cn/server/175557.html

相关文章

如何绕过 reCAPTCHA V2/V3：Python、Selenium 与其他工具的实战指南

如何绕过 reCAPTCHA V2/V3：Python、Selenium 与其他工具的实战指南

前言验证码（CAPTCHA）技术已经存在多年，尽管它的有效性一直备受争议，但许多网站仍然依赖它来保护资源。特别是 Google 推出的 reCAPTCHA 系列，一直是验证码领域的领跑者。本文将探讨如何绕过 reCAPTCHA V2 和 V3&…

阅读更多...

【C】嵌入式的中断，理解

【C】嵌入式的中断，理解

🚀 嵌入式中断（Interrupt）概念解析在嵌入式系统中，中断（Interrupt）是一种硬件或软件事件，它可以打断 CPU 的正常运行流程，立即执行特定的中断服务程序（ISR，…

阅读更多...

TTP/HTTPS、TCP/IP 协议、RPC、Socket 通信机制

TTP/HTTPS、TCP/IP 协议、RPC、Socket 通信机制

1. TTP/HTTPS TTP (HTTP) 和 HTTPS（Hypertext Transfer Protocol Secure）是基于 TCP/IP 协议的应用层协议，主要用于客户端和服务器之间的数据传输。 HTTP（超文本传输协议）：这是用于 web 页面和服务器之间…

阅读更多...

三角函数：从宇宙法则到AI革命的数学密钥

三角函数：从宇宙法则到AI革命的数学密钥

——跨越三千年的数学语言与现代科技全景透视一、数学本质：宇宙的波动密码 1.1 拓扑学视角下的三角函数三角函数本质是单位圆上点的坐标参数化，其数学表达可抽象为： { x cos ⁡ θ ℜ ( e i θ ) y sin ⁡ θ ℑ ( e i θ ) \begin…

阅读更多...

MKS HA-MFV：半导体制造中的高精度流量验证技术解析

MKS HA-MFV：半导体制造中的高精度流量验证技术解析

引言在半导体先进制程（如3nm节点）中，工艺气体流量的精准控制直接决定刻蚀、沉积等关键步骤的均匀性和良率。MKS Instruments推出的 HA-MFV（High Accuracy Mass Flow Verifier） 通过创新设计解决了传统流量验证技术的…

阅读更多...

C++程序设计语言笔记——抽象机制：构造、清理、拷贝和移动

C++程序设计语言笔记——抽象机制：构造、清理、拷贝和移动

0 应该将构造函数、赋值操作以及析构函数设计为一组匹配的操作。在C中，构造函数、赋值操作符和析构函数共同管理对象的资源生命周期。为确保资源安全且一致地处理，需将它们作为一组匹配的操作设计。以下是关键要点： 为何需要协同设计&…

阅读更多...

C# NX二次开发：在多个体的模型中如何实现拉伸操作布尔减

C# NX二次开发：在多个体的模型中如何实现拉伸操作布尔减

大家好，今天接着上一篇拉伸文章去讲。 UF_MODL_create_extruded1 (view source) uf_list_p_tobjectsInputList of objects to be extruded.char *taper_angleInputTaper angle (in degrees).char *limit [ 2 ]InputLimit of extrusion. This is declared as: char …

阅读更多...

C 语言 --- 二维数组的应用

C 语言 --- 二维数组的应用

C 语言 --- 二维数组的应用第一题 - - - 冒泡排序冒泡排序冒泡排序的原理第二题 - - - 回型矩阵特点第三题 - - - 蛇形矩阵总结 💻作者简介：曾与你一样迷茫，现以经验助你入门 C 语言 &…

阅读更多...

最新文章