快速理解倒排索引在ElasticSearch中的作用

server/2024/12/2 17:44:58/

一.基础概念

定义:

倒排索引是一种数据结构,用来加速文本数据的搜索和检索,和传统的索引方式不同,倒排索引会被每个词汇项与包含该词汇项的文档关联起来,从而去实现快速的全文检索。

举例:

在传统的全文检索中,我们需要获取一篇文章中包含某个词的方式,是先获取这篇文章的内容,再从文章中去找到对应的关键词;

而如果我们希望输入一个关键词去找到包含这个关键词的文章,对于这种索引结构,我们可以称为是倒排索引

下图展示了倒排索引的原理:

Term Dictionary:关键词;

Posting:包含关键词的文档id;

Term Index:优化关键词(相当于对关键词做了一个索引,来优化关键词,提高查询速度)。

二.作用

倒排索引在ElasticSearch中的作用主要体现在三个方面:

1.快速全文搜索

倒排索引允许ElasticSearch在大规模文本的数据集中,去实现快速的全文搜索,它可以快速确定哪些文档中,包含搜索查询的关键词,从而提高搜索效率;

2.高效的分布式搜索

ElasticSearch是一个分布式搜索引擎,它把数据分散存储在多个节点上,那么倒排索引的使用,使得每个节点都能够去独立执行部分搜索任务,然后将结果进行合并,从而去实现高效的分布式搜索;

3.复杂查询的支持

ElasticSearch支持负载查询的操作,包括布尔逻辑、范围查询和模糊查询等等,那么倒排索引的存储和查询机制为这些复杂查询提供了高性能的支持。

总结:

倒排索引是ElasticSearch的核心组成部分,它为搜索引擎提供了快速高效的全文搜索能力,通过把词汇项和文档建立关联,倒排索引使得在大规模的文本数据集中去查询信息变得异常高效


http://www.ppmy.cn/server/146787.html

相关文章

C语言蓝桥杯进阶

系列文章目录 文章目录 系列文章目录前言一、题目1、在 ISO 国际标准中定义了 A0 纸张的大小为 1189mm 841mm,将 A0 纸沿长边对折后为 A1 纸,大小为 841mm 594mm,在对折的过程中长度直接取下整(实际裁剪时可能有损耗&#xff09…

WPS 文本——在修订模式中、并且保留所有批注的情况下,如何显示全部文本的最终状态

转载请注明出处:http://blog.csdn.net/dongdong9223/article/details/81275360 本文出自【我是干勾鱼的博客】 1 问题 在顶部菜单栏中选择“审阅”选项卡,发现无法显示文本的最终状态 2 原因 这是因为目前在 显示标记-使用批注框 中选择的事&#xf…

【Android】ARouter——强大的路由框架

引言 在我们使用组件化的时候,活动并不在一个模块当中,但是毕竟是一个程序我们需要在不同的模块之间进行跳转,我们会首先想到在需要进行通信的模块下都添加相应的依赖就可以解决这个问题,但这样无疑增加了各个组件之间的耦合性。…

抖店飞鸽客服自动化插件-自动回复或自动转接会话

当自动回复的机器人客服无法解决的一些问题,比如投诉,退款等 自动转接给其他人工控制的客服 抖店飞鸽客服 后台地址为https://im.jinritemai.com/pc_seller_v2/main/workspace 飞鸽客服创建子账号地址https://fxg.jinritemai.com/ffa/w/subaccount/emplo…

详解Qt PDF 之 QPdfDocument与 QPdfView 打开与显示pdf

文章目录 使用Qt PDF:QPdfDocument与QPdfView加载与显示PDF文档引言1. QPdfDocument类1.1 QPdfDocument的构造和加载文档1.2 QPdfDocument的主要功能1.3 错误处理和状态管理 2. QPdfView类2.1 QPdfView的构造和文档设置2.2 QPdfView的视图模式2.3 缩放功能2.4 控件的…

C++笔记之不同框架中事件循环的核心函数:io_run()、ros_spin()、app_exec()

C笔记之不同框架中事件循环的核心函数:io_run()、ros_spin()、app_exec() code review! 参考笔记 1.qt-C笔记之使用QtConcurrent异步地执行槽函数中的内容,使其不阻塞主界面 2.qt-C笔记之QThread使用 3.qt-C笔记之多线程架构模式:事件信号监…

大语言模型微调与 XTuner 微调实战

1 大语言模型微调 1.1 什么是微调 大语言模型微调(Fine-tuning of Large Language Models)是指在预训练的大型语言模型基础上,使用特定任务的数据进一步训练模型,以使其更好地适应和执行特定任务的过程,用于使LLM&am…

精准用户获取与私域流量运营:多商户链动 2+1 模式商城小程序的赋能策略

摘要:本文聚焦于精准用户对商业运营的核心价值,深入剖析获取精准用户的有效途径,特别围绕目标用户画像及出没场景展开分析。同时,探讨在私域流量构建进程中,多商户链动 21 模式商城小程序如何融入精准用户运营体系&…