实时日志与发展:Elasticsearch 推出全新专用的 logsdb 索引模式

news/2024/12/17 23:31:39/

作者:来自 Elastic Mark Settle, George Kobar 及 Amena Siddiqi

Elastic 最新发布的 logsdb 索引模式是专为日志管理优化的功能,旨在提升日志数据的存储效率、查询性能以及整体可用性。这个模式专注于满足现代日志处理需求,提供更高效的日志分析体验,同时保持 Elasticsearch 的灵活性和强大能力。

更多阅读 “Observability:Elasticsearch 新的索引 mode: Logsdb 初体验”。

Elasticsearch 的新索引模式 logsdb 可将日志存储需求减少高达 65%

今天,我们宣布 Elasticsearch 的新索引模式 logsdb 正式发布,与不带 logsdb 的 Elasticsearch 最新版本相比,该模式可将日志数据的存储空间减少高达 65%。这一显著改进使可观察性和安全性团队能够在不超出预算的情况下扩大可见性,同时保持所有数据可立即访问以供分析。

Logsdb 优化了数据的排序,通过使用 synthetic _source 动态重建未存储的字段值来消除重复,并通过高级算法和编解码器提高压缩率,利用 Elasticsearch 中的列式存储实现高效的日志存储和检索。

使用 logsdb 索引模式提高存储效率,增强分析能力并降低成本

日志为检测和修复可观察性和安全性问题提供了关键信号 — 随着人工智能的进步简化了基于文本的数据的分析,日志的实用性也在不断提高 — 因此高效的存储和高性能的访问比以往任何时候都更加重要。

不幸的是,基础设施和应用程序生成的日志量不断增长,导致成本上升,迫使人们做出妥协,从而阻碍分析:限制收集、减少保留或将新数据降级到孤立的存档层。

Logsdb 直接解决了这些挑战。通过更高的存储效率,你可以收集更多数据并避免复杂的数据过滤麻烦。你可以保留更长时间的日志以支持威胁搜寻、事件响应和合规性要求。而且由于所有数据始终可搜索,因此无论你的数据集增长到多大,你都可以快速获得见解。

Logsdb 索引模式背后的技术创新

Logsdb 索引模式通过智能索引排序、synthetic _source 和高级压缩大大减少了日志数据的磁盘占用空间。与不带 logsdb 的最新版本 Elasticsearch 相比,实施它可以将日志存储需求减少多达 65%。虽然 logsdb 目前在索引过程中使用更多 CPU,但其高效的存储可降低大多数客户的总体成本。对于需要长期保留的客户,我们预计总拥有成本 (total cost of ownership - TCO) 可降低多达 50%。

智能索引排序可将存储效率提高多达 30%,并通过将相似的数据放在一起来减少某些日志数据集的查询延迟。默认情况下,它按 host.name 和 @timestamp 对索引进行排序。如果你的数据有更合适的字段,你可以改为指定它们。

高级压缩通过 Zstandard 压缩 (Zstd)、增量编码、运行长度编码和其他自动选择的智能编解码器显著降低了日志等文本密集型数据的存储要求。 Doc-values 以针对压缩和性能进行了优化的列格式存储,可高效存储和检索字段值,以进行排序、聚合和脚本编写。

Synthetic _source 使组织能够通过丢弃 _source 字段并根据需要完全或部分重建它,将存储需求再减少 20-40%。虽然该功能有时需要更多的计算来进行索引和检索,但测试表明它提供了可衡量的净效率改进。Synthetic _source 是基于近两年的生产使用情况和指标而构建的,对日志进行了大量的增强,包括对几乎所有字段类型的支持。

由此产生的存储节省会在整个索引生命周期阶段传播。热层存储减少 65% 将导致暖层、冷层和冻结层的存储同样减少,并减少在存储桶存储中存储快照的占用空间。

不影响可见性:保留所有日志以实现可观察性和安全性

日志是了解基础设施和应用程序状况的基础,为监控和故障排查提供了最简单且最重要的信号。然而,随着日志量的增长,成本也在不断上升。这一挑战迫使用户实施复杂的过滤和管理策略、过早删除数据,并将相关日志存储在需要一天或更长时间才能重新加载分析的存储中。没有完整、易于搜索且随时可用的数据集,查找和解决问题变得更加困难。

Logsdb 索引模式基于突破性的 Elasticsearch 功能(如可搜索快照和自动导入),可解决运营和安全团队的以下痛点:

  • 降低成本:Logsdb 将日志的存储空间减少了多达 65%,使组织能够在保留更多数据的同时降低存储费用。这意味着所有存储层(从热存储到冷存储)的成本节省,以及使用此数据的可观察性和安全性团队的更高生产力。
  • 保存有价值的数据:Logsdb 保留所有日志数据并提高运营效率,而无需依赖额外的工具或复杂的过滤器。借助 synthetic _source 等功能,无需存储整个源文档即可保留数据的价值。
  • 扩展可见性:Logsdb 可在一个平台上高效访问所有数据,无需为可观察性、安全性和历史数据设置单独的孤岛。对于站点可靠性工程师 (SRE),它通过分析日志以及指标、跟踪和业务数据来加速问题解决。同样,对于安全运营中心 (SOC) 团队,它通过消除盲点来加速调查和补救。
  • 简化数据访问:Logsdb 让 SRE 团队能够高效地保留可操作数据以进行故障排除、趋势分析和分析。同样,SOC 团队可以快速搜索所有数据以进行调查和威胁搜寻,而无需承担高昂的成本。

为你的环境做好准备

Elasticsearch logsdb 索引模式从 8.17 版开始通常可供 Elastic Cloud Hosted 和 Self-Managed 客户使用,并且默认情况下已为 Elastic Cloud Serverless 中的日志启用。

基本 logsdb 功能(包括智能索引排序和高级压缩)可供拥有标准、黄金和白金许可证的组织使用。完整的 logsdb 功能可进一步降低存储要求(包括合成 _source),可供拥有企业许可证的无服务器客户和组织使用。

眼见为实

Logsdb 使你能够保留所有日志数据并提高运营效率,而无需缩小收集范围或丢弃或孤立数据。借助智能索引排序、高级压缩和合成 _source 等功能,你可以在适合你的预算内保留和分析所需的数据。

想亲自体验一下吗?免费试用 Elastic。

本文中描述的任何特性或功能的发布和时间均由 Elastic 自行决定。任何当前不可用的特性或功能可能无法按时交付或根本无法交付。

想要获得 Elastic 认证吗?了解下一期 Elasticsearch 工程师培训何时举行!

Elasticsearch 包含许多新功能,可帮助你为你的用例构建最佳搜索解决方案。深入了解我们的示例笔记本以了解更多信息,开始免费云试用,或立即在你的本地机器上试用 Elastic。

原文:https://www.elastic.co/search-labs/blog/elasticsearch-logsdb-index-mode


http://www.ppmy.cn/news/1555981.html

相关文章

Java函数式编程【三】【Stream终止操作】【上】之【简单约简】

函数式编程可分为三个步骤:流的创建、流的中间操作和流的终止操作。其中流的中间操作可以有n个,而流的终止操作只能有一个。 函数式编程三个步骤示意图: 常用的终止操作 Stream的终止操作大致可分为两大类:简单约简的终止操作…

<数据集>输电线塔杂物识别数据集<目标检测>

数据集下载链接 <数据集>输电线塔杂物识别数据集<目标检测>https://download.csdn.net/download/qq_53332949/90141102数据集格式:VOCYOLO格式 图片数量:1099张 标注数量(xml文件个数):1099 …

11.python文件

文章目录 Python 文件 I/O 总结1. **打印到屏幕**2. **读取键盘输入**3. **打开和关闭文件**3.1 open() 函数3.2 close() 方法 4. **文件读写操作**4.1 write() 方法4.2 read() 方法4.3 readline() 方法4.4 readlines() 方法4.5 seek() 和 tell() 方法 5. **文件重命名和删除**…

RabbitMQ全局流量控制

RabbitMQ全局流量控制 流控机制流控是对什么进行控制?rabbitmq进程邮箱流控机制是什么? 流控原理流控原理流程 流控状态显示流控对象流控机制对象主要进程各进程状态情形分析 性能提升提升队列性能方式 当消息积压时,消息会进入到队列深处&am…

中国计算机学会计算机视觉专委会携手合合信息举办企业交流活动,为AI安全治理打开“新思路”

近期,《咬文嚼字》杂志发布了2024年度十大流行语,“智能向善”位列其中,过去一年时间里,深度伪造、AI诈骗等话题屡次登上热搜,AI技术“野蛮生长”引发公众担忧。今年9月,全国网络安全标准化技术委员会发布了…

鸿蒙Next环境设备查询Environment用法总结

一、概述 Environment是ArkUI框架在应用程序启动时创建的单例对象,用于提供一系列描述应用程序运行状态的属性,其所有属性不可变(应用不可写入)且为简单类型,主要为AppStorage提供设备环境相关信息,以辅助…

APP、小程序对接聚合广告平台,有哪些广告变现策略?

开发者对接聚合广告平台,可以让自身流量价值最大化,获得更多的广告曝光机会,对接单一的广告联盟容易造成广告填充不足,收益不稳定的问题。#APP广告变现# APP开发者根据应用的生命周期、用户特征和产品定位,选择最适合…

《Time Ghost》的制作:利用AI模型,实现更具真实感的布料变形

在 2024 年 9 月,Unity 的 Demo 团队展示了一个全新的实时电影级 demo 《Time Ghost》。这个 demo 是基于 Unity 6 引擎制作的,采用了 Unity 6 中的一些新功能和技术能力,让我们能够实现前所未有的视觉品质和复杂程度。 在制作《Time Ghost》…