ES-聚合分析

devtools/2024/12/28 13:42:21/

ES的聚合分析

什么是ES的聚合分析

  • ElasticSearch除搜索意外,提供的针对ES数据进行统计分析的功能
  • 通过聚合,我们会得到一个数据的概览,是分析和总结全套的数据,而不是寻找单独的文档
  • 高性能,只要一条语句就可以得到分析结果

聚合分类

Bucket Aggregation 一些满足特定条件的文档的集合

  • Terms Aggregation:这种分桶策略是按照词条(term)来分桶,类似于SQL中的group by语法。如果是text类型,则按照分词后的结果分桶。例如,可以按照省份或用户名等字段进行分桶。
GET xby_index_users/_search
{"size": 0,"aggs": {"birth_place_bucket": {"terms": {"field": "birth_place"}}}
}
  • Range Aggregation:通过指定数值的范围来设定分桶规则。可以定义多个范围,文档会根据这些范围被分配到不同的桶中。
GET xby_index_users/_search
{"size": 0,"aggs": {"age_bucket": {"range": {"field": "age","ranges": [{ "from": 0, "to": 30 },{ "from": 30, "to": 60 },{ "from": 60, "to": 90 }]}}}
}
  • Histogram Aggregation:直方图分桶,以固定间隔的策略来分割数据。可以指定间隔大小(interval)和数据范围(extended_bounds)。
GET xby_index_users/_search
{"size": 0,"aggs": {"age_bucket": {"histogram": {"field": "age","interval": 30}}}
}
  • Date Histogram Aggregation:日期直方图分桶,根据日期阶梯分组,例如给定阶梯为周,会自动每周分为一组。
GET xby_index_users/_search
{"size": 0,"aggs": {"birthday_bucket": {"date_histogram": {"field": "birthday","calendar_interval": "year"}}}
}

Metric Aggregation 一些数学运算,可以对文档字段进行统计分析

  • 仅输出一个值的运算
    min/max/sum/avg/cardinality
GET xby_index_users/_search
{"size": 0,"aggs": {"age_avg": {"avg": {"field": "age"}},"age_max": {"max": {"field": "age"}},"age_min": {"min": {"field": "age"}},"age_sum": {"sum": {"field": "age"}},"age_cardinality": {"cardinality": {"field": "age"}}}
}
  • 输出多个值的运算
    stats/percenties/percentile_ranks
GET xby_index_users/_search
{"size": 0,"aggs": {"age_stats": {"stats": {"field": "age"}},"age_percentiles": {"percentiles": {"field": "age"}}}
}

Pipeline Aggregation 对其他运算结果的二次运算

GET xby_index_users/_search
{"size": 0,"aggs": {"sales_per_month": {"date_histogram": {"field": "date","interval": "month"},"aggs": {"sales": {"sum": {"field": "price"}}}},"avg_monthly_sales": {"avg_bucket": {"buckets_path": "sales_per_month>sales"}}}
}

http://www.ppmy.cn/devtools/146124.html

相关文章

线性代数行列式

目录 二阶与三阶行列式 二元线性方程组与二阶行列式 三阶行列式 全排列和对换 排列及其逆序数 对换 n阶行列式的定义 行列式的性质 二阶与三阶行列式 二元线性方程组与二阶行列式 若是采用消元法解x1、x2的话则得到以下式子 有二阶行列式的规律可得:分…

springMVC报错java版本

报错:不支持java5 但是我的java版本是java11 解决 更改设置:

STM32高级物联网通信之以太网通讯

目录 以太网通讯基础知识 什么是以太网 互联网和以太网的区别 1)概念与范围 (1)互联网 (2)以太网 2)技术特点 (1)互联网 (2)以太网 3)应用场景 (1)互联网 (2)以太网 以太网的层次 1)物理层 2)数据链路层 OSI 7层模型 TCPIP 4层模型 一些常见…

Unity3D ECS 内存分配器原理

一、引言 Unity3D 的 ECS(Entity-Component-System)框架是基于数据导向技术栈(Data-Oriented Technology Stack,DOTS)实现的,旨在提高游戏的性能和可维护性。在 ECS 架构中,实体(En…

AI三驾马车——数据、算法与算力的一体化融合体验

一、概述 随着AI大模型、云计算和大数据技术的快速发展,智能算力市场需求持续增长。今年7月由国家信息中心发布的《智能算力产业发展白皮书》指出,随着AI大模型等关键技术取得突破,算力需求正从通用计算转向智能计算。智能计算是指面向人工智…

突发!GitLab(国际版)将停止对中国区用户提供 GitLab.com 账号服务

消息称: 目前,为了更加严格的遵循中国网络数据安全管理的相关要求,GitLab SaaS(国际版)已逐步停止向国内用户提供服务与支持,国内用户亦无法注册或使用 GitLab SaaS(国际版)。自您的…

龙智出席2024零跑智能汽车技术论坛,分享功能安全、需求管理、版本管理、代码扫描等DevSecOps落地实践

龙智快讯 2024年12月5日,由零跑和盖世汽车主办的“2024零跑智能汽车技术论坛”在杭州零跑总部圆满落幕。此次技术论坛聚焦AI语言大模型、AUTOSAR AP平台、DevOps、端到端自动驾驶等热点话题展开探讨,旨在推动智能汽车技术的创新与发展。 龙智作为国内领先…

【机器学习与数据挖掘实战】案例06:基于Apriori算法的餐饮企业菜品关联分析

【作者主页】Francek Chen 【专栏介绍】 ⌈ ⌈ ⌈机器学习与数据挖掘实战 ⌋ ⌋ ⌋ 机器学习是人工智能的一个分支,专注于让计算机系统通过数据学习和改进。它利用统计和计算方法,使模型能够从数据中自动提取特征并做出预测或决策。数据挖掘则是从大型数据集中发现模式、关联…