【Elasticsearch】bucket_sort

devtools/2025/2/12 18:04:51/

Elasticsearch 的`bucket_sort`聚合是一种管道聚合,用于对父多桶聚合(如`terms`、`date_histogram`、`histogram`等)的桶进行排序。以下是关于`bucket_sort`的详细说明:

1.基本功能

`bucket_sort`聚合可以对父聚合返回的桶进行排序,支持以下排序依据:

• `_key`:基于桶的键值(例如时间戳或词项)。

• `_count`:基于桶中的文档数量。

• 子聚合结果:基于子聚合的计算结果(例如`sum`、`avg`等)。

此外,`bucket_sort`还可以通过`from`和`size`参数截断结果,只返回部分桶。

2.参数说明

`bucket_sort`聚合的主要参数包括:

• `sort`:指定排序字段和顺序(升序或降序)。

• `from`:跳过前`N`个桶。

• `size`:返回的桶数量。

• `gap_policy`:当数据中存在缺口时的处理策略,默认为`skip`。

3.使用场景

3.1按子聚合结果排序

假设有一个`sales`索引,包含交易数据,我们希望按月统计销售额,并返回销售额最高的 3 个月:

```json

POST /sales/_search

{

  "size": 0,

  "aggs": {

    "sales_per_month": {

      "date_histogram": {

        "field": "date",

        "calendar_interval": "month"

      },

      "aggs": {

        "total_sales": {

          "sum": {

            "field": "price"

          }

        },

        "sales_bucket_sort": {

          "bucket_sort": {

            "sort": [

              {

                "total_sales": {

                  "order": "desc"

                }

              }

            ],

            "size": 3

          }

        }

      }

    }

  }

}

```

此查询将返回销售额最高的 3 个月。

3.2仅截断结果

如果不进行排序,仅截断结果,可以省略`sort`参数。例如,仅返回第 2 个桶:

```json

POST /sales/_search

{

  "size": 0,

  "aggs": {

    "sales_per_month": {

      "date_histogram": {

        "field": "date",

        "calendar_interval": "month"

      },

      "aggs": {

        "bucket_truncate": {

          "bucket_sort": {

            "from": 1,

            "size": 1

          }

        }

      }

    }

  }

}

```

此查询将仅返回第 2 个桶。

4.与其他聚合结合使用

`bucket_sort`可以与多种聚合结合使用,例如:

• `date_histogram`:按时间间隔分桶并排序。

• `histogram`:按数值间隔分桶并排序。

5.注意事项

• `bucket_sort`是管道聚合,执行顺序在非管道聚合之后。

• 排序和截断操作仅对父聚合返回的桶生效。

通过以上方式,`bucket_sort`聚合可以灵活地对聚合结果进行排序和截断,满足多种数据分析需求。


http://www.ppmy.cn/devtools/158279.html

相关文章

蓝桥杯 Java B 组之函数定义与递归入门

一、Java 函数(方法)基础 1. 什么是函数? 函数(方法)是 一段可复用的代码块,通过 函数调用 执行,并可返回值。在 Java 里,函数也被叫做方法,它是一段具有特定功能的、可…

ESP32S3基于espidf ADC使用

ESP32S3基于espidf ADC使用 官方在线文档介绍模数转换器:https://docs.espressif.com/projects/esp-idf/zh_CN/stable/esp32s3/api-reference/peripherals/adc_oneshot.html🔖espidf版本:v5.4 模数转换器 (ADC)转换方式: 模数转换…

详解Redis中lua脚本和事务

In learning knowledge, one should be good at thinking, thinking, and thinking again. —-Albert Einstein 引言 Lua脚本的原子性和事务的ACID特性想必大家都很熟悉,本篇文章将从性能表现和原理帮助我们快速理解他们 基本概念 1. Redis Lua 脚本 从 2.6 版本…

2526考研资料分享 百度网盘

通过网盘分享的文件:01、2026【考研数学】 链接:https://pan.baidu.com/s/1PwMzp_yCYqjBqa7492mP3w?pwd98wg 提取码:98wg--来自百度网盘超级会员v3的分享 通过网盘分享的文件:01、2026【考研政治】 链接:https://pan.baidu.com/s/1PwMzp_yCYqjBqa7492…

flutter isolate到底是啥

在 Flutter 中,Isolate 是一种实现多线程编程的机制,下面从概念、工作原理、使用场景、使用示例几个方面详细介绍: 概念 在 Dart 语言(Flutter 开发使用的编程语言)里,每个 Dart 程序至少运行在一个 Isol…

【Pytorch实战教程】让数据飞轮转起来:PyTorch Dataset与Dataloader深度指南

文章目录 让数据飞轮转起来:PyTorch Dataset与Dataloader深度指南一、为什么需要数据管理组件?二、Dataset:数据集的编程接口2.1 自定义Dataset三要素2.2 实战案例:图像分类数据集三、Dataloader:高效数据流水线3.1 核心参数解析3.2 数据流可视化3.3 多卡训练支持四、综合…

【C++高并发服务器WebServer】-17:阻塞/非阻塞和同步/异步、五种IO模型、Web服务器

本文目录 一、阻塞/非阻塞、同步/异步1.1 辨析1.2 异步io接口 二、五种IO模型2.1 阻塞 blocking 模型2.2 非阻塞 NIO 模型2.3 IO多路复用2.4 信号驱动Signal-driven2.5 异步 三、Web Sever 网页服务器3.1 HTTP的请求响应步骤3.2 HTTP请求与响应报文格式3.3 HTTP请求方法3.4 HTT…

element-plus 解决el-dialog背后的页面滚动问题,及其内容有下拉框出现错位问题

这个问题通常是因为 el‑dialog 默认会锁定 body 的滚动&#xff08;通过给 body 添加隐藏滚动条的样式&#xff09;&#xff0c;从而导致页面在打开对话框时跳转到顶部。解决方法是在使用 el‑dialog 时禁用锁定滚动功能。 <el-dialogv-model"dialogVisible":lo…