ClickHouse--17--聚合函数总结

news/2025/1/11 7:13:27/

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档

文章目录

  • 环境
    • 1.创建clickhouse表
    • 2.插入数据
  • 函数
    • (1)count:计算行数
    • (2)min:计算最小值
    • (3)max:计算最大值
    • (4)sum:计算总和,只能计算数字之和
    • (5)avg:算数平均值,仅支持数字
    • (6)any: 选择第一个遇到的值
    • (7)anyHeavy:列出频繁出现的值,一般情况,结果是不确定的
    • (8)anylast:选出最后一个出现的值
          • AggregateFunction(anyLast, String) ==不支持分布式表==
          • SimpleAggregateFunction(anyLast, String) ==不支持分布式表==
    • (9)argMin
    • (10)argMax:类比argMin
    • (11)avgWeighted(x, weight):加权算数平均值,x为值,weight为值的加权
    • (12)topK(num)(col):
    • (13)topKWeighted(num)(col,weight):
    • (14)groupArray:生成数组
    • (15)groupUniqArray:类似于groupArray,不过会将生成的数组去重
    • (16)groupArrayInsertAt:参数指定位置插入数组
    • (17)groupArraySample(max_size)(arg)
    • (18)uniq:计算字段去重后的近似数量
    • (19)uniqExact:计算不同参数值的准确数量
    • (20)uniqCombined:
    • (21)quantile(level)(arg):
    • (22)quantiles(level1,level2...)(arg):可以同时计算多个分位数,返回结果为数组


环境

1.创建clickhouse表

CREATE TABLE ck_test
(`id` String COMMENT 'id',`int_1` UInt32 COMMENT '整型列1',`int_2` UInt32 COMMENT '整型列2',`str_1` String COMMENT '字符串列1',`str_2` String COMMENT '字符串列2'
)
ENGINE = MergeTree
ORDER BY id

2.插入数据

insert into ck_test values (1,1,10,'a','A'),(2,2,12,'b','B'),(3,3,13,'c','C'),(4,4,14,'d','D'),(5,5,15,'e','E'),(6,6,15,'f','F')(7,6,15,'f','F');    

在这里插入图片描述
在这里插入图片描述

此外,如果出现了临时分区还没有合并的情况,any方法查询的结果,在合并前和合并后的结果是不一样的

函数

在这里插入图片描述

(1)count:计算行数

在这里插入图片描述
在这里插入图片描述

(2)min:计算最小值

在这里插入图片描述

(3)max:计算最大值

在这里插入图片描述

(4)sum:计算总和,只能计算数字之和

在这里插入图片描述

(5)avg:算数平均值,仅支持数字

select avg(int_1),avg(int_2) from ck_test;

(6)any: 选择第一个遇到的值

在这里插入图片描述

(7)anyHeavy:列出频繁出现的值,一般情况,结果是不确定的

在这里插入图片描述

(8)anylast:选出最后一个出现的值

在这里插入图片描述

AggregateFunction(anyLast, String) 不支持分布式表
SimpleAggregateFunction(anyLast, String) 不支持分布式表

(9)argMin

在这里插入图片描述
在这里插入图片描述

(10)argMax:类比argMin

(11)avgWeighted(x, weight):加权算数平均值,x为值,weight为值的加权

在这里插入图片描述

(12)topK(num)(col):

返回指定列中出现频率最多的值的数组,数组按照出现频率降序排序,num指定返回数组元素的个数,col为指定的字段
在这里插入图片描述

(13)topKWeighted(num)(col,weight):

类似于topK,col列每一个输入出现的次数,都会乘上weight权重,这个weight可以是类似于col的一个字段
在这里插入图片描述

(14)groupArray:生成数组

在这里插入图片描述
在这里插入图片描述

(15)groupUniqArray:类似于groupArray,不过会将生成的数组去重

(16)groupArrayInsertAt:参数指定位置插入数组

在这里插入图片描述
语法:groupArrayInsertAt(default_x, size)(x, pos)

其中,default_x为默认的在空位上替换的值,size为最终的数组长度,因为数组可能很长,会有空位,所以要用default_x填充

x为要被插入的值组成的数组,从0到pos这个位置都用default_x填充

按我的理解,int_2为15的那一行,应该有e,f,f三个值,不知道为啥只出现了e

(17)groupArraySample(max_size)(arg)

生成采样数组,max_size为数组最大长度,arg可以是字段,也可以是字段拼接的表达式,如concat(‘字符:’,arg1)

在这里插入图片描述
在这里插入图片描述

(18)uniq:计算字段去重后的近似数量

在这里插入图片描述

(19)uniqExact:计算不同参数值的准确数量

在这里插入图片描述

(20)uniqCombined:

计算不同参数值的近似数量,uniq虽然也是近似数量,但uniqCombined消耗内存多,精度也比uniq高

(21)quantile(level)(arg):

计算近似分位数,level是分位数常量,取值范围0-1,arg可以是数字类型,也可以是date,datetime类型

在这里插入图片描述

(22)quantiles(level1,level2…)(arg):可以同时计算多个分位数,返回结果为数组

在这里插入图片描述


http://www.ppmy.cn/news/1420944.html

相关文章

代码随想录刷题day56|2个字符串的删除操作编辑距离

文章目录 day55学习内容一、2个字符串的删除操作1.1、动态规划五部曲1.1.1、 确定dp数组(dp table)以及下标的含义1.1.2、确定递推公式1.1.3、 dp数组如何初始化1.1.4、确定遍历顺序1.1.5、输出结果 1.2、代码 二、编辑距离2.1、动态规划五部曲2.1.1、 确…

若依前端分离版中使用二维码功能

一、安装 在前端项目工程目录,远端执行如下命令 // npm npm install vue-qr --save // yarn yarn add vue-qr 二、引入组件 在main.js文件中增加如下的内容 // vue2.x import VueQr from vue-qr //注册组件 Vue.component(VueQr, VueQr)// vue3.x import vueQr f…

uni-app中页面生命周期与vue生命周期的执行顺序对比

应用生命周期 uni-app 支持如下应用生命周期函数: 函数名说明平台兼容onLaunch当uni-app 初始化完成时触发(全局只触发一次),参数为应用启动参数,同 uni.getLaunchOptionsSync 的返回值onShow当 uni-app 启动&#x…

C++笔记:类和对象

类和对象 认识类和对象 先来回忆一下C语言中的类型和变量,类型就像是定义了数据的规则,而变量则是根据这些规则来实际存储数据的容器。类是我们自己定义的一种数据类型,而对象则是这种数据类型的一个具体实例。类就可以理解为类型&#xff0c…

数据结构DAY4--哈希表

哈希表 概念:相当于字典,可以根据数据的关键字来寻找相关数据的查找表。 步骤:建立->插入->遍历->查找->销毁 建立 建立数据,形式随意,但一般为结构体(储存的数据量大)&#xff…

如何修复 Ubuntu 上的“E Unable to locate package package_name”错误

如何修复 Ubuntu 上的“E: Unable to locate package package_name”错误 一、前言 有时,使用下面提到的 apt 命令在中【Ubuntu】安装新软件包时,使用下面的命令 sudo apt-get install package_name产生错误输出: Reading package lists..…

【拓展技术】——AutoDL服务器训练Pycharm使用注意点Pycharm配置AutoDL

一、AutoDL服务器模型训练 AutoDL是一个为研究人员、开发者和企业提供的平台,它致力于提供一个高效、可靠和易用的环境,以支持复杂的计算任务和AI模型的部署: 高效的并行计算资源:AutoDL拥有强大的计算集群和高性能的计算节点&a…

Vscode设置滚轮进行字体大小的调节

Vscode设置滚轮进行字体大小的调节 正常的话按 ctrl 或者 ctrl - 进行字体的大小调节 1.打开Vscode,找打设置的图标,在点击设置,或者直接使用快捷键,【ctrl ,】 2. 在搜索框搜索Font Ligatures 3.双击进入settings.json ,找到如…