group by详解

news/2024/11/19 8:24:08/

group by功能
在SQL中group by主要用来进行分组统计,分组字段放在group by的后面;分组结果一般需要借助聚合函数实现。

group by语法结构
1、常用语法

语法结构
SELECT
column_name1,column_name2, …
聚合函数1,聚合函数2 , …
FROM table_name
GROUP BY column_name1,column_name2, …
说明:1、group by中的分组字段和select后的字段要保持一致;2、通常group by和聚合函数一起使用,但也可以不包含聚合函数,根据业务需求决定;3、常用的聚合函数有max()、min()、avg()、sum()、count()等。

语法举例

首先创建销售表:
CREATE TABLE sale_order_item
(
ID int primary key NOT NULL,
area_name varchar(10),
mall_name varchar(10),
product_count int
);
然后向表中插入数据:

insert into sale_order_item values(1,‘销售一区’,‘城东店’,20);
insert into sale_order_item values(2,‘销售二区’,‘城西店’,15);
insert into sale_order_item values(3,‘销售一区’,‘城南店’,10);
insert into sale_order_item values(4,‘销售一区’,‘城东店’,4);
insert into sale_order_item values(5,‘销售二区’,‘城西店’,6);
insert into sale_order_item values(6,‘销售一区’,‘城南店’,11);
insert into sale_order_item values(7,‘销售一区’,‘城东店’,15);
insert into sale_order_item values(8,‘销售二区’,‘城西店’,16);
insert into sale_order_item values(9,‘销售一区’,‘城南店’,18);
insert into sale_order_item values(10,‘销售一区’,‘城东店’,22);
insert into sale_order_item values(11,‘销售二区’,‘城西店’,21);
insert into sale_order_item values(12,‘销售一区’,‘城南店’,25);
按照门店名称进行分组,查询各门店的销售量之和:
select
mall_name 门店名称,
sum(product_count) 销售量
from sale_order_item
group by mall_name;
查询结果如下所示:

图片

2、having过滤

having需要和group by一起用,放在group by语句的后面;同时,having中的判断对象,必须为group by子句中的分组字段或者聚合函数。

语法结构(假设只有两个分组字段)
SELECT
column_name1,column_name2,
聚合函数1,聚合函数2 , …
FROM table_name
GROUP BY column_name1,column_name2 having 过滤条件
语法举例

过滤对象为GROUP BY 子句中的分组字段:

select
mall_name 门店名称,
sum(product_count) 销售量
from sale_order_item
group by mall_name having mall_name not like ‘城西店’;

通常上面的SQL语句写成下面这样:先进行条件过滤,再进行分组计算
select
mall_name 门店名称,
sum(product_count) 销售量
from sale_order_item
where mall_name not like ‘城西店’
group by mall_name ;

过滤对象为聚合函数:
select
mall_name 门店名称,
sum(product_count) 销售量
from sale_order_item
group by mall_name having sum(product_count) < 60;

3、rollup的使用

我们在使用group by功能时,发现只能对分组字段的每个子项进行统计计算,而无法对整体进行汇总计算。通过使用rollup,就可以实现对分组字段进行小计或总计。

语法结构(假设只有两个分组字段)

SELECT
column_name1,column_name2,
聚合函数1,聚合函数2 , …
FROM table_name
GROUP BY column_name1,column_name2 with rollup
语法举例
SELECT
area_name 区域名称,
mall_name 门店名称,
sum(product_count) 销售量
FROM sale_order_item
GROUP BY area_name,mall_name with rollup;
查询结果:
图片

需要注意的是,group by后面分组字段的顺序不同时,得到的小计或总计的结果也不一样。

易错点和难点补充
1、分组字段和查询字段不一致,产生错误结果

正确写法:
SELECT
(case when mall_name in (‘城东店’,‘城南店’) then ‘销售一区’ when mall_name = ‘城西店’ then ‘销售二区’ else null end) 销售大区,
sum(product_count) 销量
FROM sale_order_item
GROUP BY (case when mall_name in (‘城东店’,‘城南店’) then ‘销售一区’ when mall_name = ‘城西店’ then ‘销售二区’ else null end);

错误写法:分组字段和查询字段不完全一致,导致销售大区的字段值错误
SELECT
mall_name 销售大区,
sum(product_count) 销量
FROM sale_order_item
GROUP BY (case when mall_name in (‘城东店’,‘城南店’) then ‘销售一区’ when mall_name = ‘城西店’ then ‘销售二区’ else null end);

这里的错误示例是在MySQL数据库下运行的;如果使用的是PgSQL数据库的话,会直接报语法错误,因为PgSQL数据库要求查询字段和分组字段必须完全一致。

强烈建议,我们在使用group by时,一定要确保查询字段和分组字段的完全一致,否则可能会产生非预期结果。

2、字符串连接

这里是在MySQL数据库下实现的,其它数据库实现方式可能会不一样。

我们在使用group by时,通常情况下是进行数值的统计,但有时需要对字符串进行处理,将多行字符串拼接成单行字符串。

这里使用的聚合函数是group_concat,其使用方法如下所示:

GROUP_CONCAT([DISTINCT] column1 [ORDER BY column2 ASC\DESC] [SEPARATOR seq]).

语法结构(假设只有两个分组字段)
SELECT
column_name1,column_name2,
group_concat()
FROM table_name
GROUP BY column_name1,column_name2
语法举例
SELECT
area_name 销售大区,
group_concat(distinct mall_name separator ‘;’) 有销售门店
FROM sale_order_item
GROUP BY area_name;
查询结果:

在这里插入图片描述


http://www.ppmy.cn/news/12632.html

相关文章

狗厂的N+1+2毕业,我觉得还是挺良心的

最近又跟朋友打听到了新鲜事&#xff0c;年底的新鲜事&#xff0c;什么209万&#xff0c;就是听个乐子&#xff0c;离我太远&#xff0c;什么HR和技术人员产生矛盾&#xff0c;一巴掌眼镜都打飞了&#xff0c;好乱套&#xff0c;今天我跟朋友打听了一些不太乱套的 一、鹅肠 1.…

机器学习:公式推导与代码实现-监督学习集成模型

AdaBoost 将多个单模型组合成一个综合模型的方式早已成为现代机器学习模型采用的主流方法。 AdaBoost正是集成学习中Boosting框架的一种经典代表。 Boosting Boosting是机器学习中的一种集成学习框架。 之前的学习的模型都称作单模型,也称弱分类器。而集成学习的意思是将…

第18章 配置文件的自动新建及其覆盖性写入

1 准备工作 1.1 重构Data.EFCoreContext拷贝构造方法为&#xff1a; #region 拷贝构造方法 ///<param name"options">配置参数实例&#xff0c;通过配置参数实例&#xff0c;调用基类的拷贝构造方法以实现“Microsoft.EntityFrameworkCore.SqlServer”中间件与…

【开发环境】JRE 裁剪 ① ( 裁剪 bin 目录下的 dll 动态库文件 )

文章目录一、JRE 裁剪二、裁剪 bin 目录下的 dll 动态库文件参考博客 : 精简jre1.8精简jre步骤裁剪JRE(嵌入式设备的java环境移植) 资源下载地址 : https://download.csdn.net/download/han1202012/87388400 一、JRE 裁剪 在 【IntelliJ IDEA】使用 exe4j 生成 jre jar 可执…

Spark 运行架构

文章目录Spark 运行架构一、运行架构二、核心组件1、Driver2、Executor3、Master & Worker4、ApplicationMaster三、核心概念1、Exuecutor 和 Core2、并行度&#xff08;Parallelism&#xff09;3、有向无环图&#xff08;DAG&#xff09;4、提交流程Yarn Client 模式Spark…

基于FPGA的AM调制与解调(Verilog语言)

一、概述 通过FPGA实现AM信号的产生与解调。要求是通过VIO控制载波频率、调制信号频率、调制深度可调,然后通过ILA观察AM信号和解调后的信号。载波信号的频率要求是1M~10M,调制信号的频率要求是1K~10K,调制深度从0到1、步进0.1。VIO与ILA只能通过硬件板卡实现。 二、平台 软…

JDK1.8使用的垃圾回收器和执行GC的时长以及GC的频率

1. GC介绍 GC就是垃圾回收器。因为内存空间是有限的&#xff0c;创建的每个对象和变量都会占据内存&#xff0c;gc做的就是对象清除将内存释放出来。其中堆是虚拟机中进行垃圾回收的主要场所&#xff0c;其次是方法区。 2. 垃圾回收器 新生代收集器&#xff1a; Serial&a…

Postgresql源码(98)lex与yacc的定制交互方式

1 背景知识一&#xff1a;LEX %option prefix Postgresql中使用%option prefix"core_yy"&#xff0c;影响范围&#xff1a;yy_create_buffer,yy_delete_buffer,yy_flex_debug,yy_init_buffer,yy_flush_buffer,yy_load_buffer_state,yy_switch_to_buffer,yyin,yyleng…