SQL 分析函数与聚合函数的组合应用

server/2025/1/7 22:22:23/

目标:掌握 SQL 中分析函数(窗口函数)与聚合函数的组合使用,通过实际案例实现复杂业务需求,如同比、环比和趋势分析。


1. 分析函数与聚合函数的区别

  • 聚合函数(Aggregate Functions):对多行数据进行汇总,返回一个结果。常见的有 SUMAVGCOUNTMAX 等。
  • 分析函数(Analytic/Window Functions):在不缩减行数的前提下,基于某个窗口执行计算。常见的有 SUM() OVERRANK()LEAD()LAG() 等。

2. 核心函数介绍

  • SUM() OVER:在特定窗口内累加数据,返回每一行对应窗口的累积值。
  • AVG() OVER:在窗口内计算平均值,常用于移动平均。
  • PERCENT_RANK():计算当前行在窗口内的百分比排名。

3. 案例:计算用户每月销售额及同比、环比增长率

需求描述
  1. 计算每个用户在每个月的总销售额。
  2. 计算每个月的环比增长率(本月与上月相比)。
  3. 计算每个月的同比增长率(本月与去年同月相比)。

示例数据

sales 表结构:

sale_iduser_idsale_amountsale_date
11015002023-01-15
21016002023-02-10
31017002024-01-20
41024002023-01-18
51024502024-01-25

SQL 实现
sql">WITH monthly_sales AS (SELECT user_id,DATE_FORMAT(sale_date, '%Y-%m') AS sale_month,SUM(sale_amount) AS total_salesFROM salesGROUP BY user_id, DATE_FORMAT(sale_date, '%Y-%m')
),
sales_with_trends AS (SELECT user_id,sale_month,total_sales,LAG(total_sales, 1) OVER (PARTITION BY user_id ORDER BY sale_month) AS previous_month_sales,LAG(total_sales, 12) OVER (PARTITION BY user_id ORDER BY sale_month) AS last_year_salesFROM monthly_sales
)
SELECT user_id,sale_month,total_sales,ROUND((total_sales - previous_month_sales) / NULLIF(previous_month_sales, 0) * 100, 2) AS month_over_month_growth,ROUND((total_sales - last_year_sales) / NULLIF(last_year_sales, 0) * 100, 2) AS year_over_year_growth
FROM sales_with_trends
ORDER BY user_id, sale_month;

代码解析

  1. 第一步monthly_sales):按用户和月份汇总销售数据,计算每月销售总额。
  2. 第二步sales_with_trends):
    • 使用 LAG() 计算前一个月的销售额,计算环比。
    • 使用 LAG() 结合 12 个月偏移量计算去年的同月销售额,实现同比。
  3. 最终结果:计算环比、同比增长率,NULLIF 防止除零错误。

结果示例

user_idsale_monthtotal_salesmonth_over_month_growthyear_over_year_growth
1012023-01500NULLNULL
1012023-0260020.00NULL
1012024-0170016.6740.00

4. 亮点解读

  • 环比计算:通过 LAG() 直接获取上个月数据,无需自联表。
  • 同比计算:利用 LAG() 向前偏移12个月,直观且高效。
  • 窗口函数优势:保留所有行数据,且在不改变原始行的基础上计算额外指标。

5. 扩展思考

  • 可以使用 LEAD() 预测未来趋势或计算未来一个月的数据变化。
  • 结合 PERCENT_RANK() 分析各用户在销售额中的排名,实现销售精英筛选。
  • 使用 NTILE(4) 将用户按季度或销售额分组,分析不同等级用户的增长趋势。

这种 SQL 方案适合在业务系统中监控用户销售趋势,适用于电商、金融和 SaaS 产品的业务数据分析。


http://www.ppmy.cn/server/156606.html

相关文章

国产编辑器EverEdit - 常用资源汇总

1 国产编辑器EverEdit-常用资源汇总 EverEdit是一款国产文本编辑器,历经超过15年的更新和维护,拥有不输业界顶级商业文本编辑器(EmEditor、UltraEdit)的实力,甚至在某些方面的功能更强(当然,各有千秋),开发者对文本编辑…

SQL-leetcode-196. 删除重复的电子邮箱

196. 删除重复的电子邮箱 表: Person -------------------- | Column Name | Type | -------------------- | id | int | | email | varchar | -------------------- id 是该表的主键列(具有唯一值的列)。 该表的每一行包含一封电子邮件。电子邮件将不包含大写字母。 编写解…

基于CLIP和DINOv2实现图像相似性方面的比较

概述 在人工智能领域,CLIP和DINOv2是计算机视觉领域的两大巨头。CLIP彻底改变了图像理解,而DINOv2为自监督学习带来了新的方法。 在本文中,我们将踏上一段旅程,揭示定义CLIP和DINOv2的优势和微妙之处。我们的目标是发现这些模型…

STM32的LED点亮教程:使用HAL库与Proteus仿真

学习目标:掌握使用STM32 HAL库点亮LED灯,并通过Proteus进行仿真验证! 建立HAL库标准工程 1.新建工程文件夹 新建工程文件夹建议路径尽量为中文。建立文件夹的目的为了更好分类去管理项目工程中需要的各类工程文件。 首先需要在某个位置建立工…

浅谈棋牌游戏开发流程七:反外挂与安全体系——守护游戏公平与玩家体验

一、前言:为什么反外挂与安全这么重要? 对于任何一款线上棋牌游戏而言,公平性和玩家安全都是最重要的核心要素之一。如果游戏环境充斥着各式各样的外挂、作弊方式,不仅会毁坏玩家体验,更会导致游戏生态崩塌、口碑下滑…

远程医疗系统如何有效防护CC攻击

远程医疗系统如何有效防护CC攻击?随着科技的飞速发展,远程医疗系统已经成为现代医疗服务的一部分。它打破了地域限制,为患者提供了更为便捷、高效的医疗服务。远程医疗系统当下也面临网络安全威胁,其中CC攻击便是一种极具破坏力的…

HTML——69.表单验证属性

<!DOCTYPE html> <html><head><meta charset"UTF-8"><title>表单验证属性</title></head><body><!--input元素的type属性&#xff1a;(必须要有)--> <!--pattern属性:1.规定输入字符的模式&#xff08;如要…

OneFlow的简单介绍

OneFlow 是北京一流科技有限公司旗下的采用全新架构设计的开源工业级通用深度学习框架。以下是关于 OneFlow 的详细介绍&#xff1a; 本篇文章的目录 特点 功能 应用场景 发展历程 特点 简洁易用的接口&#xff1a;为深度学习相关的算法工程师提供一套简洁易用的用户接口…