对SQL基础知识第2版、SQL高级知识第2版、SQL145题第2版-by李岳的书评

news/2025/1/11 22:01:23/

目录

1、书籍来源

2、入门难度

3、《SQL基础知识》的概览

3.1、写一条SQL查询语句,必须掌握的基础知识。

3.2、之后,操作表结构及插入数据:

3.3、然后,一张数据表的结构组成元素

3.4、最后是,写SQL查询或修改语句,可能会用到的各种数学、日期、字符处理函数

3.5、事务??

4、《SQL高级知识》的概览

4.1、更好地写好一条SQL查询语句

4.2、一种特殊的数据表的增删改的操作语句

4.3、用后端编程的思维写SQL语句

5、《SQL基础知识》、《SQL高级知识》的分析与总结

5.1、《SQL基础知识》的特点

5.2、《SQL高级知识》的特点

6、《SQL145题目》的概览与分类

7、145题的分章节讨论

7.1、第一章节、普通使用问题(16)

7.2、第二章节、聚合函数的使用(17)

7.3、第三章节、开窗函数(14)

7.4、第四章节、日期处理问题(6)

7.5、第五章节、综合题(8)

7.6、第六章节、其他函数的应用(7)

7.7、第七章节、待分类(14+2)

7.8、第八章节、数学问题(5)

7.9、第九章节、行列变换问题(16)

7.10、第十章节、父子表与递归的问题(9)

?7.11、第十一章节、上下行比较与连续(重复/递增)问题(20)

7.11.1、上下行问题

7.11.2、序列、连续分组:组内连续次数

7.11.3、序列、连续分组:合并组

7.12、第十二章节、动态SQL、函数与存储过程(10)

结束


1、书籍来源

很久之间就关注到了公众号“SQL数据库开发”中,发布了SQL基础知识、SQL高级知识两本电子书,其中均为号主李岳所编写的公众号文章,围绕SQL语句的入门、进阶知识,然后进一步将历史发布的SQL训练题汇编为SQL145题的电子书,现在均已经迭代到第二版。

注意:虽然,SQL语句几乎是关系型数据库的通用的调取数据的接口了,但是,各个数据库产品所支持的SQL语法还是有略微的不同。而这三本书,是作者基于微软的SQL Server数据库来编写的,理论、方法都是共通的,实操起来会有10~30%的不同,注意自行查资料区别开来。

SQL基础知识(第二版)

SQL高级知识(第二版)

SQL145题(第二版)(付费)

2、入门难度

该套书的入门难度,不是零基础,哪怕是对“访问数据库→→使用SQL语句→→调取数据”有一点点经验的人,可能还是无法阅读下去“SQL基础知识”以及后两本书;这类人群,可能还是需要完完整整地跟着一套MySQL(或别的数据库)学习视频课,从安装、连接、建库、建表、各类常规查询、后端语言调用…一整套操作下来,然后进一步学这套书,就会有如虎添翼的感觉,而不是举步维艰、味同嚼蜡。而有后一种感觉,说明你学这套书的基础不够。

3、《SQL基础知识》的概览

在“SQL基础知识”中,作者从一条SQL查询语句的执行顺序讲起,然后一个关键字、一个关键字的研究讨论,其中内容分类起来,有如下几部分:

3.**1、**写一条SQL查询语句,必须掌握的基础知识。

  • 第一章~第十四章:SELECTDISTINCT→**…WHEREAND**、OR→UNIOIN ALL
  • **漏编入的一章:**GROUP BY关键字的“大哥”:HAVING
  • **第二十四章:**SQL查询语句的嵌套艺术:子查询
  • **第二十章:**避免混淆,起别名的AS
  • **第十八章:**一套查询语句的固定化:VIEW

3.2、之后,操作表结构及插入数据:

  • **第十六章:**创建数据库、表、索引:CREATE;
  • **第十七章:**修改表(操作列及其类型、约束(注:乃至索引)):AITER TABLE;
  • **第十五章:**插入数据:SELECT INTO、INSERT INTO;

3.3、然后,一张数据表的结构组成元素

  • **第三十章:**常用数据类型
  • **第十九章:**不可忽视的NULL
  • **第二十一章~第二十二章:**对于列的强制性格式规定:(六大)约束
  • **第二十三章:**针对某些列,建的目录:索引

3.4、最后是,写SQL查询或修改语句,可能会用到的各种数学日期字符处理函数

  • 第二十七章~第二十九章

3.5、事务

事务部分,是介绍,在多次修改表的数据的时候,要保证数据的安全所使用的一种技术,例如一次支付操作中,买家的账户扣款了,卖家的账户没有增加,就发生问题了。

  • 第二十六章:数学、日期、字符处理

4、《SQL高级知识》的概览

4.1、更好地写好一条SQL查询语句

在“SQL高级知识”中,第一部分是针对写一个SQL查询语句的增强,使它可以实现更强的查询功能,与SQL Server数据库深度绑定的内容会多一些,

  • 第二章:实现if条件判断的效果:CASE WHEN
  • 第九章:开窗函数的应用:OVER()
  • 第三章:from子句中,嵌套select查询,提高效率,但更复杂:派生表
  • 第四章:访问另外一个数据库实例中的表(SQL Server的特性):DBLINK
  • 第五章:union all的兄弟,交集与差集:集合的用法
  • 第六章:group by的高级用法(SQL Server的特性):分组集
  • 第十一章:对自连接进行深度增强:递归查询(文中例子专属SQL Server,MySQL中要变一下)

4.2、一种特殊的数据表的增删改的操作语句

一种SQL Server中,以某表的数据为基准,对另一个表的数据进行增删改的操作语句

  • **第七章:**MERGE INTO

4.3、用后端编程的思维写SQL语句

将后端语言中,“定义变量→→条件判断→→循环→→参数、方法”的思维引入,与SQL语句深度结合,因此,形成了自定义函数、定时作业、存储过程触发器这四个组件(前二者书中没有涉及)。

虽然存储过程、触发器,已经是相对独立的、有特定功能的一组SQL语句,但其组成的基础,变量动态SQL,仍然可以单独拎出来,在客户端的SQL编辑页面,放在SQL语句中,去单独执行,我在MySQL8.0中,就是运用文中的理论,这样去测试的,但是语法是不同的。

之所以将,创建临时表这个章节归入此部分,是因为,我们在设计一个存储过程时,可能就会创建一个临时表,来保存一个SQL语句的查询结果,然后,在后续的某个步骤中,再去调用这个表中的结果,一切结束后,就自动删除该表了;而相对的,为开发BI报表去写一个SQL查询语句,或类似的场景,往往不能去额外创建表、使用动态SQL。

  • 第十章:变量的用法
  • 第一章:临时表的用法
  • 第十三章:动态SQL的用法
  • 十二:流程控制的用法
  • 第八章:存储过程的用法
  • 第十四章:触发器的用法

5、《SQL基础知识》、《SQL高级知识》的分析与总结

5.1、《SQL基础知识》的特点

《SQL基础知识》的第一个特点是,系统性地带你走一遍,一条SQL(查询)语句所有涉及的关键字,一个一个的过,全面而细致。这样就不需要你在SQL学习的入门阶段,碰到一个不懂的,就到处去搜,不系统。因为假如这样做,你也不知道,你是否基本搞明白了——关于这个不懂的问题的所有该掌握的知识,以及,它和其他知识的关系是什么。

另外要说,第一章中,一条SELECT查询语句的执行顺序,简直是一条纲领,我们每天都在写SQL查询语句,几乎都要想,什么先执行、什么后执行,然后去设计处理步骤,如果你不能看懂这一部分的大致内容,可以说,剩下的所有内容都不必看,可以说,你没有入门写SQL语句这一行。

第二个特点是,系统性的了解一张数据表的创建、修改、结构组成、插入数据。数据库管理系统(DBMS)的组成单位就是一个个库→→一张张表,所以一定要明白,一张表所涉及的所有知识,这里,同样称赞岳哥的撰文的系统性

最后,个人觉得,事务部分,可以放在第二本书中。事务针对的是多个增删改语句的一组操作的执行安全问题,好比,支付业务操作中,买家的钱少了,卖家的钱必须加上去,不能存在后者不动的情况。它起源于,对某数据表进行频繁更新的操作,进一步地,当多个事务都涉及某个表的数据的更新操作,那谁先谁后呢,那影不影响查询的结果呢?这就引出了数据库管理系统(DBMS)中的事务隔离级别的设计,然后我们要研究,一条增删改SQL语句,是如何在数据库中运行的,由此会有很多展开讲的内容。所以在第一本书中,会觉得有点不搭,放在《SQL高级知识》会比较好。

5.2、《SQL高级知识》的特点

《SQL基础知识》的第一个特点是,在上文1.4.1中,所提到的,为了写一条更好的SQL查询语句,讲了很多高级用法,其中特别牛的是开窗函数递归,这两样,几乎是写一些有难度的查询SQL语句中,非常好用的特性,但是开窗函数在MySQL中,只支持8.0以上的版本;但是大多数的工作中都是写的普通难度的查询,似乎也用不到很高级的特性,因此,该部分中,用于条件判断的case when语句、派生表,倒是比较常用的。

第二个特点,当然是“**从变量到存储过程”**了。当你需要按照一整套流程去处理一次数据,其中步骤很多,涉及查与增删改,涉及很多的判断与循环,等等等等。那就必须系统地从变量学起,一直到怎么写出一个存储过程为止,这对于很多做数据处理,如数仓中的ETL的工作很有帮助。

并且,我也在上文的用词中,反复区别强调,SQL查询语句、SQL增删改语句的不同,前者只需要绞尽脑汁设计数据的转化步骤、得出一种很漂亮的数据结果,就完了;后者需要考虑很多东西,删那些、改哪些,先改什么、后改什么,所用的时间能不能少,锁表、并发咋办…

我觉得有一个缺点在于,例子都太简单了,应该给一些完整的难的存储过程的创建、设计、处理的例子,再者,缺少游标循环的讲解,只有条件判断,这两个也是写存储过程、自定义函数等的不可少的手段。总之,关于这方面的进一步全面的讲解,更难的例子,哪怕在第三本书中,都是缺少的。

总结

整个两本书中,前一本+后一本的一半部分中,针对如何写好SQL查询语句,从SQL语句的关键字开始,到数据库的表结构,再到一些高级查询的用法(开窗、递归)(但是没有讲到with表表达式),以及变量、动态SQL、事务,可以说非常入门、系统、详尽、朴实。

后一本的另一半部分中,详细引入了利用SQL语句来编程的思想,从变量开始,最终得到了触发器存储过程。虽然没有进一步讲变量在SQL查询语句中的有难度的使用,讲存储过程中缺少了游标和循环自定义函数定时作业更难一些的完整样例,但仍然是入门的系统性、全面性的佳作。

可以说,完整阅读完了,你就在SQL相关的知识这一块,该会的都会了,没有知识盲点,完全有能力理解任何人写的SQL语句,也不会说,别人谈SQL的某一方面的东西,你一点概念也没有,完全懵。

最后,SQL语句这一块,其实并没有完全结束,除了上述提到的缺少的东西需要精进外,SQL增删改(存储过程)、SQL优化、数据库内部的原理、数据库运维…可能是下一步的内容。

6、《SQL145题目》的概览与分类

《SQL145题》是作者汇编以往发过的公Z号文章,汇编而来的,每一题都是题目、效果图、建表语句、解法(SQL Server+MySQL)、解析构成,非常适合阅读完上两本书的读者,在这本书中去训练。

但是有一个问题是,题目的编排是乱序的,也没有分章节,只有1~145题的顺序序号,如下图所示,是我拟定分类、加章标题、修改了每一题的标题后,整理如下。

整理的基本规则是,分类上,按照问题或解法的相似性(二者高度相关,但不必然),顺序上,按问题或解法的难度,由易到难。但是有一些题目,其实并不能严格分类,比如说,序号11分类中,有一些题目是使用自连接的解法,但是没有归类到序号1分类中,这一题,我就认为问题的相似性高于解法的相似性。

7、145题的分章节讨论

所有的145题按章节,我大概分如下两个阶段:

  • 基础
  • 1、普通使用问题(16)
  • 2、聚合函数的使用(17)
  • 3、开窗函数(14)
  • 4、日期处理问题(6)
  • 5、综合题:普通使用+聚合函数+开窗函数+日期处理(8)
  • 6、其他函数应用(7)
  • 7、待分类(14+2)
  • 专题
  • 8、数学问题(5)
  • 9、行列变换问题(14)
  • 10、父子表与递归的问题(11)
  • 11、上下行比较与连续问题(20)
  • 12、动态SQL、函数与存储过程(10)

7.1、**第一章节、**普通使用问题(16)

基础阶段中,第一章节普通使用问题,大多数题目,问题虽然各种各样,但是解法上,只需要“自连接+where条件筛选+case when”就可以,当然,少部分题目也有例外,会用到子查询、聚合函数等等,但是可以从题目难度、解题思路上,看出来,只是一种很简单的使用,所以,类似的题目,我归纳为“普通使用问题”。

7.2、**第二章节、**聚合函数的使用(17)

第二章节聚合函数的使用,这一章比上一章更难的原因在于,一定会涉及分组group by的思想,将一组数据,按照某列进行分组,然后或聚合函数,或case when,或其他处理。因此,本章重点在于聚合函数的使用

7.3、**第三章节、**开窗函数(14)

第三章节开窗函数中,较于上一章,显而易见,解法多围绕开窗函数;一类是sum()、count()、min()、max(),一类是row_number()、rank()、dense_rank()排序的,一类是lag()、lead()获取上下行的;它在select子句中使用,在over()中设定分组条件,并且还有一个不常设置的rows between选项。

7.4、**第四章节、**日期处理问题(6)

第四章节日期处理中,将一些涉及时间、日期的处理的问题,单独列在一起了;第4题使用了UNIX_TIMESTAMP()函数;144题要求判断一个日期是否是周一~周五;21题中,要求按照给定的一个日期,求出“该月第一天、最后一天;该周第一天、最后一天…”,很有意思。

第108题比较难一点,给定一个日期区间的两列“2024-1-28,2024-2-2”,要求求出其对应的月份,各有多少天,即得到两条数据,“1,4”、“2,2”。

解法之一是,先找出最小日期值、最大日期值,然后生成一列按天数1去递增的日期列,再与源表相连,再按月份聚合,即可得出结果。

7.5、**第五章节、**综合题(8)

第五章节,因为是一套题,即一组源数据,出了很多个题目,而且前述的章节的内容这里都有涉及,所以算作是一次简单的单元测验(其中有一题,太过简单,故删除了一题)。

7.6、**第六章节、**其他函数的应用(7)

第六章节,其他函数的应用中,按MySQL算,其实涉及的函数不多,返回不为null的coalesce()函数,locate()、regexp_replace()字符串处理函数,rand()随机数函数,round()除法函数;但我在做题的过程中,其实遇到了很多小众一点的函数,例如cast(),lpad(),rpad(),if(),regexp正则,group_concat()等等等等,但是如果都收录进该章,可能会破坏其他章节的分类,故这一章的分类,有点名不副实。

7.7、**第七章节、**待分类(14+2)

第七章节,待分类中,是将分类特征不明显的,或单列一类后数量太少,都放在其中。24、53题,是一种技巧的运用,比较简单;

30、68题,介绍了列之间的模糊匹配的办法。

select * from table wherecol1 like concat(‘%’,col2,‘%’)

79、94题,要求得出每一行中,列值中的最大值,实际上,解法就是把比较的几个列并在一起,就好求了。

select id,col1

union all

select id,col2

union all

select id,col3

96、132、91、92题中,涉及一种分配问题,如下图所示,按红色图示分配,生成绿色地一列分配结果,思路是很简单,先求出待分配列地累计结果,然后写复杂的case when来判断边界值是否越过,分情况得出分配结果列

88、145题中,是一种累计求和的问题,比如第1天1分钱、第2天2分钱、第3天4分钱…以此类推,第N天多少钱,基本都可以视情况,使用递归或sum()over()开窗函数求出来,实在不行,还有存储过程,去编程。

105、46题,是出了一道更新语句、一道删除语句题,故此分类。

7.8、**第八章节、**数学问题(5)

本章节中,归类的都是一些数学问题,使用SQL求解。试举其中的53题为例,给出一列数,要求任意几个数组合,相加的结果在90~100之间,求出符合该要求的所有组合。解法上,可以使用递归,每次递归,得到累加和、相加的公式字符串,结束递归的条件设置为,累加和在小于100,最后再筛选大于90的。递归的效果图,如下所示:

7.9、**第九章节、**行列变换问题(16)

本章归类的问题,从传统的“行转列”问题引申,扩大到,列/行的拆分和合并问题,并且由易到难。74题中,要求两个表,逐行拼接到一起,如下所示,解法很简单,row_number()分别给一个序号,再连接一下、取全集即可。60题中,要求筛除出某行的三列值,其实union all合并为一行就行了。

106、78、77题中,涉及“多行合并为一行”问题,如下所示,其实,MySQL中,group_concat()函数很容易操作,分组再用它聚合起来,很简单。

51题中,涉及一个反过来的问题,“一行拆分为多行”,这在PostgreSQL中,也是一个函数的事儿——regexp_split_to_table(String, pattern),直接实现如下图的效果;MySQL8.0中,只能通过递归+substring(每次从第一个逗号“,”处截取)实现了,代码如下;

WITH RECURSIVE SplitStrings AS (-- 初始查询:从字符串中提取第一个元素SELECT SUBSTRING_INDEX('a,b,c', ',', 1) AS value,SUBSTRING('a,b,c', LENGTH(SUBSTRING_INDEX('a,b,c', ',', 1)) + 2) AS remainingUNION ALL-- 递归部分:继续处理剩余的字符串SELECT SUBSTRING_INDEX(remaining, ',', 1) AS value,SUBSTRING(remaining, LENGTH(SUBSTRING_INDEX(remaining, ',', 1)) + 2)FROM SplitStringsWHERE remaining != ''
)
-- 选择最终结果
SELECT value
FROM SplitStrings;

11、107、116、111、22题中,是经典的“列转行”问题,如下图所示,解法就是group by+case when,代码如下:

CREATE TABLE sales_data (year INT,period ENUM('上半年', '下半年'),amount INT
);INSERT INTO sales_data (year, period, amount)
VALUES(2018, '上半年', 100),(2018, '下半年', 200),(2019, '上半年', 300),(2019, '下半年', 400),(2020, '上半年', 300),(2020, '下半年', 200);SELECT year,SUM(CASE WHEN period = '上半年' THEN amount ELSE 0 END) AS 上半年,SUM(CASE WHEN period = '下半年' THEN amount ELSE 0 END) AS 下半年
FROM sales_data
GROUP BY year;

122、82、85题中,是一种“行增加”问题,如下图所示,按照某列的值,重复增加对应的行。解法上,可以使用递归,但是更常见的,是与一列自然数去自连接的方法,如下图所示,MySQL8.0中得到一列自然数,可以使用变量操作,代码如下,熟悉后,就比较简单。

而49、131题中,则是需要使用递归,操作的是日期值。

总而言之,MySQL8.0中,行增加,只有两种方式,一种是递归,一种是自连接,如下所示。

SELECT @aa:=@aa+1 as aa from
(SELECT 1 UNION SELECT 2 UNION SELECT 3 UNION SELECT 4 UNION SELECT 5) t1,
(SELECT 1 UNION SELECT 2 UNION SELECT 3 UNION SELECT 4 UNION SELECT 5) t2, 
(SELECT @aa:=0) aa

7.10、**第十章节、**父子表与递归的问题(9)

本章节中,所谓父子表,就是将有层级关系的行记录放在一张表中,通过父ID来指向上一条记录,如下图所示,类似的地名(省-市-县)也是典型的父子表。一般涉及父子表各种问题中,解法上的重点,一个是自连接,一个就是递归,这也是为什么本章将父子表与递归关联在一起。

如66、45题中,只是简单的在父子表中的父ID、子ID关联的基础上,做简单查询,故不讨论。

如25、100、112题中,涉及如下图所示的转换要求,即展示所有层级关系于一行,只要我们画出层级图来,知道有N层后,然后从根节点去joinN层就ok了,代码样例如下。

select m1.name,m2.name,m3.name
from Mytable m1
left join Mytable m2 on m1.父ID=m2.ID
left join Mytable m3 on m2.父ID=m3.ID

54、109、97题中是,要求加一列,来展示对应的节点的层级关系,解法是用递归去做,从根节点开始,一层层地向下递归,每次递归时拼接对应字符串,最终得到如下所示结果。

-- MySQL8中,注意,每个递归中,递归原点里,字符串列的长度,如下所示,要转一下格式,否则
-- ,后续递归公式中的所对应的字符串列长度是不会超过该列的;
WITH recursive CTE AS(
-- ↓↓递归原点,部分
SELECT ID,name,父ID,Cast(name as char) AS PATH  
FROM Mytable t
WHERE 父ID is nulll
UNION ALL
-- ↓↓递归公式,部分
SELECT  C.ID,C.name,C.父ID,CONCAT(CTE.PATH,'->',Cast(C.name as char)) PATH 
FROM Mytable C
INNER JOIN CTE ON C.父ID=CTE.ID 
)
-- ↓↓递归结果,部分
SELECT * FROM CTE

115题中,要求按某个层级,去求所属节点的和,解法同上,只是递归原点设定“where 父ID=1”,然后拼接字符串变成求累加和。

7.11、**第十一章节、**上下行比较与连续(重复/递增)问题(20)

本章节的所有题目分为三组,如下所示,一方面是涉及上下行的比较,得出一些结果;一方面是,对按某一序列排列的行,找出重复行或连续行,进行分组,之后再进行一些组内排序,或行合并,这部分难度偏大,涉及一些特定的算法或用法。

  • 11.1、上下行问题
  • 11.2、序列、连续分组:组内连续次数
  • 11.3、序列、连续分组:合并组

7.11.1、上下行问题

上下行问题中,基本要求进行上下行的比较,生成比较结果,然后做进一步筛选,效果如下图所示,解法上都是做自连接,条件设置为与下一行去连接,或者在select子句中,用子查询,也能达到下图所示的效果;

当要求查出连续(重复)出现两次、三次的数据时,需要进一步使用自连接+筛选

自连接+筛选】:如下图所示,伪代码如下所示;

原理上,先得到笛卡尔积,对于连续重复二次,去识别每行的上一行或下一行是否重复,是,则选入该行;对于连续重复三次,去识别每行的下一行and下二行,或上一行and下一行,或上一行and上二行,是否是重复的,是,则选入该行。最后对源表去重即可。

-- 连续两次
select DISTINCT m1.*
from Mytable m1, Mytable m2 
where(m1.id+1=m2.id or m1.id-1 =m2.id) 
and m1.name=m2.name-- 连续三次
select DISTINCT m1.*
from Mytable m1, Mytable m2 , Mytable m3 
where 
(
(m1.id+1=m2.id and m1.id+2=m3.id) or 
(m1.id-1=m2.id and m1.id+1=m3.id) or 
(m1.id-1=m2.id and m1.id-2=m3.id)
) 
and m1.name=m2.name
and m1.name=m3.name
7.**11.2、**序列、连续分组:组内连续次数

这一节中,要求按某一序列,对连续(重复)的行进行分组,得出每组的连续次数。解法上,需要使用“两列差序相减子查询法、变量迭代每一行”的办法,先对连续行分组,然后直接组内生成一列序号,标识出每行的连续(重复)出现的次数。

如下图所示,按id序列,要求对连续(重复)的行,计算出其连续次数列,不连续则重新计数

【**两列差序相减】:**如下图所示,伪代码如下所示;

原理是,利用row_number函数,先生成一列每行加一的自然数列,再按name分组生成一列每行加一的自然数列,二者相减得到group列。于是,你会发现每一个name连续重复的区间,都标识为相同的group值,再进一步,按照group列分组、原id列排序,就可以得到每个name值,连续(重复)出现的次数列。

with t1 as (
select 
id,name,
row_number()over(order by id) row_number1,
row_number()over(partition by name order by id) row_number2,
from Mytable 
),t2 as (
select 
id,name,row_number1,row_number2,
row_number1-row_number2 group,
from t1 
)
select id,name,row_number1,row_number2,group, 
row_number()over(partition by group,name order by id) rank, 
-- 注意,此处不仅按照group列分组,↑↑还额外添加了name列来分组,可以堵住漏洞
from t2

两列差序相减法的漏洞】:如下图中绿色框中所示,就是同一个的group值下,居然会对应不同的name值;但是问题并不严重,很容易解决,在生成rank列时,注意下,按照group、name两列来分组即可。

子查询法】:原理是,每行中,使用子查询,查出该序列中,该行以上、反向的、最近的一条的row_number列值,两个row_number列值相减,恰好为连续增长列

with t1 as (
SELECT 
id,name,row_number(order by id)over() as rn
FROM Mytable a;
)
SELECT a.id,a.name,a.rn- COALESCE((SELECT b.rn FROM Mytable b WHERE  b.rn < a.rnAND b.name <> a.nameORDER BY b.rn DESCLIMIT 1), 0) AS 连续增长次数
FROM Mytable a;

变量迭代每一行】:这种方法是上一种的替代,原理是,利用两个变量在select子句中进行每一行的遍历,判断是否是连续区间,是,则group_id不变,不是,则group_id加一;伪代码如下所示:

with t1 as (
select 
id,name,
@group_id:=if(@prev_name s null or @prev_name!=name,@group_id+1,@group_id) group_id,
@prev_name:=num prev_name
from Mytable join (SELECT @group_id:=0,@prev_name:=null) tt
order by id
)
SELECT id,num,group_id,row_number()over(partition by group_id order by id) rank
from t1 

如前文所说,已经讲了三种方法来解决,连续(重复)问题,然而还有一类变种问题是,连续(递增)问题,如下图所示,该如何统计其连续区间、连续次数呢?

两列差序相减法】:以上图中日期为例,先使用源表中最小、最大日期,生成一个全量日期的序列表,然后左连接源表,如下图所示,二列相减,id-rn,即可得到连续区间标识列,rn2列,之后再row_number()over()统计连续次数

子查询法】:还没有写,但是从思路来说,也可以写出来。

变量迭代每一行】:思路、解法、写法,稍改下识别条件即可,与前文大致一样。

select id,
DATE_FORMAT(date,'%Y-%m-%d') date,
@group_id:=if(@prev_date is null or DATEDIFF(DATE_FORMAT(date,'%Y-%m-%d'),@prev_date)>1,@group_id+1,@group_id) group_id,
@prev_date:=DATE_FORMAT(date,'%Y-%m-%d') prev_date
from Mytable join (SELECT @group_id:=0,@prev_date:=null)tt
order by DATE_FORMAT(date,'%Y-%m-%d')
7.**11.3、**序列、连续分组:合并组

这小节的问题是,在上一节的基础上,合并连续行为一行,其实已经很简单了,按照上一节的解法,找出连续区间,标识出来,然后,MySQL8.0中,直接使用concat()加聚合函数即可,故不再详述。

7.12、**第十二章节、**动态SQL、函数与存储过程(10)

在本章节中,涵盖编写动态SQL、自定义函数、存储过程三个方面,如下所示。

  • 动态SQL:73、134题
  • 自定义函数:43、93、139、140、141题
  • 存储过程:62、137、138题

在MySQL8.0中,自定义函数只能返回一个值,而不是一个表的结果集,所以可以拼接在普通SQL语句中使用;存储过程中,可以进行查、增删改的处理,各种条件判断、循环,包括建表、临时表,但是没有返回值,可以在末尾中写一个查询语句,然后“call Stored_Procedure_name”调用后,会得到一个结果集,但是是不能放在普通SQL语句中的。

动态SQL的73、134题中,涉及的问题是,当不确定有多少列或列非常多时,该如何实现列转行?解法是,在观察原始的case when解法中,可以得出规律——有多少个列转行,就会写多少个max(case when),那么,我需要先把time列的值取出,依次包装为一个max(case when)的字符串,然后连在一起,最后再拼出一个SQL语句,最后再执行即可,这就是动态SQL的解法。

select 
name,
-- ↓↓↓
max(case when time='1点' then 1 end) '1点',  
max(case when time='3点' then 1 end) '3点',
max(case when time='5点' then 1 end) '5点',
max(case when time='6点' then 1 end) '6点',
max(case when time='9点' then 1 end) '9点',
max(case when time='12点' then 1 end) '12点'
-- ↑↑↑
from Mytable 
group by name-- MySQL8.0
-- 动态SQL
select @AE:=group_concat(concat("case when time='",time,"' then 1 end) '",time,),',')  AS aa 
from
(
select distinct time from Mytable order by time
)ttSET @AE = CONCAT('select name,', @AE , 'from Mytable group by name');PREPARE stmm FROM @AE;EXECUTE stmm;DEALLOCATE PREPARE stmm;

自定义函数的43、93、139、140、141题中,主要是正对数值或字符串的处理,此处直接附上第141题的答案,自定义一个函数,将字符串中的中文字符提取出来,MySQL8.0版。

DROP FUNCTION IF EXISTS ExtractChineseChars;
DELIMITER $
CREATE FUNCTION ExtractChineseChars(inputStr TEXT) 
RETURNS TEXT
DETERMINISTIC   --  此处两行为MySQl的某种设置,必须加
NO SQL
BEGINDECLARE outputStr TEXT DEFAULT '';DECLARE i INT DEFAULT 1;DECLARE mid_char varchar(1);-- 循环遍历输入字符串中的每个字符WHILE i <= CHAR_LENGTH(inputStr) DO-- 获取当前字符的Unicode编码-- 字符串中的相应位置的一个字符取出SET mid_char = MID(inputStr, i, 1);-- 检查是否是中文字符 (中文字符的Unicode范围大致是4E00到9fa5)IF mid_char REGEXP '[\x{4e00}-\x{9fa5}]' THEN-- 如果是中文字符,则添加到输出字符串SET outputStr = CONCAT(outputStr, MID(inputStr, i, 1));END IF;-- 索引加一SET i = i + 1;END WHILE;RETURN outputStr;
END$
DELIMITER ;

存储过程的62、137、138题中,以137题为例,直接附上建存储过程的代码,原理上,是先建一张临时表,设置一个循环,将每日的日期插入其中,然后执行该表的查询,最后删除该临时表,结束存储过程,之后call去调用它来得到一张日期表。

drop PROCEDURE if EXISTS GenerateCalendar;
DELIMITER $
CREATE PROCEDURE GenerateCalendar(IN year INT)
BEGINDECLARE month INT DEFAULT 1;DECLARE day INT DEFAULT 1;DECLARE days_in_month INT;DECLARE is_leap_year BOOLEAN;DECLARE date_str VARCHAR(255);-- 检查是否是闰年SET is_leap_year = (year % 4 = 0 AND (year % 100 != 0 OR year % 400 = 0));-- 创建临时表来存储日历数据CREATE TEMPORARY TABLE IF NOT EXISTS Calendar (date DATE);-- 清空临时表TRUNCATE TABLE Calendar;-- 循环遍历每个月WHILE month <= 12 DO-- 获取当前月份的天数CASEWHEN month IN (1, 3, 5, 7, 8, 10, 12) THEN SET days_in_month = 31;WHEN month IN (4, 6, 9, 11) THEN SET days_in_month = 30;WHEN month = 2 THENIF is_leap_year THENSET days_in_month = 29;ELSESET days_in_month = 28;END IF;END CASE;-- 循环遍历当月的每一天WHILE day <= days_in_month DO-- 插入日期到临时表INSERT INTO Calendar (date) VALUES (DATE_FORMAT(CONCAT(year, '-', LPAD(month, 2, '0'), '-', LPAD(day, 2, '0')), '%Y-%m-%d'));SET day = day + 1;END WHILE;-- 重置天数并增加月份SET day = 1;SET month = month + 1;END WHILE;-- 查询并显示日历SELECT date,year(date) year,month(date) month,WEEKday(date)+1 week_day,DAYOFMONTH(date)day FROM Calendar ORDER BY date;-- 删除临时表DROP TEMPORARY TABLE Calendar;
END$
DELIMITER ;
call GenerateCalendar(2024);

结束


http://www.ppmy.cn/news/1562338.html

相关文章

Linux主机root密码重置

如果忘记了Linux中主机的 root 密码,可以通过以下方法重置密码。具体步骤取决于主机的操作系统类型(如 Linux 或 Windows)以及是否能够物理访问主机。 方法 1:通过单用户模式重置密码(Linux 主机) 适用于能够物理访问主机或通过带外管理(如 iLO、iDRAC)访问主机的场景…

欧拉公式和傅里叶变换

注&#xff1a;英文引文机翻&#xff0c;未校。 如有内容异常&#xff0c;请看原文。 Euler’s Formula and Fourier Transform Posted byczxttkl October 7, 2018 Euler’s formula states that e i x cos ⁡ x i sin ⁡ x e^{ix} \cos{x} i \sin{x} eixcosxisinx. When…

人工智能学习路线全链路解析

一、基础准备阶段&#xff08;预计 2-3 个月&#xff09; &#xff08;一&#xff09;数学知识巩固与深化 线性代数&#xff08;约 1 个月&#xff09;&#xff1a; 矩阵基础&#xff1a;回顾矩阵的定义、表示方法、矩阵的基本运算&#xff08;加法、减法、乘法&#xff09;&…

arcgisPro加载CGCS2000天地图后,如何转成米单位

1、导入加载的天地图影像服务&#xff0c;一开始是经纬度显示的。 2、右键地图&#xff0c;选择需要调整的投影坐标&#xff0c;这里选择坐标如下&#xff1a; 3、点击确定后&#xff0c;就可以调整成米单位的了。 4、切换后结果如下&#xff1a; 如有需要&#xff0c;可调整成…

Ubuntu 安装 Java 1.8

如果你希望使用 Oracle JDK 8&#xff0c;可以按照以下步骤操作&#xff1a; 下载 Oracle JDK 8&#xff1a; 访问 Oracle 官方网站 下载适用于 Ubuntu 的 JDK 8 版本 安装 Oracle JDK 8&#xff1a; 将下载的 JDK 8 压缩包解压到一个目录中&#xff0c;例如 /opt/module&…

PHP7内核剖析 学习笔记 第五章 PHP的编译与执行(1)

PHP的编译与执行是两个相对独立的阶段&#xff0c;编译的流程为词法分析、语法分析、抽象语法树的生成&#xff0c;执行阶段则是根据编译阶段输出的产物&#xff08;即opline指令&#xff09;进行执行。 5.1 语言的编译与执行 计算机只认识机器语言&#xff0c;无法理解人类定…

记录一次Android Studio的下载、安装、配置

目录 一、下载和安装 Android Studio 1、搜索下载Android studio ​2、下载成功后点击安装包进行安装&#xff1a; 3、这里不用打勾&#xff0c;直接点击安装 &#xff1a; 4、完成安装&#xff1a; 5、这里点击Cancel就可以了 6、接下来 7、点击自定义安装&#xff1a…

利用Java爬虫获取义乌购店铺所有商品列表:技术探索与实践

在当今数字化时代&#xff0c;数据的重要性不言而喻。对于采购商和市场分析师而言&#xff0c;能够快速获取并分析供应商店铺内的所有商品信息&#xff0c;是制定有效采购策略和市场分析的关键。义乌购作为国内知名的在线批发平台&#xff0c;拥有海量的商品数据。本文将介绍如…