文章目录
- 1. 多表关系
- 1.1 一对多
- 1.2 多对多
- 1.3 一对一
- 2. 概述
- 2.1 数据准备
- 2.2 简单查询
- 2.3 分类
- 3. 内连接
- 4. 外连接
- 5. 自连接
- 5.1 自连接查询
- 5.2 联合查询
- 6. 子查询
- 6.1 概念
- 6.2 标量子查询
- 6.3 列子查询
- 6.4 行子查询
- 6.5 表子查询
1. 多表关系
项目开发中,在进行数据库表结构设计时,会根据业务需求及业务模块之间的关系,分析并设计表结构,由于业务之间相互关联,所以各个表结构之间也存在着各种联系,基本上分为三种:
- 一对多(多对一)
- 多对多
- 一对一
1.1 一对多
比如部门表与员工表之间的关系就是一对多,即一个部门对应多个员工,一个员工对应一个部门。
想要实现这种关系,需要在多的一方建立外键,指向一的一方的主键,如下图所示。
1.2 多对多
比如学生与课程的关系就是多对多的关系,一个学生可以选修多门课程,一门课程也可以供多个学生选择。
想要实现这种关系,需要建立第三张中间表,中间表至少包含两个外键,分别关联两方主键。
1.3 一对一
比如用户与用户信息详情之间的关系就是一对一关系,多用于单表拆分,将一张表的基础字段放在一张表中,其他详情字段放在另一张表中,以提升操作效率。
想要实现这种关系,需要在任意一方加入外键,关联另外一方的主键,并且设置外键为唯一的(UNIQUE)
2. 概述
2.1 数据准备
执行下述SQL语句进行表的构建,一下面的两个表为例子,
-- 创建dept表,并插入数据
create table dept(id int auto_increment comment 'ID' primary key,name varchar(50) not null comment '部门名称'
)comment '部门表';
INSERT INTO dept (id, name) VALUES (1, '研发部'), (2, '市场部'),(3, '财务部'), (4,'销售部'), (5, '总经办'), (6, '人事部');
-- 创建emp表,并插入数据
create table emp(id int auto_increment comment 'ID' primary key,name varchar(50) not null comment '姓名',age int comment '年龄',job varchar(20) comment '职位',salary int comment '薪资',entrydate date comment '入职时间',managerid int comment '直属领导ID',dept_id int comment '部门ID'
)comment '员工表';
-- 添加外键
alter table emp add constraint fk_emp_dept_id foreign key (dept_id) referencesdept(id);
INSERT INTO emp (id, name, age, job,salary, entrydate, managerid, dept_id)
VALUES(1, '金庸', 66, '总裁',20000, '2000-01-01', null,5),(2, '张无忌', 20, '项目经理',12500, '2005-12-05', 1,1),(3, '杨逍', 33, '开发', 8400,'2000-11-03', 2,1),(4, '韦一笑', 48, '开发',11000, '2002-02-05', 2,1),(5, '常遇春', 43, '开发',10500, '2004-09-07', 3,1),(6, '小昭', 19, '程序员鼓励师',6600, '2004-10-12', 2,1),(7, '灭绝', 60, '财务总监',8500, '2002-09-12', 1,3),(8, '周芷若', 19, '会计',48000, '2006-06-02', 7,3),(9, '丁敏君', 23, '出纳',5250, '2009-05-13', 7,3),(10, '赵敏', 20, '市场部总监',12500, '2004-10-12', 1,2),(11, '鹿杖客', 56, '职员',3750, '2006-10-03', 10,2),(12, '鹤笔翁', 19, '职员',3750, '2007-05-09', 10,2),(13, '方东白', 19, '职员',5500, '2009-02-12', 10,2),(14, '张三丰', 88, '销售总监',14000, '2004-10-12', 1,4),(15, '俞莲舟', 38, '销售',4600, '2004-10-12', 14,4),(16, '宋远桥', 40, '销售',4600, '2004-10-12', 14,4),(17, '陈友谅', 42, null,2000, '2011-10-12', 1,null);
2.2 简单查询
多表查询就是指从多张表中查询数据。原来查询单表数据,执行的SQL形式为:select * from emp;
,那么我们要执行多表查询,就只需要使用逗号分隔多张表即可,如: select * from emp , dept;
, 具体的执行结果如下:
此时,我们看到查询结果中包含了大量的结果集,总共102条记录,而这其实就是员工表emp所有的记录(17) 与 部门表dept所有记录(6) 的所有组合情况,这种现象称之为笛卡尔积。接下来,就来简单介绍下笛卡尔积。
**笛卡尔积: **笛卡尔乘积是指在数学中,两个集合A集合 和 B集合的所有组合情况。
而在多表查询中,我们是需要消除无效的笛卡尔积的,只保留两张表关联部分的数据,比如下面的数据,我们只需要保存dept_id
相等的行,而不相等的行并没有用,可以舍去,
在SQL语句中,如何来去除无效的笛卡尔积呢? 我们可以给多表查询加上连接查询的条件即可,如下:
select * from emp , dept where emp.dept_id = dept.id;
2.3 分类
- 连接查询
- 内连接:相当于查询A、B交集部分数据
- 外连接
- 左外连接:查询左表所有数据,以及两张表交集部分数据
- 右外连接:查询右表所有数据,以及两张表交集部分数据
- 自连接:当前表与自身的连接查询,自连接必须使用表别名
- 子查询
3. 内连接
内连接查询的是两张表交集部分的数据。(也就是绿色部分的数据)
内连接的语法分为两种: 隐式内连接、显式内连接。先来学习一下具体的语法结构。
-
隐式内连接
SELECT 字段列表 FROM 表1 , 表2 WHERE 条件 ... ;
-
显式内连接
SELECT 字段列表 FROM 表1 [ INNER ] JOIN 表2 ON 连接条件 ... ;
代码演示如下:
# 查询每一个员工的姓名,及关联的部门的名称 (隐式内连接实现)
select emp.name , dept.name from emp , dept where emp.dept_id = dept.id ;
-- 为每一张表起别名,简化SQL编写
select e.name,d.name from emp e , dept d where e.dept_id = d.id;# 查询每一个员工的姓名 , 及关联的部门的名称 (显式内连接实现)
select e.name, d.name from emp e inner join dept d on e.dept_id = d.id;
-- 为每一张表起别名,简化SQL编写
select e.name, d.name from emp e join dept d on e.dept_id = d.id;
**注意:**一旦为表起了别名,就不能再使用表名来指定对应的字段了,此时只能够使用别名来指定字段。
4. 外连接
外连接分为两种,分别是:左外连接(左边蓝色部分) 和 右外连接(右边黄色部分)。具体的语法结构为:
-
左外连接
SELECT 字段列表 FROM 表1 LEFT [ OUTER ] JOIN 表2 ON 条件 ... ;
左外连接相当于查询表1(左表)的所有数据,当然也包含表1和表2交集部分的数据。
-
右外连接
SELECT 字段列表 FROM 表1 RIGHT [ OUTER ] JOIN 表2 ON 条件 ... ;
右外连接相当于查询表2(右表)的所有数据,当然也包含表1和表2交集部分的数据。
代码演示如下:
示例1:
# 查询emp表的所有数据, 和对应的部门信息
select e.*, d.name from emp e left join dept d on e.dept_id = d.id;
查询得到的结果如下:
示例2:
# 查询dept表的所有数据, 和对应的员工信息(右外连接)
select d.*, e.* from emp e right outer join dept d on e.dept_id = d.id;
查询到的结果如下:
5. 自连接
5.1 自连接查询
自连接查询,顾名思义,就是自己连接自己,也就是把一张表连接查询多次。我们先来学习一下自连接的查询语法:
SELECT 字段列表 FROM 表A 别名A JOIN 表A 别名B ON 条件 ... ;
而对于自连接查询,可以是内连接查询,也可以是外连接查询。
代码演示如下:
示例1:
# 查询员工 及其 所属领导的名字
select a.name , b.name from emp a , emp b where a.managerid = b.id;
查询结果如下:
示例2:
# 查询所有员工 emp 及其领导的名字 emp , 如果员工没有领导, 也需要查询出来
select a.name '员工', b.name '领导' from emp a left join emp b on a.managerid = b.id;
查询结果如下:
注意:
在自连接查询中,必须要为表起别名,要不然我们不清楚所指定的条件、返回的字段,到底是哪一张表的字段。
5.2 联合查询
联合查询使用的是 union
关键字,对于联合查询,就是把多次查询的结果合并起来,形成一个新的查询结果集,其具体语法如下:
SELECT 字段列表 FROM 表A ...
UNION [ ALL ]
SELECT 字段列表 FROM 表B ....;
- 对于联合查询的多张表的列数必须保持一致,字段类型也需要保持一致。
union all
会将全部的数据直接合并在一起,union
会对合并之后的数据去重。
代码演示如下:
# 将薪资低于 5000 的员工 , 和 年龄大于 50 岁的员工全部查询出来
# 当然,上面的条件可以使用 or 连接条件来查询,这里我们使用联合查询来解决
select * from emp where salary < 5000
union all
select * from emp where age > 50;
查询结果如下:
可以看到,使用 union all
仅仅是进行了一个表的字段的合并,可能是含有重复元素的。
而如果使用 union
的话,其结果如下:
可以发现,数据是进行了去重处理的,没有重复的数据。
如果多条查询语句查询出来的结果,字段数量不一致,在进行union/union all联合查询时,将会报错。如:
6. 子查询
6.1 概念
SQL语句中嵌套SELECT
语句,称为嵌套查询,又称子查询。
SELECT * FROM t1 WHERE column1 = ( SELECT column1 FROM t2 );
子查询外部的语句可以是 INSERT / UPDATE / DELETE / SELECT
的任何一个。
根据子查询结果不同,子查询分为下面四类:
- 标量子查询(子查询结果为单个值)
- 列子查询(子查询结果为一列)
- 行子查询(子查询结果为一行)
- 表子查询(子查询结果为多行多列)
6.2 标量子查询
子查询返回的结果是单个值(数字、字符串、日期等),最简单的形式,这种子查询称为标量子查询。
代码示例如下:
示例1:
# 查询 "销售部" 的所有员工信息
select * from emp where dept_id = (select id from dept where name = '销售部')
上述语句中 select id from dept where name = '销售部'
这个子语句的结果是一个标量,一个字符串值,所以为标量子查询,其结果如下:
示例2:
# 查询在 "方东白" 入职之后的员工信息
select * from emp where entrydate > (select entrydate from emp where name = '方东白');
同样,该示例应该先查询方东白
的入职时间,然后查询比起入职时间晚的员工的信息,结果如下:
6.3 列子查询
子查询返回的结果是一列(可以是多行),这种子查询称为列子查询。
常用的操作符:IN, NOT IN, ANY, SOME, ALL
操作符 | 描述 |
---|---|
IN | 在指定的集合范围之内,多选一 |
NOT IN | 不在指定的集合范围之内 |
ANY | 子查询返回列表中,有任意一个满足即可 |
SOME | 与ANY 等同,使用SOME 的地方都可以使用ANY |
ALL | 子查询返回列表的所有值都必须满足 |
示例1:
查询 “销售部” 和 “市场部” 的所有员工信息
分解为以下两步:
# 查询 "销售部" 和 "市场部" 的部门ID
select id from dept where name = '销售部' or name = '市场部';
# 根据部门ID, 查询员工信息
select * from emp where dept_id in (select id from dept where name = '销售部' or name = '市场部');
查询结果如下:
示例2:
查询比 财务部 所有人工资都高的员工信息
分解为以下两步:
# 查询所有 财务部 人员工资
select id from dept where name = '财务部';
select salary from emp where dept_id = (select id from dept where name = '财务部');# 比 财务部 所有人工资都高的员工信息
select * from emp where salary > all
( select salary from emp where dept_id = (select id from dept where name = '财务部') );
示例3:
查询比研发部其中任意一人工资高的员工信息
分解为以下两步:
# 查询研发部所有人工资
select salary from emp where dept_id = (select id from dept where name = '研发部');# 比研发部其中任意一人工资高的员工信息
select * from emp where salary > any ( select salary from emp where dept_id =
(select id from dept where name = '研发部') );
查询结果如下:
6.4 行子查询
子查询返回的结果是一行(可以是多列),这种子查询称为行子查询。常用的操作符为 =, <>, IN, NOT IN
。
示例1:
查询"张无忌" 的薪资及直属领导相同的员工信息 ;
select * from emp where (salary,managerid) =
(select salary, managerid from emp where name = '张无忌');
6.5 表子查询
子查询返回的结果是多行多列,这种子查询称为表子查询。常用的操作符为 IN
。
操作示例如下:
示例1:
查询与 “鹿杖客” , “宋远桥” 的职位和薪资相同的员工信息。
该问题可以分解为两步进行查询,如下:
# 查询 "鹿杖客" , "宋远桥" 的职位和薪资
select job, salary from emp where name = '鹿1 杖客' or name = '宋远桥';# 查询与 "鹿杖客" , "宋远桥" 的职位和薪资相同的员工信息
select * from emp where (job,salary) in
( select job, salary from emp where name = '鹿杖客' or name = '宋远桥' );
其查询结果如下:
示例2:
查询入职日期是 “2006-01-01” 之后的员工信息 , 及其部门信息
分解为两步执行:
# 入职日期是 "2006-01-01" 之后的员工信息
select * from emp where entrydate > '2006-01-01';# 查询这部分员工, 对应的部门信息;
select e.*, d.* from
(select * from emp where entrydate > '2006-01-01') e left join dept d on e.dept_id = d.id ;
结果如下: