一文整理完MySQL关系型数据库相关知识

MySQL关系型数据库

- 1. 介绍
- - 1.1 MySQL
- 2. 安装
- 3. SQL语句
- 4. SQL分类
- 5. DDL
- - 5.1 库的DDL
  - 5.2 表、列的DDL
- 6. DML
- - 6.1 添加数据
  - 6.2 修改数据
  - 6.3 删除数据
- 7. DQL
- - 7.1 基础查询
  - 7.2 条件查询
  - 7.3 排序查询
  - 7.4 聚合函数
  - 7.5 分组查询
  - 7.6 分页查询
- 8. 约束
- - 8.1 约束分类
- 9. 多表查询
- - 9.1 内连接查询
  - 9.2 外连接查询
  - 9.3 子查询
- 10. 事务
- - 10.1 隔离级别
- 11. 函数
- - 11.1 数学函数
  - 11.2 字符串函数
  - 11.3 日期函数
- 12. DCL
- - 12.1 用户管理
  - 12.2 权限管理
- 13. 备份与还原
- 14. 表设计流程
- - 14.1 三级模式和两级映射
  - 14.2 数据库设计过程
  - 14.3 需求说明和数据字典
  - 14.4 E-R模型
  - 14.5 关系模式
- 15. 规范化理论
- - 15.1 范式
  - 15.2 反范式
- 16. 并发控制
- 17. 优化
- - 17.1 SQL及索引
  - 17.2 数据库结构优化
  - 17.3 系统配置优化
  - - 17.3.1 操作系统配置优化
    - 17.3.2 MySQL配置文件
  - 17.4 服务器硬件优化

1. 介绍

在这里插入图片描述

在开发中，数据库是专门用来存取数据的软件。数据库的职责就是管理数据的。

根据存取数据的类型分为关系型数据库和非关系型数据库
在这里插入图片描述

数据存储后呈现出来的效果类似上图的，是关系型数据库

在这里插入图片描述

数据存储后呈现出来的效果类似上图的，是非关系型数据库

1.1 MySQL

在这里插入图片描述

官网：http://www.mysql.com

2. 安装

docker方式安装MySQL数据库

前提：安装好了docker软件

1、拉取MySQL镜像

docker pull mysql:5.7   # 拉取 mysql 5.7
docker pull mysql       # 拉取最新版mysql镜像

2、docker run镜像创建容器

docker run --name mysql -e MYSQL_ROOT_PASSWORD=123456 -p 3306:3306 -d mysql:5.7

–name：容器名，此处命名为mysql
-e：配置信息，此处配置mysql的root用户的登陆密码
-p：端口映射，此处映射容器的3306端口到主机3306端口
-d：后台运行容器，保证在退出终端后容器继续运行

设置MySQL挂载目录，启动MySQL容器操作步骤

# MySQL挂在目录创建
mkdir -p /home/mysql/{conf,data,log,mysql-files}# 新建配置文件
vim /home/mysql/conf/my.cnf# 配置文件如下：
[client]
default-character-set=utf8mb4[mysql]
default-character-set=utf8mb4[mysqld]character-set-server=utf8
collation-server=utf8_general_ci
lower_case_table_names=1
init_connect='SET NAMES utf8'
max_connections=5000
wait_timeout=20000
max_user_connections=5000
max_allowed_packet=128M
thread_stack=262144# 容器启动命令
docker run --restart=always --privileged=true --name mysql-container \
-v /home/mysql/conf:/etc/mysql/conf.d \
-v /home/mysql/data:/var/lib/mysql \
-v /home/mysql/log:/var/log \
-v /home/mysql/mysql-files:/var/lib/mysql-files \
-p 3306:3306 -e MYSQL_ROOT_PASSWORD='123456' -id mysql:latest

在这里插入图片描述

3. SQL语句

SQL的英文是Structured Query Language，简称SQL，是一种操作关系型数据库的结构化查询语言。操作数据库，最经常使用就是查询操作。

1、MySQL数据库的SQL语句不区分大小写，关键字建议使用大写；

2、SQL语句可以使用单行或多行书写，以分号结尾

3、注释

单行注释

- 单行注释# 单行注释

多行注释

/*
多行注释
多行注释
*/

4. SQL分类

分类	说明	作用	备注
DDL	数据定义语言	用来对数据库、表、列的定义	data definition language
DML	数据操作语言	用来对数据库中表的数据进行增、删、改操作	data manipulation language
DQL	数据查询语言	用来对数据库中表的数据进行查询	data query language
DCL	数据控制语言	用来对数据库的控制（用户创建、权限控制）	data control language

5. DDL

5.1 库的DDL

展示所有的数据库

show databases;

创建数据库

create database 数据库名称 charset=utf8;
create database if not exists 数据库名称 charset=utf8;

示例：

create database db1 charset=utf8;
create database if not exists db1 charset=utf8;

删除数据库

drop database 数据库名称;
drop database if exists 数据库名称;

示例：

drop database test;
drop database if exists test;

使用数据库

use 数据库名称;

查询正在使用的数据库

select database();

小结：

命令	作用	示例
show databases;	查看所有数据库	show databases;
create database if not exists 数据库名 charset=utf8;	创建数据库	create database if not exists db1 charset=utf8;
use 数据库名;	使用数据库	use db1;
select database();	查看当前使用的数据库	select database();
drop database if exists 数据库名;	删除数据库	drop database if exists db1;

5.2 表、列的DDL

列的内容可以是数字、字符串、时间等，由数据类型约束

数值数据类型

数据类型	字节数	有符号	无符号
tinyint	1个字节	-128~127	0~255
smallint	2个字节	-32768~32767	0~65535
mediumint	3个字节	-8388608~8388607	0~16777215
int	4个字节	-2147483648~2147483647	0~4294967295
bigint	8个字节	-2^63~263-1	0~2^64-1
float	单精度，4个字节	-2^31~231-1	0~2^32-1
double	双精度，8个字节
decimal[M, D]	双精度，8个字节

decimal(5,2)，表示共5位数字，其中2位是小数，比如：888.88

字符串数据类型

数据类型	长度	用途
char(size)	最大255个字符	数据是定长，如md5的密码，邮编，手机号，身份证号等
varchar(size)	最大65535个字节	存放一般内容长度
tinytext	最大255个字节
text	最大65535个字节
mediumtext	最大16777215个字节	大段文本时，如新闻、文章、论文等
longtext	最大4294967295个字节	大段文本时，如新闻、文章、论文等

1、VARCHAR(size)：0~65535字节可变长度字符串，最大65532字节，1-3个字节用于记录大小【utf8编码size最大21844字符，gbk编码最大32766字符】

2、查询速度：char > varchar

3、text与char、varchar不同的是，text不可以有默认值，能用varchar的地方不用text

日期+时间数据类型

数据类型	格式
date	年-月-日，如：2024-4-8
datetime	年-月-日时:分:秒，如：2024-4-8 16:17:40
timestamp	年-月-日时:分:秒，如：2024-4-8 16:17:40
time	时:分:秒，如：16:17:40
year	年，如：2024

datetime保存时间的范围： 1000-01-01 00:00:00 到 9999-12-31 23:59:59

timestamp保存时间的范围： 1970-01-01 00:00:01 到 2038-01-19 03:14:07

展示当前数据库所有表

show tables;

描述表结构

desc 表名;

查看表的创建语句

show create table 表名;

创建表

create table 表名(字段名1 数据类型,字段名2 数据类型,...字段名n 数据类型  # 最后一个不需要逗号(,)
);

删除表

drop table 表名称;
drop table if exists 表名称;

修改表、列

# 修改表名
alter table 表名 rename to 新的表名;# 增加一列
alter table 表名 add 列名 数据类型;# 修改列数据类型
alter table 表名 modify 列名 新数据类型;# 修改列名和数据类型
alter table 表名 change 列名 新列名 新数据类型;# 删除列
alter table 表名 drop 列名;

小结：

命令	作用
show tables;	查看当前数据库中所有表
desc 表名;	查看表结构
show create table 表名;	查看表的创建语句
alter table 表名 rename to 新的表名;	修改表名
alter table 表名 add 列名类型;	添加字段
alter table 表名 modify 列名类型及约束;	修改字段数据类型
alter table 表名 change 原名新名类型及约束;	修改字段名和数据类型
alter table 表名 drop 列名;	删除字段
drop table 表名;	删除表

6. DML

6.1 添加数据

添加指定列数据

insert into 表名(列名1,列名2...) values(值1,值2...);

添加全部列数据

insert into 表名 values(值1,值2...);

批量添加指定列数据

insert into 表名(列名1,列名2...) values(值1,值2...),(值1,值2...)...;

批量添加全部列数据

insert into 表名 values(值1,值2...),(值1,值2...)...;

6.2 修改数据

修改表数据

update 表名 set 列名1=值1 列名2=值2...[where条件];

注：如果不加where条件，就是对该表所有行内容进行修改

6.3 删除数据

删除表数据

delete from 表名 [where条件]

注：如果不加where条件，就是对该表所有行内容进行删除

7. DQL

完整语法

SELECT字段列表
FROM表名列表
WHERE条件列表
GROUP BY分组字段
HAVING分组后条件
ORDER BY排序字段
LIMIT分页限定

- 创建数据库
create database if not exists db1- 创建数据库表
use db1;create table if not exists stu(id int(11),username varchar(32),sex tinyint(1),age tinyint(3),math tinyint(3),chinese tinyint(3)
);- 添加数据
insert into stu values(1,'小张',1,16,75,86),(2,'小李',1,16,76,86),(3,'小王',0,17,76,87),(4,'小胡',0,17,77,87),(5,'小丘',0,18,77,88),(6,'小刘',0,18,80,90);

7.1 基础查询

- 查询指定字段
select id,username from stu;- 查询表所有字段
select * from stu;- 去除重复记录
select distinct sex from stu;- 字段取别名
select id,sex as gender,math shuxue from stu;

7.2 条件查询

select 字段列表 from 表名 where条件

where后面支持多种运算符

运算符	功能描述
比较运算符	=、>、>=、<、<=、!=、<>
逻辑运算符	and、&&、or、\|\|、not
模糊查询	like
范围查询	between…and…、in(…)
空判断	is null、is not null

模糊查询使用like关键字，可以使用通配符进行占位

_：代表单个任意字符

%：代表任意个字符

正则表达式

select * from stu where class_id REGEXP '1|7';

7.3 排序查询

select 字段列表 from 表名 order by 排序字段名1 [,排序字段2]...;

注：排序方式有上序ASC，降序DESC，默认情况下是升序ASC

select * from stu order by math desc,chinese desc;

7.4 聚合函数

在进行查询操作时，往往需要对一整列进行运算，例如成绩的平均分

函数名	功能
count(列名)	统计数量(一般选用不为null的列)
max(列名)	最大值
min(列名)	最小值
sum(列名)	求和
avg(列名)	平均值

select 聚合函数 from 表名;

注：NULL值不参与聚合函数运算

7.5 分组查询

select 字段列表 from 表名 [where分组前的条件限定] group by 分组字段名 [having 分组后的条件过滤];

注：分组之后，查询的字段为聚合函数和分组字段，查询其他字段无任何意义

select sex,max(math),max(chinese) from stu group by sex;

7.6 分页查询

select 字段列表 from 表名 limit 查询起始索引,查询条目数

注：limit关键字中，查询起始索引是从0开始的

8. 约束

约束是作用于数据库表中列上的规则，用于限制添加数据的行为。从而保证数据库中数据的正确性、有效性和完整性。

8.1 约束分类

约束类型	关键字	功能
非空约束	NOT NULL	保证列中所有数据不能有NULL值
唯一约束	UNIQUE	保证列中所有数据各不相同
主键约束	PRIMARY KEY	主键是一行数据的唯一标识，要求非空且唯一
默认约束	DEFAULT	保存数据时，未指定值则采用默认值
外键约束	FOREIGN KEY	外键用来让两个表数据建立关联，保证数据的一致性和完整性
检查约束	CHECK	保证列中的值满足某一条件

create table if not exists stu(id int(11) unsigned auto_increment primary key not null,username varchar(32) not null unique,sex tinyint(1) default 1 not null,age tinyint(3) not null,math tinyint(3) default 0 not null,chinese tinyint(3) default 0 not null
);

9. 多表查询

一次性从多张表中查询需要的数据

create table class(class_id int(11) unsigned auto_increment primary key not null,class_name varchar(32) not null unique
)ENGINE=InnoDB AUTO_INCREMENT=1 DEFAULT CHARSET=UTF8;create table stu(stu_id int(11) unsigned auto_increment primary key not null,class_id int(11) not null,stu_name varchar(32) not null unique
)ENGINE=InnoDB AUTO_INCREMENT=1 DEFAULT CHARSET=UTF8;insert into class(class_name) values('一班'),('二班');insert into stu(class_id,stu_name) values(1,'小张'),(1,'小李'),(2,'小孙'),(2,'小杨');

在MySQL中多表查询分为连接查询和子查询，连接查询又分为内连接和外连接，内连接又分为隐式内连接和显示内连接，外连接又分为左外连接和右外连接。

9.1 内连接查询

- 隐式内连接查询
select 字段列表 from 表1,表2... where 条件;- 显式内连接查询
select 字段列表 from 表1 [inner] join 表2 on 条件;

示例

- 隐式内连接查询
select * from class,stu where class.class_id=stu.class_id;- 显式内连接查询
select * from class inner join stu on class.class_id=stu.class_id;

9.2 外连接查询

左外连接查询：相当于查询A表所有数据和交集部分数据

右外连接查询：相当于查询B表所有数据和交集部分数据

- 左外连接查询
select 字段列表 from 表1 left [outer] join 表2 on 条件;- 右外连接查询
select 字段列表 from 表1 right [outer] join 表2 on 条件;

示例

select * from stu left outer join class on stu.class_id=class.class_id;select * from stu right outer join class on stu.class_id=class.class_id;

9.3 子查询

指查询中嵌套有查询

子查询语句结果是单行单列，子查询语句作为条件值，使用>、>=、<、<=、=、!=等进行条件判断。

# class_id 大于 1班的class_id的学生
select * from stu where class_id > (select class_id from class where class_name='一班');

子查询语句结果是多行单列，子查询语句作为条件值，使用in等关键字进行条件判断

# 查询存在班级的学生
select * from stu where class_id in (select class_id from class);

子查询语句结果是多行多列，子查询语句作为虚拟表

select * from stu,(select * from class) c where stu.class_id=c.class_id;

10. 事务

使用场景：转账、下单扣库存

语法：

# 开启事务
start transaction;
或
begin;-- 执行各种操作# 回滚事务
rollback;# 提交事务
commit;

事务特征：

1、原子性，事务是不可分割最小操作单位，要么同时成功，要么同时失败

2、一致性，事务完成时，必须使所有数据都保持一致状态

3、隔离性，多个事务之间，操作可见性

4、持久性，事务一旦提交或回滚，它对数据库中数据的改变是永久的

10.1 隔离级别

数据库事务的隔离级别有4种，由低到高分别为Read uncommitted 、Read committed 、Repeatable read 、Serializable 。在事务的并发操作中可能会出现脏读，不可重复读，幻读。

读未提交(Read uncommitted)：

解释：

一个事务读到了另一个事务还没有提交的数据。

例如：

A给B转账，
A转给B，10万，点转账，但未点确认
B查账户看到10万
A及时发现，点撤回，修改为1万，再点转账，再点确认

分析：

A给B最终转账是1万，但是在过程中，B能看到过程数据。这就是脏读。

读已提交(Read committed)：
解释：

一个事务要等另一个事务提交后才能读取数据。

例如：

父亲的银行卡有10万
儿子拿着这个银行卡去买单，同时父亲准备转款(开启事务)。此时儿子看到银行卡里有10万
等儿子看完有10万后，钱被父亲转走，并提交
收费系统准备在这个银行卡扣款，再次检测，发现卡里没有钱了

分析：

这就是读已提交，若有事务对数据进行更新操作时，读操作事务要等待这个更新操作事务提交后才能读取数据，可以解决脏读问题。
这个例子中，有读两次卡里的钱，一次是10万，一次是没有钱了，这就是不可重复读。

可重复读(Repeatable read)：
解释：

同一事务下，事务在执行期间，多次读取同一数据时，能够保证读取到的数据是一致的。

例如：

父亲的银行卡有10万
儿子拿着这个银行卡去买单，此时儿子看到银行卡里有10万，这个时候父亲想转账，发现转不了
等儿子买完单，父亲才能够实行转账行为

分析：

读数据的时候，不允许该数据有写数据的事务。因为写数据会改变数据。这样子就解决了不可重复读的问题。但是可能还会有幻读问题。因为幻读问题对应的是插入INSERT操作，而不是UPDATE操作。

什么时候会出现幻读？

解释：

一个事务读取到了另一个事务新增的数据

例如：

儿子某一天去消费，花了8千元，然后他的父亲去查看他今天的消费记录（全表扫描，儿子事务开启），看到确实是花了8千元，就在这个时候，儿子花了1万买了一部电脑，即新增INSERT了一条消费记录，并提交。当父亲打印儿子的消费记录清单时（儿子事务提交），发现花了1.8万元，似乎出现了幻觉，这就是幻读。

串行化(Serializable)：

解释：

它是最高的事务隔离级别，在该级别下，事务串行化顺序执行，可以避免脏读、不可重复读与幻读。但是这种事务隔离级别效率最低，比较耗费数据库性能，一般不推荐使用。

小结：

隔离级别	脏读	不可重复读	幻读
读未提交	可能出现	可能出现	可能出现
读已提交	不会出现	可能出现	可能出现
可重复读	不会出现	不会出现	可能出现
串行化	不会出现	不会出现	不会出现

隔离级别查询

-- MySQL8以前
SELECT @@GLOBAL.tx_isolation, @@tx_isolation;-- MySQL8开始
SELECT @@GLOBAL.transaction_isolation, @@transaction_isolation;

修改隔离级别

-- 建议开发者在修改时，仅修改当前session隔离级别即可
-- REPEATABLE-READ,MySQL默认级别
SET SESSION TRANSACTION ISOLATION LEVEL REPEATABLE-READ

11. 函数

11.1 数学函数

函数	含义
abs(x)	返回x的绝对值
rand()	返回0到1的随机数
mod(x,y)	返回x除以y以后的余数
power(x,y)	返回x的y次方
round(x)	返回离x最近的整数
round(x,y）	保留x的y位小数四舍五入后的值
sqrt(x)	返回x的平方根
truncate(x,y)	返回数字 x 截断为 y 位小数的值
ceil(x)	返回大于或等于 x 的最小整数
floor(x)	返回小于或等于 x 的最大整数
greatest(x1,x2…)	返回返回集合中最大的值
least(x1,x2…)	返回返回集合中最小的值

11.2 字符串函数

函数	含义
trim()	返回去除指定格式的值
concat(x,y)	将提供的参数 x 和 y 拼接成一个字符串
substr(x,y)	获取从字符串 x 中的第 y 个位置开始的字符串，跟substring（）函数作用相同
substr(x,y,z)	获取从字符串 x 中的第 y 个位置开始长度为z 的字符串
length(x)	返回字符串 x 的长度
replace(x,y,z)	将字符串 z 替代字符串 x 中的字符串 y
upper(x)	将字符串 x 的所有字母变成大写字母
lower(x)	将字符串 x 的所有字母变成小写字母
left(x,y)	返回字符串 x 的前 y 个字符
right(x,y)	返回字符串 x 的后 y 个字符
repeat(x,y)	将字符串 x 重复 y 次
space(x)	返回 x 个空格
strcmp(x,y)	比较 x 和 y，返回的值可以为-1,0,1
reverse(x)	将字符串 x 反转

11.3 日期函数

函数	含义
current_date()	当前日期
current_time()	当前时间
current_timestamp()	当前时间戳

12. DCL

12.1 用户管理

创建用户

CREATE USER '用户名'@'主机名' IDENTIFIED BY '密码';
-- 实例：
CREATE USER 'java'@'%' IDENTIFIED BY 'asd123crl';

删除用户

drop user 用户名@IP;
-- 实例：
drop user 'java'@'%';

修改密码

UPDATE `user` SET `Password` = PASSWORD('新密码') WHERE `User` = '用户名';
-- 实例：
UPDATE `user` SET `Password` = PASSWORD('asd123') WHERE `User` = 'java';

12.2 权限管理

常用权限：

表数据: select, update, delete, insert
表结构: create, alert, drop
外键: references
创建临时表: create temporary tables
操作索引: index
视图: create view, show view
存储过程: create routine, alert routine, execute
所有权限: all

查看用户权限命令

SHOW GRANTS FOR '用户名'@'主机名';
-- 实例：
SHOW GRANTS FOR 'root'@'%';

给用户授予权限

在MySQL中使用GRANT命令给用户授权，如果用户不存在，GRANT会自动创建用户，并进行授权。

GRANT 权限列表 ON 数据库名.表名 TO '用户名'@'主机名';  -- 权限列表中如果有多个权限则用逗号,隔开-- 授权所有库的所有表的所有权限
GRANT ALL ON *.* TO '用户名'@'主机名';  
-- 示例：给张三赋予db_test数据库students表的查询权限
GRANT SELECT ON db_test.students TO 'zhangsan'@'localhost';
-- 刷新权限
flush privileges

撤销权限

REVOKE 权限列表 ON 数据库名.表名 FROM '用户名'@'主机名';
-- 示例：撤销张三在db_test.students表的查询权限
REVOKE SELECT ON db_test.students FROM 'zhangsan'@'localhost';
-- 刷新权限
flush privileges

13. 备份与还原

备份语法：

mysqldump -h 服务器 -u 用户名 -p -B 数据库名1 数据库2 数据库n > 备份文件.sql

示例：

mysqldump -u root -p -B test > /backup/123.sql

还原语法：

mysqldump -h 服务器 -u 用户名 -p密码 --databases 数据库名 < 备份文件.sql# 进入数据库后
source 备份文件.sql;

示例：

mysqldump -u root -p --databases test < /backup/123.sql

一般系统推荐的字符集和排序规则

# 字符集
utf8mb4# 排序规则，不区分大小写
utf8mb4_general_cli

字符集(Character Set)：utf8mb4

排序规则 | 字符序(Collate)：utf8mb4_general_cli 或 utf8mb4_bin

14. 表设计流程

14.1 三级模式和两级映射

在这里插入图片描述

视图：一个虚拟表(逻辑上的表)，其内容由查询定义(仅保存SQL查询语句)

14.2 数据库设计过程

在这里插入图片描述

14.3 需求说明和数据字典

需求说明：

能够记录学生信息(学号、姓名、性别、年龄)，也能够记录课程信息(课程名、任课老师)，一个学生可以选择多门课程，并需要记录学生学习课程的成绩。

数据字典：

学生信息：学号、姓名、性别、年龄

课程信息：课程名、任课老师

成绩信息：学生成绩

14.4 E-R模型

在这里插入图片描述

14.5 关系模式

学生信息表(student)

字段	说明
stu_id	主键
no	学号
name	姓名
sex	性别：男、女
age	年龄

课程信息表(course)

字段	说明
course_id	主键
course_name	课程名
teacher_name	任课老师

成绩信息表(score)

字段	说明
score_id	主键
stu_id	学生主键
course_id	课程主键
score	分数

15. 规范化理论

非规范的关系模式或者说设计出来的数据库表，可能存在的问题：

1、数据冗余

2、更新异常

3、插入异常

4、删除异常

15.1 范式

第一范式(1NF)：

数据库表的字段是不可再分的数据项。满足此规则，就是满足了第一范式。

年级名称	同学人数
年级名称	男同学	女同学
一年级	5	50
二年级	50	5

第二范式(2NF)：

在第一范式的基础上，如果主键是组合键时，其他字段不存在部分依赖。满足此规则，就是满足了第二范式。

学号	课程号	成绩	学分
S01	C01	60	2
S02	C01	70	2
S03	C02	80	4
S04	C02	90	4

第三范式(3NF):

在第二范式的基础上，如果其他字段不存在传递性依赖。满足此规则，就是满足了第三范式。

学号	姓名	系号	系名	系位置
S01	曹操	D1	计算机系	1号楼
S02	刘备	D1	计算机系	1号楼
S03	孙权	D2	信息系	2号楼
S04	袁绍	D2	信息系	2号楼

开发设计表格，一般要满足三大范式，不满足怎么办？拆…

不满足第一范式：

年级名称	同学人数
年级名称	男同学	女同学
一年级	5	50
二年级	50	5

| 年级名称 | 男同学 | 女同学 | | :------: | :----: | :----: | | 一年级 | 5 | 50 | | 二年级 | 50 | 5 |

不满足第二范式：

学号	课程号	成绩	学分
S01	C01	60	2
S02	C01	70	2
S03	C02	80	4
S04	C02	90	4

学号	课程号	成绩
S01	C01	60
S02	C01	70
S03	C02	80
S04	C02	90

课程号	学分
C01	2
C02	4

不满足第三范式：

学号	姓名	系号	系名	系位置
S01	曹操	D1	计算机系	1号楼
S02	刘备	D1	计算机系	1号楼
S03	孙权	D2	信息系	2号楼
S04	袁绍	D2	信息系	2号楼

学号	姓名	系号
S01	曹操	D1
S02	刘备	D1
S03	孙权	D2
S04	袁绍	D2

系号	系名	系位置
D1	计算机系	1号楼
D2	信息系	2号楼

拆了后存在问题，查询的时候，多表连表查询操作复杂或查询性能差。所以也存在反范式…

15.2 反范式

允许在数据库中引入冗余数据，以提高查询性能或简化查询操作…

特点：

1、冗余数据

2、数据冗余的更新

3、查询简化

运用场景：

1、高频读取、低频更新的情况

2、复杂查询和分析需求

3、数据仓库和报表生成

4、高并发和低延迟要求

5、特定优化需求

16. 并发控制

并发产生问题：

1、丢失更新

2、不可重复度读

3、读"脏"数据
在这里插入图片描述

解决方案：采用封锁协议。

S锁：读锁，也叫共享锁。若事务T对数据对象A加上S锁，则事务T可以读取A但不能修改A。其他事务只能对数据对象A加S锁，而不能加X锁，直到事务T释放对象A上的S锁。

X锁：写锁，也叫排它锁。若事务T对数据对象A加上X锁，则其他事务不能再对A加任何锁，直到事务T释放数据对象A上的锁。

一级封锁协议：

事务T1在修改数据对象A之前必须对数据对象A加上X锁，直到事务T1结束才释放X锁。可防止丢失更新。

二级封锁协议：

一级封锁协议加上事务T2在读取数据对象A之前先对其加上S锁，读完后即可释放S锁。可防止丢失更新，还可防止读"脏"数据。

三级封锁协议：

事务T1在读取数据对象A之前先对数据对象A加上S锁，直到事务结束才释放，事务T2在执行一级封锁协议。可防止丢失更新、防止读"脏"数据、防止数据重复读。

在这里插入图片描述

17. 优化

在这里插入图片描述

17.1 SQL及索引

当MySQL性能下降时，通过开启慢查询来获得哪条SQL语句造成的响应过慢，进行分析处理。

-- 是否开启慢查询
show variables like "%slow%";-- 查询慢查询SQL状况
show status like "%slow%";-- 慢查询时间
show variables like "long_query_time";

启用慢查询日志

1、添加或修改配置项

# 编辑MySQL配置文件(通常是my.cnf或my.ini)
[mysqld]
slow_query_log = 1 # 设置为1，启用慢查询日志
slow_query_log_file = /var/log/mysql/mysql-slow.log # 指定慢查询日志文件路径
long_query_time = 2 # 设置记录为慢查询的执行时间阈值，单位是秒

2、重启MySQL服务

慢查询分析工具：

mysqldumpslow，该工具是慢查询自带的分析慢查询工具，一般只要安装了mysql，就会有该工具

# 常用示例
# 取出使用最多的10条慢查询
mysqldumpslow -s c -t 10 /var/log/mysql/mysql-slow.log# 取出查询时间最慢的3条慢查询
mysqldumpslow -s t -t 3 /var/log/mysql/mysql-slow.log# 得到按照时间排序的前10条里面含有左连接的查询语句
mysqldumpslow -s t -t 10 -g “left join” /var/log/mysql/mysql-slow.log # 按照扫描行数最多的
mysqldumpslow -s r -t 10 -g 'left join' /var/log/mysql/mysql-slow.log

注意：使用mysqldumpslow的分析结果不会显示具体完整的sql语句，只会显示sql的组成结构

pt-query-digest，是一个perl脚本，只需下载并赋权即可执行

# 可以下载到PATH任意目录下
wget http://www.percona.com/get/pt-query-digestchmod +x pt-query-digest

# 常用示例# 直接分析慢查询文件
pt-query-digest slow.log > slow_report.log# 分析最近12小时内的查询
pt-query-digest --since=12h slow.log > slow_report.log# 分析指定时间范围内的查询
pt-query-digest slow.log --since '2024-01-01 09:30:00' --until '2024-05-01 10:00:00' > slow_report.log

explain可以用来分析SQL的执行计划

explain select * from salaries where from_date = '2024-01-01';-- 以json 形式展示结果：
explain format=json select * from salaries where from_date = '2024-01-01';

索引

索引的目的在于提高查询效率，与我们查阅图书所用的目录是一个道理：先定位到章，然后定位到该章下的一个小节，然后找到页数。相似的例子还有：查字典，查火车车次，飞机航班等。

索引分类

1.普通索引index: 加速查找
2.唯一索引主键索引: primary key：加速查找+约束（不为空且唯一）唯一索引: unique：加速查找+约束 （唯一）
3.联合索引-primary key(id,name): 联合主键索引-unique(id,name): 联合唯一索引-index(id,name): 联合普通索引
4.全文索引fulltext: 用于搜索很长一篇文章的时候，效果最好。
5.空间索引spatial: 了解就好，几乎不用

索引类型

hash类型的索引：查询单条快，范围查询慢
btree类型的索引：b+树，层数越多，数据量指数级增长(innodb默认索引类型)# 不同的存储引擎支持的索引类型也不一样
InnoDB，支持事务，支持行级别锁定，支持 B-tree、Full-text等索引，不支持 Hash 索引；
MyISAM，不支持事务，支持表级别锁定，支持 B-tree、Full-text等索引，不支持 Hash 索引；

索引使用

-- 在创建表时就创建索引
create table s1(id int ,#可以在这加primary key#id int index #不可以这样加索引，因为index只是索引，没有约束一说，#不能像主键，还有唯一约束一样，在定义字段的时候加索引name char(20),age int,email varchar(30)#primary key(id) #也可以在这加index(id) #可以这样加
);-- 在创建表后再创建索引
create index name on s1(name); # 添加普通索引
create unique age on s1(age); # 添加唯一索引
alter table s1 add primary key(id); # 添加主键索引，也就是给id字段增加一个主键约束
create index name on s1(id,name); # 添加普通联合索引-- 删除索引
drop index id on s1;
drop index name on s1; # 删除普通索引
drop index age on s1; # 删除唯一索引，就和普通索引一样，不用在index前加unique来删，直接就可以删了
alter table s1 drop primary key; # 删除主键(因为它添加的时候是按照alter来增加的，那么我们也用alter来删)

如何选择合适的列建立索引

1、在where从句，group by从句，order by从句，on从句中出现的列

2、索引字段越小越好

3、离散力度大的列放到联合索引的前面

17.2 数据库结构优化

选择合适的数据类型

1、使用可以存下业务要求的最小的数据类型

2、使用简单的数据类型。int要比varchar类型在MySQL处理上简单

3、尽可能的使用not null定义字段

4、尽量少用text类型，非用不可时最好考虑分表

表的垂直拆分

1、把不常用的字段单独存放到一个表中

2、把大字段独立存放到一个表中

3、把经常一起使用的字段放到一起

表的水平拆分

1、解决单表数据量过大的问题，单表数据达到上万条

2、水平拆分方法：

进行hash运算，如果要拆分成5个表，则使用mod(id, number)取出0-4值

假如是订单表进行水平拆分，该id应该采用用户id来mod比较合适，这样相同用户的订单会存在同一张表里

针对不同的hash把数据存到不同的表中

前台考虑性能及个人，后台考虑统计及报表业务。前台可以采用拆分后的表，后台采用汇总后的表

17.3 系统配置优化

17.3.1 操作系统配置优化

网络方面的配置

要修改/etc/sysctl.conf文件

#增加tcp支持的队列数
net.ipv4.tcp_max_syn_backlog=65535
#减少断开连接时,资源回收
net.ipv4.tcp_max_tw_buckets=8000
net.ipv4.tcp_tw_reuse=1
net.ipv4.tcp_tw_recycle=1
net.ipv4.tcp_fin_timeout=10

打开文件数的限制

要修改/etc/security/limits.conf文件

*soft nofile 65535
*hard nofile 65535

除此之外最好在MySQL服务器上关闭iptables，selinux等防火墙软件

17.3.2 MySQL配置文件

查找配置文件

/etc/my.cnf
/etc/mysql/my.cnf
window(C:/windows/my.ini)

# 可以通过命令查找
mysqld --verbose --help | grep -A 1 'Default options'

注意：如果多个位置存在配置文件，则后面的同名配置项会覆盖前面的

常用参数

innodb_buffer_pool_size

配置innodb的缓冲池innodb_buffer_pool_size >= Total MB(引擎为Innodb的所有表中的数据和索引的总和)

select engine,round(sum(data_length+index_length)/1024/1024,1) as 'Total MB' from information_schema.tables where table_schema not in('information_schema','performance_schema') group by engine;

如果数据库中只有innodb表,则推荐配置量为总内存的75%

innodb_buffer_pool_instances

可以控制缓冲池的个数,默认情况下只有一个缓冲池

innodb_log_buffer_size

innode log 缓冲的大小，由于日志最长每秒钟就会刷新，所以一般不用太大

innodb_flush_log_at_trx_commit

对innodb的IO效率影响很大。值有0，1，2
默认值为1，一般建议为2，但如果数据安全性要求比较高则使用默认值1

innodb_read_io_threads和innodb_write_io_threads

决定innodb读写的IO进程数，默认为4

innodb_file_per_table

控制innodb每一个表使用独立的表空间，默认是OFF，也就是所有表都会简历在共享表空间中，建议设置成ON

innode_stats_on_metadata

决定了MySQL在什么情况下会刷新Innodb表的统计信息。建议设置成OFF

Linux配置文件一般在/etc/my.cnf或者/etc/mysql/my.cnf

windows配置文件一般在C:/windows/my.ini

如果存在多个位置存在配置文件，则后面的会覆盖前面的

第三方配置工具使用

https://tools.percona.com/wizard

17.4 服务器硬件优化

优化MySQL服务器硬件通常涉及以下几个方面：

更快的处理器：使用更快的CPU，如最新一代的Intel或AMD处理器。
更多的内存：增加服务器的RAM以加快磁盘访问速度。
更快的存储：使用SSD（固态硬盘）替代HDD（机械硬盘）。
更多的存储空间：扩展存储容量以适应数据增长。
网络适配器：对于高速网络，使用10GbE或更高速率的网卡。
电源：确保服务器供电足够，高效率的电源设备能提供稳定的电力。

用于检查服务器硬件规格

# 检查CPU信息
cat /proc/cpuinfo | grep "model name" | uniq# 检查内存使用情况
free -h# 检查存储设备类型和使用情况
lsblk
df -h# 检查网络适配器
lspci | grep -i ethernet