MySQL基础（三）-学习笔记

一.innodb引擎：

1). 表空间：表空间是InnoDB存储引擎逻辑结构的最高层，启用了参数 innodb_file_per_table(在 8.0版本中默认开启) ，则每张表都会有一个表空间（xxx.ibd），一个mysql实例可以对应多个表空间，用于存储记录、索引等数据。

2). 段：分为数据段（Leaf node segment）、索引段（Non-leaf node segment）、回滚段（Rollback segment），InnoDB是索引组织表，数据段就是B+树的叶子节点，索引段即为B+树的非叶子节点。段用来管理多个Extent（区）。

3). 区：表空间的单元结构，每个区的大小为1M。默认情况下， InnoDB存储引擎页大小为16K，即一个区中一共有64个连续的页。

4). 页：是InnoDB 存储引擎磁盘管理的最小单元，每个页的大小默认为 16KB。为了保证页的连续性， InnoDB 存储引擎每次从磁盘申请 4-5 个区。

5). 行：InnoDB 存储引擎数据是按行进行存放的。

默认有两个隐藏字段： Trx_id：每次对某条记录进行改动时，都会把对应的事务id赋值给trx_id隐藏列。
Roll_pointer：每次对某条引记录进行改动时，都会把旧的版本写入到undo日志中，然后这个隐藏列就相当于一个指针，可以通过它来找到该记录修改前的信息。

架构：

内存结构：

Buffer Pool：缓冲池中缓存了索引页和数据页，还包含了undo页、插入缓存、自适应哈希索引以及 InnoDB的锁信息等；缓冲池以Page页为单位，底层采用链表数据结构管理Page；free page：空闲page，未被使用。 clean page：被使用page，数据没有被修改过。 dirty page：脏页，被使用page，数据被修改过，也中数据与磁盘的数据产生了不一致。

Change Buffer：更改缓冲区（针对于二级索引页），在执行DML语句时，如果这些数据Page 没有在Buffer Pool中，不会直接操作磁盘，而会将数据变更存在更改缓冲区 Change Buffer 中，在未来数据被读取时，再将数据合并恢复到Buffer Pool中，再将合并后的数据刷新到磁盘中，减少io

Adaptive Hash Index：优化对Buffer Pool数据的查询，因为hash索引一般只需要一次IO即可，而B+树，可能需要几次匹配

Log Buffer：日志缓冲区，用来保存要写入到磁盘中的log日志数据（redo log 、undo log），默认大小为 16MB，日志缓冲区的日志会定期刷新到磁盘中。

磁盘结构：System Tablespace是更改缓冲区的存储区域；File-Per-Table Tablespace；General Tablespaces；Undo Tablespaces-用于存储 undo log日志；Temporary Tablespaces-存储用户创建的临时表等数据；Doublewrite Buffer Files；Redo Log

后台线程：

Master Thread ：

核心后台线程，负责调度其他线程，还负责将缓冲池中的数据异步刷新到磁盘中, 保持数据的一致性，还包括脏页的刷新、合并插入缓存、undo页的回收

IO Thread：

Purge Thread：用于回收事务已经提交了的undo log

Page Cleaner Thread：协助 Master Thread 刷新脏页到磁盘的线程

二.事务原理：

事务原子性，一致性，持久性的保证：redo log， undo log ；隔离性的保证：锁和mvcc

redo log：记录的是事务提交时数据页的物理修改，是用来实现事务的持久性；该日志文件由两部分组成：重做日志缓冲（redo log buffer）以及重做日志文件（redo log file）,前者是在内存中，后者在磁盘中。当事务提交之后会把所有修改信息都存到该日志文件中, 用于在刷新脏页到磁盘,发生错误时, 进行数据恢复使用；事务提交立马将redo log刷新到磁盘WAL（Write-Ahead Logging），因为操作数据一般都是随机读写磁盘的，而不是顺序读写磁盘。而redo log在往磁盘文件中写入数据，由于是日志文件，所以都是顺序写的。顺序写的效率，要远大于随机写。当脏页成功刷新至磁盘则可以删除。

undo：回滚日志，用于记录数据被修改前的信息 , 作用包含两个 : 提供回滚(保证事务的原子性) 和 MVCC(多版本并发控制) 。undo log是逻辑日志。delete一条记录时，undo log中会记录一条对应的insert记录，反之亦然，当update一条记录时，它记录一条对应相反的 update记录。当执行rollback时，就可以从undo log中的逻辑记录读取到相应的内容并进行回滚。

Undo log销毁：undo log在事务执行时产生，事务提交时，并不会立即删除undo log，因为日志可能还用于MVCC。

Undo log存储：undo log采用段的方式进行管理和记录，存放在回滚段中

mvcc（多版本并发控制）：

基本概念：

当前读：读取的是记录的最新版本，读取时还要保证其他并发事务不能修改当前记录，会对读取的记录进行加锁。如：select ... lock in share mode(共享锁)，select ... for update、update、insert、delete(排他锁)都是一种当前读。

快照读：简单的select（不加锁）就是快照读，快照读，读取的是记录数据的可见版本，有可能是历史数据，不加锁，是非阻塞读。