一:基础知识
我们知道MySQL是多线程并发处理任务的。MySQL使用了MVCC来实现事务并发的无锁机制。
而且我们还需要知道MySQL的四种隔离级别:读未提交,读已提交(RC),可重复读(RR),串行化。前三种分别对应:脏读,不可重复读,幻读的问题。具体可以看我之前的文章。
我们还需要知道一个叫:undolog的文件。
undolog:通过MVCC记录事务DML操作提交后产生的行数据版本信息。记录DML操作步骤,用于回滚业务,通过逆运算回滚。
redolog:事务提交后,记录DML操作对应物理页修改的内容。
二:MVCC
MVCC基于以下三种结构实现:
1:隐藏列:隐藏列有四个数据:id,数据,事务id,指针。
2:undolog:存储修改数据后的隐藏列。
3:read_view:包含当前事务id,并发事务列表,以及下一个未开始的事务id。
下面举个栗子:
我们先后开启两个事务,第一个事务修改age这个变量,在修改之前,这个age就已经被修改过两次了,因此在undolog中含有之前的一些数据,并且undolog中存储的数据是以隐藏列的方式进行存储的。当事务一修改之后,我们开启事务二,进行查找这个age操作。此时我们事务二会生成一个readview。
在这个readview中,我们含有一些数据:当前的事务id,事务id列表,下一个事务id。当我们获得这个readview后,我们会使用这个在undolog中进行查找。查找分为三种判断:首先是否是自己这个事务修改的,是的话,直接拿取,不是那就沿着指针向下查找。其次如果这个事务id,大于我们最大的事务id,那我们也直接跳过,因为他是在我们开启这个事务之后才开启的。最后我们判断是否小于并发中的最小事务id,也就是,我们开启事务之前,已经修改好的数据,那我们就可以使用。
下面是一个图解,比较好理解。
三:RC和RR的区别
他俩的区别就是:不可重复读的一个问题。在RR中解决了这个问题。其实这个区别也比较简单:RC中是每一次select都会产生一个新的readview,而RR是事务开启后产生一个readview,然后用到事务提交。
这样我们可以拿上面那个图在进行一下对比。比如RR其实就是上面的那幅图,即使在4的位置又进行了一次查询,那还是使用右边这个readview,没有任何变化,因此读取到的数据是一样的,那就解决了不可重复读的问题了。
但是我们把上面那幅图给换成RC的隔离级别的话,那在4的位置会产生一个新的readview,这个时候,我们看到事务一已经提交了,因此我们这个readview会改变,并发事务列表中就只剩下自己的20了,这个时候,我们通过readview读取undolog,会发现第一条最新的数据小于我们最小的事务id,因此这条数据就可以拿取到,所以我们在一个事务中会读取到不同的数据,这就是不可重复读。
对于读未提交来说,他是一个既不使用锁,也不使用MVCC的一个隔离级别
读已提交:是每一次查询就建立一个readview。
可重复读:事务开启后,创建一个readview,一直用到事务提交后。
串行化:全部加锁。
0voice · GitHub