MySQL高级第十五篇:MVCC多版本并发控制原理剖析

news/2024/11/23 20:51:22/

MySQL高级第十五篇:MVCC多版本并发控制原理剖析

  • 一、什么是MVCC?
  • 二、快照读与当前读?
    • 1. 快照读
    • 2. 当前读
  • 三、MVCC实现原理(ReadView)
    • 1. 隐藏字段
    • 2. Read View
    • 3. 思路设计
    • 4. ReadView使用规则
    • 5. MVCC整体操作流程
  • 四、总结

一、什么是MVCC?

  • MVCC(Multiversion Concurrency Control)多版本并发控制。
  • 就是通过数据行的多个版本管理来实现数据库的并发控制。
  • 这项技术使得在InnoDB的事务隔离级别下执行一致性读操作有了保证。
  • 换句话说,就是为了查询一些正在被另一个事务更新的行,并且可以看到它们被更新之前的值,这样在做查询的时候就不用等待另一个事务释放锁。

二、快照读与当前读?

  • MVCC在MySQL lnnoDB中的实现主要是为了提高数据库并发性能,用更好的方式去处理读–写冲突,做到即使有读写冲突时,也能做到不加锁,非阻塞并发读。
  • 而这个读指的就是快照读,而非当前读。当前读实际上是一种加锁的操作,是悲观锁的实现,而MVCC本质是采用乐观锁思想的一种方式。

1. 快照读

  • 快照读又叫一致性读,读取的是快照数据。
  • 不加锁的简单的SELECT都属于快照读,即不加锁的非阻塞读
  • 之所以出现快照读,是基于提高并发性能的考虑,快照读的实现是基于MVCC,它在很多情况下,避免了加
    锁操作,降低了开销。
  • 既然是基于多版本,那么快照读可能读到的并不一定是数据的最新版本,而有可能是之前的历史版本。
  • 快照读的前提是隔离级别不是串行级别,串行级别下的快照读会退化成当前读。

2. 当前读

  • 当前读读取的是记录的最新版本,最新数据,读取时还要保证其他并发事务不能修改。
  • 当前记录会对读取的记录进行加锁。加锁的SELECT,或者对数据进行增删改都会进行当前读。

在以前学习隔离级别时,对于SQL标准中,可重复读 解决了脏读,不可重复读的问题,没有解决幻读。但是在MySQL中,因为MVCC,读的时候其实读的是快照,所以也不会出现幻读。

三、MVCC实现原理(ReadView)

MVCC 的实现依赖于:隐藏字段,Undo Log、Read View

1. 隐藏字段

  • 对于使用InnoDB存储引擎的表来说,它的聚簇索引记录中都包含两个必要的隐藏列。
    • trx_id:每次一个事务对某条聚簇索引记录进行改动时,都会把该事务的事务id赋值给trx_id隐藏列。
    • roll_pointer:每次对某条聚簇索引记录进行改动时,都会把旧的版本写入到undo日志中,然后这个隐藏
      列就相当于一个指针,可以通过它来找到该记录修改前的信息。(每次对记录进行改动,都会记录一条undo日志,每条undo日志也都有一个roll_pointer属性,可以将这些undo日志都连起来,串成一个链表,就是版本链)
      在这里插入图片描述
      insert undo 只在事物回滚时起作用,当事物提交后,该类型的undo日志就没有用了,就会被系统回收。

2. Read View

在MVCC机制中,多个事务对同一个行记录进行更新会产生多个历史快照,这些历史快照保存在Undo Log里。如果一个事务想要查询这个行记录,需要读取哪个版本的行记录,就需要用到ReadView了,它帮我们解决了行的可见性问题。

ReadView就是一个事务在使用MVCC机制进行快照读操作时产生的读视图。当事务启动时,会生成数据库系统当前的一个快照,InnoDB为每个事务构造了一个数组,用来记录并维护系统当前活跃事务的ID(“活跃”指的就是,启动了但还没提交)。

3. 思路设计

使用 READ UNCOMMITTED 隔离级别的事务,由于可以读到未提交事务修改过的记录,所以直接读取记录的最新版本就好了。

使用 SERIALIZABLE 隔离级别的事务,InnoDB规定使用加锁的方式来访问记录。

所以,以上两个隔离级别READ UNCOMMITTED、SERIALIZABLE是用不着MVCC的

使用 READ COMMITTED 和 REPEATABLE READ 隔离级别的事务,都必须保证读到已经提交了的事务修改过的记录,他俩就用到了MVCC机制。

假如另一个事务已经修改了记录但是尚未提交,是不能直接读取最新版本的记录的,核心问题就是需要判断
一下版本链中的哪个版本是当前事务可见的,这是ReadView要解决的主要问题。

  • ReadView中主要的参数:
    • creator_trx_id:创建这个ReadView的事物ID
    • trx_ids:创建ReadView时当前系统的活跃的读写事物列表
    • up_limit_id:活跃事物中最小的ID
    • low_limit_id:已提交事物最大的事物ID(1,2,3事物,1、2未提交3已提交,最大事物ID为3+1=4)

4. ReadView使用规则

  • 如果被访问版本的trx_id属性值与ReadView中的creator_trx_id值相同,意味着当前事务在访问它自己修改
    过的记录,所以该版本可以被当前事务访问。
  • 如果被访问版本的trx_id属性值小于ReadView中的up_limit_id值,表明生成该版本的事务在当前事务生成
    ReadView前已经提交,所以该版本可以被当前事务访问。
  • 如果被访问版本的trx_id属性值大于或等于ReadView中的low_limit_id值,表明生成该版本的事务在当前事
    务生成ReadView后才开启,所以该版本不可以被当前事务访问。
  • 如果被访问版本的trx_id属性值在ReadView的up_limit_id和low_limit_id之间,那就需要判断一下trx_id
    属性值是不是在trx_ids列表中。
    • 如果在,说明创建ReadView时生成该版本的事务还是活跃的,该版本不可以被访问。
    • 如果不在,说明创建ReadView时生成该版本的事务已经被提交,该版本可以被访问。

5. MVCC整体操作流程

比如现在执行一条查询语句:

  • 1.首先获取事务自己的版本号,也就是事务ID;
  • 2.获取ReadView;
  • 3.查询得到的数据,然后与ReadView
  • 4.中的事务版本号进行比较;
  • 5.如果不符合ReadView规则,就需要从Undo Log中获取历史快照(顺着版本链向下找,如果直到最后一个版本还不可见的话,就意味着这条记录对该事物完全不可见,查询结果就不包含该记录);
  • 6.最后返回符合规则的数据。

隔离级别为读已提交时,一个事物每次select都会重新获取一次ReadView
隔离级别为可重复读时,一个事物只在第一次select时获取一次ReadView

四、总结

  • 本篇介绍了MVCC在READ COMMITTD、REPEATABLE READ这两种隔离级别的事务在执行快照读操作时访问记录的版本链的过程。这样使不同事务的读–写、写–读操作并发执行,从而提升系统性能。
  • 核心点在于ReadView的原理,READ COMMITTD、REPEATABLE READ这两个隔离级别的一个很大不同就是生成ReadView的时机不同:
    • READ COMMITTD在每一次进行普通SELECT操作前都会生成一个ReadView
    • REPEATABLE READ只在第一次进行普通SELECT操作前生成一个ReadView,之后的查询操作都重复使用这个ReadView就好了。
  • 通过MVCC我们可以解决:
    • 1.读写之间阻塞的问题。通过MVCC可以让读写互相不阻塞,即读不阻塞写,写不阻塞读,这样就可以提升事务并发处理能力。
    • 2.降低了死锁的概率。这是因为MVCC采用了乐观锁的方式,读取数据时并不需要加锁,对于写操作,也只锁定必要的行。
    • 3.解决快照读的问题。当我们查询数据库在某个时间点的快照时,只能看到这个时间点之前事务提交更新的结果,而不能看到这个时间点之后事务提交的更新结果。

http://www.ppmy.cn/news/53558.html

相关文章

5.1劳动节,致敬最可爱的人!Cocos社区杰出贡献者出炉

Cocos 引擎的生态建设与繁荣,离不开社区开发者的辛勤付出。 2022.5 ~ 2023.5 年度期间,有这样一批 Cocos 社区开发者,他们使用 Cocos Creaor 引擎创作内容与产品、分享技术和经验,为 Cocos 社区默默贡献自己的一份力量&#xff0c…

软件杯龙源风电赛题培训!千万分钟数据和全流程基线等你来战

‍‍ “中国软件杯”大学生软件设计大赛是一项面向中国在校学生的公益性赛事,大赛由国家工业和信息化部、教育部、江苏省人民政府共同主办,是全国软件行业规格最高、最具影响力的国家级一类赛事。其中,作为重点赛题的龙源风电赛,上…

JavaWeb02(Servlet页面跳转方式表单提交方式)

目录 一.servlet 1.1 什么是servlet? 1.2 实现接口,初始代码 1.3 学会配置和映射 1.4 掌握servlet的生命周期 生命周期的各个阶段 1.5 获取servlet初始化参数和上下文参数 1.5.1 初始代码 推荐使用 1.5.2 初始化参数 1.5.3 上下文参数 1.6 servlet应用:处理用户登…

终于把 vue-router 运行原理讲明白了(二)!!!

一、vue-router路由变化侦测 1.1 上一遍文章中,介绍了vue-router 的install 函数的内部实现,知道了能在this中访问$router 和视图更新的机制,文章链接终于把 vue-router 运行原理讲明白了(一)!&#xff01…

线程池的简单实现

文章目录 一:线程池二:使用场景三:线程池示例与代码 一:线程池 一种线程使用模式。线程过多会带来调度开销,进而影响缓存局部性和整体性能。而线程池维护着多个线程,等待着监督管理者分配可并发执行的任务…

从Redis到KeyDB:实现高可用和高可扩展性的转变

文章目录 从Redis到KeyDB:实现高可用和高可扩展性的转变特点**[线程模型]( )****[链接管理]( )****[锁机制]( )****[Active-Replica]( )** 结语 从Redis到KeyDB:实现高可用和高可扩展性的转变 今天给大家介绍的是KeyDB,KeyDB项目是从redis f…

Elasticsearch的扩展

文章目录 一、Elasticsearch的扩展1.1 数据聚合1.1.1 聚合的种类1.1.2 Elasticsearch实现聚合1.1.3 RestClient实现聚合 1.2 自动补全1.2.1 安装平均分词器 1.2.2 Completion Suggester1.3 数据同步1.3.1 什么是数据同步,为什么要实现数据同步1.3.2 使用MQ队列实现数…

ModStartBlog v7.2.0 暗黑模式,超级搜索,富文本升级

ModStart 是一个基于 Laravel 模块化极速开发框架。模块市场拥有丰富的功能应用,支持后台一键快速安装,让开发者能快的实现业务功能开发。 系统完全开源,基于 Apache 2.0 开源协议。 功能特性 丰富的模块市场,后台一键快速安装会…