【MVCC快照如何实现】

ops/2025/3/31 10:25:49/

MVCC(多版本并发控制)快照的实现原理

MVCC(Multi-Version Concurrency Control)是现代数据库实现事务隔离级别的核心技术,它通过数据多版本和快照机制来实现高效的并发控制。下面我将详细解析MVCC快照的实现机制。

一、MVCC核心组件

1. 版本链结构

MVCC通过以下隐藏字段维护数据版本:

  • DB_TRX_ID(6字节):记录创建或最后一次修改该行的事务ID
  • DB_ROLL_PTR(7字节):回滚指针,指向undo log记录
  • DB_ROW_ID(6字节):隐含自增ID(无主键时生成)
  • DELETE BIT(1位):标记该行是否被删除

2. undo log(回滚日志)

  • 存储数据修改前的状态
  • 组成版本链的关键结构
  • 类型:
    • INSERT undo log:事务回滚时需要删除
    • UPDATE undo log:事务回滚时需要恢复旧值

3. ReadView(读视图)

决定事务能看到哪些版本的数据,包含:

  • m_ids:生成ReadView时活跃的事务ID列表
  • min_trx_id:活跃事务中的最小ID
  • max_trx_id:系统将分配的下一个事务ID
  • creator_trx_id:创建该ReadView的事务ID

二、MVCC快照的生成过程

1. 事务启动时

  • 分配唯一事务ID(单调递增)
  • 根据隔离级别决定是否立即创建ReadView:
    • 读已提交:每条语句执行前创建新ReadView
    • 可重复读:事务第一次读操作时创建ReadView

2. 数据读取时的可见性判断

def is_visible(trx_id, read_view):if trx_id < read_view.min_trx_id:return True  # 已提交的旧事务elif trx_id == read_view.creator_trx_id:return True  # 自身修改可见elif trx_id in read_view.m_ids:return False # 活跃事务不可见else:return True  # 已提交的新事务

3. 版本链遍历过程

  1. 从最新数据行开始检查
  2. 通过DB_ROLL_PTR找到undo log中的旧版本
  3. 对每个版本应用可见性判断
  4. 返回第一个可见的版本

三、不同隔离级别的实现差异

1. 读已提交(RC)

  • 每次执行SELECT都新建ReadView
  • 能看到其他事务已提交的修改
  • 可能产生不可重复读现象

2. 可重复读(RR)

  • 事务第一次读操作时创建ReadView
  • 整个事务期间复用同一个ReadView
  • 保证同一事务内读取一致性
  • MySQL通过间隙锁避免幻读

四、MVCC的写入流程

1. 更新操作

  1. 对原数据行打删除标记
  2. 插入新行并更新DB_TRX_ID
  3. 原行DB_ROLL_PTR指向undo log

2. 删除操作

  1. 设置行的DELETE BIT为1
  2. 记录undo log

3. 插入操作

  1. 分配新行并设置DB_TRX_ID为当前事务ID

五、MVCC的清理机制

1. purge线程

  • 定期清理不再需要的undo log
  • 清理条件:
    • 对应事务已提交
    • 没有活跃事务需要访问该版本

2. 版本链修剪

  • 当某版本对所有活跃事务都不可见时
  • 可被安全回收

六、各数据库实现对比

特性MySQL(InnoDB)PostgreSQLOracle
版本存储主表+undo log主表+TOAST(大对象存储)回滚段
快照生成时机语句/事务级别事务级别SCN(System Change Number)
清理机制purge线程VACUUM进程SMON后台进程

七、MVCC的优势与局限

优势:

  • 读不阻塞写,写不阻塞读
  • 避免大部分锁争用
  • 实现非锁定一致性读

局限:

  • 需要维护多版本数据,增加存储开销
  • 长期事务可能导致版本堆积
  • 需要复杂的垃圾回收机制

MVCC快照的实现是现代数据库高并发能力的基石,理解其原理有助于优化事务设计和排查并发问题。


http://www.ppmy.cn/ops/170438.html

相关文章

android|生成二维码qrcode(android)

1.build.gradle implementation com.google.zxing:core:3.4.1引入zxing库 只是生成的话引入core库就可以了 2.封装方法 import android.graphics.Bitmap; import android.graphics.Color;import com.google.zxing.BarcodeFormat; import com.google.zxing.EncodeHintType; imp…

(UI自动化测试web端)第二篇:元素定位的方法_css定位之ID选择器

看代码里的【find_element_by_css_selector( )】( )里的表达式怎么写&#xff1f; 文章介绍了第一种写法id选择器&#xff0c;其实XPath元素定位要比CSS好用&#xff0c;原因是CSS无法使用下标&#xff08;工作当中也是常用的xpath&#xff09;&#xff0c;但CSS定位速度比XPat…

服务器数据恢复—Raid5热备盘同步中断的数据恢复案例

服务器数据恢复环境&#xff1a; 某公司一台存储上有一组由15块硬盘组建的raid5阵列。raid5阵列上层是一个xfs裸分区&#xff0c;起始位置是0扇区。 服务器故障&#xff1a; raid5阵列中有一块硬盘出现故障掉线&#xff0c;热备盘自动上线同步数据&#xff0c;数据同步还没有完…

macbook电脑如何清理键盘防止误触

M1芯片的MacBook电脑关机后按任意键开机&#xff0c;是苹果的功能设计。这样设计的目的是为了方便用户&#xff0c;让用户在想要使用电脑时能快速开机。但是清理电脑键盘的时候却成为了一种苦恼 以下是一些清理 MacBook 键盘防止误触的方法&#xff1a; 使用工具锁定键盘 Cle…

Oracle补丁自动化安装步骤

1.3.2 补丁安装说明 1. 回滚冲突补丁&#xff1a; 在应用补丁之前&#xff0c;你必须回滚任何在冲突检测中发现的冲突补丁。否则&#xff0c;执行 opatch apply 命令时&#xff0c;补丁安装可能会再次报告冲突。 2. 安装补丁的环境要求&#xff1a; Data Guard 物理备用数据…

【js逆向入门】图灵爬虫练习平台 第九题

地址&#xff1a;aHR0cHM6Ly9zdHUudHVsaW5ncHl0b24uY24vcHJvYmxlbS1kZXRhaWwvOS8 f12进入了debugger&#xff0c;右击选择一律不在此处暂停&#xff0c; 点击继续执行 查看请求信息 查看载荷&#xff0c;2个加密参数&#xff0c;m和tt 查看启动器&#xff0c;打上断点 进来 往…

MySQL原理:逻辑架构

目的&#xff1a;了解 SQL执行流程 以及 MySQL 内部架构&#xff0c;每个零件具体负责做什么 理解整体架构分别有什么模块每个模块具体做什么 目录 1 服务器处理客户端请求 1.1 MySQL 服务器端逻辑架构说明 2 Connectors 3 第一层&#xff1a;连接层 3.1 数据库连接池(Conn…

python之网络编程

网络编程 互联网时代&#xff0c;现在基本上所有的程序都是网络程序&#xff0c;很少有单机版 的程序了。 网络编程就是如何在程序中实现两台计算机的通信。 Python语言中&#xff0c;提供了大量的内置模块和第三方模块用于支持各种 网络访问&#xff0c;而且Python语言在网络…