深入解析MVCC中Undo Log版本底层存储读取逻辑

embedded/2024/12/29 2:07:05/

一、引言

多版本并发控制(MVCC,Multi-Version Concurrency Control)是一种广泛应用于关系数据库管理系统中的并发控制技术。它通过保存数据的历史版本,使得在事务并发执行时,每个事务都能看到数据的一致性视图。在MVCC中,Undo Log起着至关重要的作用,本文将详细阐述MVCC的版本控制逻辑以及Undo Log在其中的底层存储读取机制。

二、MVCC版本控制逻辑

  1. 版本生成

在MVCC中,每当数据发生修改时,系统会为修改前的数据生成一个版本。这个版本包含了数据的前映像,即修改前的值。版本号通常是一个递增的序列,用于标识不同版本的数据。

  1. 事务可见性

MVCC通过事务的可见性来判断数据版本是否对当前事务可见。事务的可见性规则如下:

(1)事务读取数据时,只能看到小于等于事务开始时的版本号的数据; (2)事务修改数据时,会生成一个新的版本,版本号大于当前事务的版本号; (3)事务提交后,修改后的数据版本才会对其他事务可见。

  1. 版本链

为了实现数据的多个版本,MVCC采用版本链来组织数据。版本链由多个版本组成,每个版本包含以下信息:

(1)版本号; (2)数据前映像; (3)指向下一个版本的指针。

三、Undo Log底层存储读取逻辑

  1. Undo Log简介

Undo Log是MVCC实现的关键部分,用于在事务回滚时撤销已提交的操作。在数据修改过程中,Undo Log记录了数据的前映像,以便在需要时恢复到修改前的状态。

  1. Undo Log存储结构

Undo Log通常采用以下存储结构:

(1)事务ID:标识修改数据的事务; (2)操作类型:如插入、更新、删除等; (3)数据前映像:修改前的数据值; (4)指向下一个Undo Log的指针。

  1. Undo Log读取逻辑

(1)当事务需要读取数据时,首先从版本链中找到符合可见性规则的最新版本; (2)如果找到的版本是由当前事务修改的,则直接读取该版本的数据; (3)如果找到的版本是由其他事务修改的,则需要根据Undo Log回溯到符合可见性规则的版本; (4)从Undo Log中读取数据前映像,恢复到修改前的状态; (5)返回恢复后的数据给事务。

假设我们有一个简单的银行账户表,其中包含账户ID和余额两个字段。我们将通过一个事务更新账户余额,并在这个过程中展示MVCC和Undo Log是如何工作的。

初始状态

账户表:

账户ID | 余额
-------|------
1      | 1000

事务开始

假设事务T1开始,并打算将账户1的余额增加200。

版本生成

在MVCC中,当事务T1尝试修改余额时,系统会为当前余额生成一个版本(版本号V1),并记录Undo Log。

账户表(版本链):

账户ID | 余额 | 版本号 | Undo Log
-------|------|--------|---------
1      | 1000 | V1     | 无

Undo Log(存储结构):

事务ID | 操作类型 | 数据前映像 | 指向下一个Undo Log的指针
-------|---------|-----------|---------------------
T1     | 更新    | 1000      | NULL

事务修改数据

事务T1将余额从1000增加到1200,并生成新版本(版本号V2)。

账户表(版本链):

账户ID | 余额 | 版本号 | Undo Log
-------|------|--------|---------
1      | 1200 | V2     | 指向T1的Undo Log

Undo Log(存储结构):

事务ID | 操作类型 | 数据前映像 | 指向下一个Undo Log的指针
-------|---------|-----------|---------------------
T1     | 更新    | 1000      | NULL

事务读取数据

现在,假设有另一个事务T2开始,并尝试读取账户1的余额。

  1. 事务T2查找版本链,找到最新版本V2。
  2. 由于版本V2是由事务T1创建的,并且T1尚未提交,事务T2需要根据MVCC的规则找到自己可见的版本。
  3. 事务T2根据Undo Log回溯到版本V1,因为V1是T2开始时存在的版本。

Undo Log读取逻辑

事务T2按照以下步骤读取数据:

  1. 查找版本链,发现最新版本是V2。
  2. 检查版本V2的事务ID,发现是T1。
  3. 由于T1尚未提交,T2不能读取V2。
  4. 查找T1的Undo Log,读取数据前映像1000。
  5. 使用Undo Log中的前映像恢复数据到版本V1的状态。

事务T2读取结果

事务T2读取到的账户余额是1000,因为它只能看到自己开始时存在的数据版本。

事务提交

如果事务T1提交,那么版本V2将对所有新开始的事务可见。此时,如果新的事务T3开始并读取账户余额,它将直接看到版本V2的数据1200。

通过这个例子,我们可以看到MVCC和Undo Log如何协同工作,以确保事务的隔离性和数据的一致性。Undo Log在这里起到了至关重要的作用,它记录了数据修改的历史,使得事务能够在需要时回滚到之前的状态。

四、总结

本文详细阐述了MVCC中Undo Log版本底层存储读取逻辑。通过版本链和Undo Log,MVCC实现了数据的多版本控制,保证了事务的隔离性和一致性。在实际应用中,了解MVCC的底层原理对于优化数据库性能和解决并发问题具有重要意义。


http://www.ppmy.cn/embedded/149614.html

相关文章

Boost之log日志使用

不讲理论,直接上在程序中可用代码: 一、引入Boost模块 开发环境:Visual Studio 2017 Boost库版本:1.68.0 安装方式:Nuget 安装命令: #只安装下面几个即可 Install-package boost -version 1.68.0 Install…

vue2使用pdfjs-dist和jsPDF生成pdf文件

vue2使用pdfjs-dist和jsPDF生成pdf文件 1、安装依赖 npm install pdfjs-dist2.6.3472、引入依赖 import { jsPDF } from jspdf// 使用require方式导入pdfjs-dist v2.5.207,高版本报错(import导入会报错:GlobalWorkerOptions undefined&…

java高频面试之SE-04

面向对象和面向过程的区别? 面向对象和面向过程是两种不同的编程范式,它们在设计和组织代码方面存在显著的区别。 当然可以,下面用通俗易懂的例子来说明面向对象和面向过程的区别。 面向过程 例子:做早餐 步骤: 准…

华为IoTDA 智慧路灯设备SDK与平台通信C 流程bug解决

华为官方教程网址:智慧路灯设备SDK与平台通信(C)_设备接入 IoTDA_华为云 “建立连接”部分前完全正确。 问题描述: 在连接时,填写了正确的“设备id”和“密码”依旧报错: connect failed: messageld 0,cod…

【人工智能学习】线性回归模型使用Python实现简单的线性回归

前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默, 忍不住分享一下给大家。点击跳转到网站 学习总结 1、掌握 JAVA入门到进阶知识(持续写作中……) 2、学会Oracle数据库入门到入土用法(创作中……) 3、手把…

STM32开发笔记123:使用STM32CubeProgrammer下载程序

文章目录 前言一、STM32CubeProgrammer二、一键下载电路三、STM32CubeProgrammer的使用1、配置2、连接3、擦除芯片4、下载程序(1)在STM32CubeIDE中编译出HEX文件(2)打开文件并下载(3)下载成功后,显示如下信息前言 本文介绍使用STM32CubeProgrammer下载程序到STM32微控制…

[阅读笔记]GPU-Util指标的重新理解

主要来自于文章 搞懂 NVIDIA GPU 性能指标 很容易弄混的一个概念: Utilization vs Saturation 这篇文章简单的来说,就是纠正我们对nvidia-smi中的GPU-Util这一个指标的直观理解。 在直观的理解中,这个指标应该表示GPU计算资源的饱和度&…

Linux增加回收站功能

功能简介 rm命令是非常危险的命令,为了防止用户误删文件,所以我们在执行rm命令时将文件添加到回收站,防止误删文件。 相关环境变量 名称描述TRASH_DIR 回收站目录,默认为/Recycle_Bin 文件命名规则 文件名生成格式为 原始文件名…