参考链接
https://xiaolincoding.com/mysql/transaction/mvcc.html#%E4%BA%8B%E5%8A%A1%E7%9A%84%E9%9A%94%E7%A6%BB%E7%BA%A7%E5%88%AB%E6%9C%89%E5%93%AA%E4%BA%9B
事务特性(ACID)
-
原子性(Atomicity): 事务是原子的,意味着事务中的所有操作要么全部成功执行,要么全部失败回滚。如果事务中的任何一个操作失败,整个事务将被回滚到初始状态,不会产生部分提交的结果。
-
一致性(Consistency): 事务的执行将使数据库从一个一致性状态转换到另一个一致性状态。这意味着事务执行过程中,数据库中的数据约束、关系和规则将得到维护和保持,保证数据库的完整性。
-
隔离性(Isolation): 数据库允许 多个并发事务同时对其数据进行读写和修改的能力,隔离性可以防止多个事务并发执行时由于交叉执行而导致数据的不一致,因为多个事务同时使用相同的数据时,不会相互干扰,每个事务都有一个完整的数据空间,对其他并发事务是隔离的。也就是说,消费者购买商品这个事务,是不影响其他消费者购买的。
-
持久性(Durability): 事务一旦提交,其对数据库的修改应该是永久性的,即使发生系统崩溃或断电等故障,事务提交的结果也应该被永久保存在数据库中。
通过什么保证事务的特性
InnoDB 引擎保证事务的四个特性
- 持久性是通过 redo log (重做日志)来保证的;
- 原子性是通过 undo log(回滚日志) 来保证的;
- 隔离性是通过 MVCC(多版本并发控制) 或锁机制来保证的;【重点】
- 一致性则是通过持久性+原子性+隔离性来保证;
由于在并发执行多个事务时会出现交叉执行,导致数据不准确,因为需要进行事务的隔离
并发执行事务出现的问题
- **脏读(Dirty Read):指一个事务在读取了另一个事务未提交的数据时发生的现象。**例如,事务A修改了某行数据但还未提交,此时事务B读取了这个未提交的数据,如果事务A后来回滚了,则事务B读取到的数据实际上是无效的,这就是脏读
- 不可重复读(Non-repeatable Read):指在一个事务内,多次读取同一行数据时,由于其他事务对该行数据做了修改或删除,导致不同读取之间出现了不一致的情况。 例如,事务A在读取某行数据后,事务B修改了该行数据并提交,然后事务A再次读取同一行数据,此时读取到的数据与之前不一致,这就是不可重复读。
- 幻读(Phantom Read):指在一个事务内,多次执行同一个查询时, 由于其他事务对数据进行了插入或删除操作,导致查询结果集合不一致的现象。 例如,事务A在查询某个范围内的数据时,事务B在该范围内插入了新的数据,然后事务A再次查询同一范围的数据,发现结果集合中出现了之前不存在的新数据,这就是幻读。
事务的隔离级别
-
读未提交(Read Uncommitted):最低的隔离级别,在该级别下,一个事务可以读取另一个事务未提交的数据。这种隔离级别可能导致脏读、不可重复读和幻读的问题。
-
读已提交(Read Committed):事务只能读取已经提交的数据,可以避免脏读,但仍可能出现不可重复读和幻读的问题。
3. 可重复读(Repeatable Read):在同一个事务中多次读取同一行数据时,保证读取到的数据是一致的。其他事务对数据的修改不会影响到当前事务的查询结果,避免了不可重复读的问题。但仍可能出现幻读的问题。
(InnoDB 引擎的默认隔离级别)
实现方式:
InnoDB在每行记录后面保存两个隐藏的列来,分别保存了这个行的创建时间和行的删除时间。这里存储的并不是实际的时间值,而是系统版本号,当数据被修改时,版本号加1
在读取事务开始时,系统会给当前读事务一个版本号,事务会读取版本号<=当前版本号的数据
此时如果其他写事务修改了这条数据,那么这条数据的版本号就会加1,从而比当前读事务的版本号高,读事务自然而然的就读不到更新后的数据了
https://blog.csdn.net/qq_44836294/article/details/108059551
- 串行化(Serializable):最高的隔离级别,在该级别下,所有的事务都是按顺序执行的,事务之间不会相互影响,从而避免了脏读、不可重复读和幻读的问题。但是串行化级别会降低系统的并发性能,因为事务需要按顺序执行,无法并发执行。
隔离级别-----可重复读
MySQL InnoDB 引擎的默认隔离级别虽然是「可重复读」,但是它很大程度上避免幻读现象(并不是完全解决了,文章详细描述https://xiaolincoding.com/mysql/transaction/phantom.html#%E4%BB%80%E4%B9%88%E6%98%AF%E5%B9%BB%E8%AF%BB),解决的方案有两种:
- 针对快照读(普通 select 语句),是通过 MVCC 方式解决了幻读,因为可重复读隔离级别下,事务执行过程中看到的数据,一直跟这个事务启动时看到的数据是一致的,即使中途有其他事务插入了一条数据,是查询不出来这条数据的,所以就很好了避免幻读问题。
- 针对当前读(select … for update 等语句),是通过 next-key lock(记录锁+间隙锁)方式解决了幻读,因为当执行 select … for update 语句的时候,会加上 next-key lock,如果有其他事务在 next-key lock 锁范围内插入了一条记录,那么这个插入语句就会被阻塞,无法成功插入,所以就很好了避免幻读问题。
MVCC(Multi-Version Concurrency Control)
是一种用于数据库管理系统中的 并发控制 方法,用于解决多个事务并发访问数据库时可能出现的一致性和并发性问题。
在MVCC中,每个数据行都会有多个版本,而不是仅有一个版本。当一个事务对数据进行修改时,不会直接覆盖原始数据,而是创建一个新版本,并保留原始版本。其他事务在读取数据时,可以同时看到不同版本的数据,这样就实现了事务之间的隔离性。
MVCC的实现通常包括以下几个关键组件:
-
版本管理器(Version Manager): 负责管理数据行的版本信息,包括创建新版本、回收旧版本等操作。
-
版本链(Version Chain): 用于存储同一行数据的多个版本,通常是一个链表结构,每个节点代表一个版本。
-
快照读(Snapshot Read): 在MVCC中,事务可以通过读取数据行的某个特定版本(称为快照)来实现读一致性,而不会受到其他事务并发修改的影响。
MVCC的优点包括:
- 提高了数据库的并发性能,因为读操作不会阻塞写操作,多个事务可以并发读取同一数据行的不同版本。
- 避免了读-写之间的锁竞争,减少了锁冲突带来的性能损耗。
- 实现了读一致性,每个事务看到的数据都是一致的,不会出现脏读、不可重复读等问题。
MVCC在许多现代数据库系统中得到了广泛的应用,例如MySQL、PostgreSQL等。