Mysql 存储引擎

server/2024/9/22 12:12:27/

        MySQL提供了多种存储引擎来管理不同类型的表,每种存储引擎都有其特定的特性和用途。

1.存储引擎:

        (1). InnoDB

  • 特点:支持事务(ACID)、行级锁定、外键约束。
  • 用途:适用于高可靠性和高并发的事务型应用,例如金融系统、ERP系统等。
  • 优点
    • 支持事务和外键,保证数据完整性。
    • 高效的行级锁,适合高并发的写操作。
    • 支持崩溃恢复。
  • 缺点:读性能相对MyISAM略差,尤其是在复杂查询时。

        (2).MyISAM

  • 特点:不支持事务和外键,支持表级锁定,查询速度较快。
  • 用途:适用于读多写少的场景,例如数据仓库、分析系统等。
  • 优点
    • 查询速度快,适合读取密集型操作。
    • 表的存储格式简单,支持全文索引。
    • 占用空间相对较小。
  • 缺点
    • 不支持事务和外键,数据完整性和安全性较差。
    • 使用表级锁,写操作并发性低。

       (3). MEMORY

  • 特点:数据存储在内存中,速度极快,数据非持久化。
  • 用途:适用于临时表、缓存表和对性能要求极高的读操作。
  • 优点
    • 读写速度非常快。
    • 支持HASH索引,适合快速查找。
  • 缺点
    • 数据不持久化,服务器重启后数据丢失。
    • 表大小受可用内存限制,无法存储大量数据。

       (4).CSV        

  • 特点:每个表对应一个CSV文件,数据以逗号分隔,适合数据交换。
  • 用途:适用于需要将数据导入导出的场景。
  • 优点
    • 表结构和数据文件简单易于读取和编辑。
  • 缺点
    • 不支持索引、事务、外键等高级特性。
    • 查询性能差。

        (5).ARCHIVE

  • 特点:用于存储大量的归档数据,支持高压缩比,只有插入和查询操作,不支持删除和更新。
  • 用途:适合需要存储大量历史归档数据的场景,如日志记录。
  • 优点
    • 高度压缩,节省存储空间。
    • 插入操作非常快。
  • 缺点
    • 不支持事务和索引。
    • 不支持删除和更新。

        (6).NDB Cluster (MySQL Cluster)

  • 特点:分布式存储引擎,适用于MySQL Cluster,支持高可用性和自动分片。
  • 用途:适用于需要高可用性和低延迟的分布式应用。
  • 优点
    • 高可用性和冗余。
    • 自动分片和数据复制。
  • 缺点
    • 配置复杂,管理难度较高。
    • 高速网络要求高。

       (6).Federated

  • 特点:提供访问远程MySQL数据库表的方式,不存储数据。
  • 用途:适合需要在多个MySQL服务器之间分布数据的场景。
  • 优点
    • 实现分布式数据存储。
  • 缺点
    • 不支持事务和外键。
    • 由于远程连接,查询性能较低。

       (7).BLACKHOLE

  • 特点:数据插入时被丢弃,不存储实际数据,支持事务。
  • 用途:适合需要测试或记录日志(如复制)但不需要存储数据的场景。
  • 优点
    • 插入速度非常快,因为不存储任何数据。
  • 缺点
    • 不存储数据,仅作为“黑洞”使用。

2.如何选择合适的存储引擎?

  • 高并发和事务支持:选择InnoDB。
  • 读多写少,且对事务和外键无要求:选择MyISAM。
  • 高性能临时表或缓存表:选择MEMORY。
  • 数据归档或日志存储:选择ARCHIVE。
  • 分布式高可用架构:选择NDB Cluster。
  • 远程表访问:选择Federated。

        存储引擎的选择应根据具体的应用场景、数据量、读写比、事务需求和备份恢复策略等因素来综合考虑。

3.Innodb的底层实现:

        InnoDB是MySQL的默认存储引擎,具有高可靠性和高性能,支持事务处理、行级锁定和外键约束。InnoDB的底层实现非常复杂,包括了存储结构、事务机制、锁机制、缓存机制等多个方面。

        (1).数据存储结构

        InnoDB使用B+树来存储数据,并且采用聚簇索引(Clustered Index)方式。

  • 聚簇索引(Clustered Index):在InnoDB中,表数据按照主键顺序存储,主键索引(聚簇索引)和表数据是存储在一起的。每张表必须有一个聚簇索引,如果没有定义主键,InnoDB会选择一个唯一非空索引作为聚簇索引,否则会自动创建一个隐藏的主键。
  • 辅助索引(Secondary Index):辅助索引叶节点存储的是主键的值,因此查找辅助索引时需要先查到主键,再根据主键去聚簇索引查找数据(回表操作)。

        (2).页结构和索引

        InnoDB将存储空间分成称为“页”(Page)的最小存储单元,每个页的默认大小为16KB。InnoDB中的页类型主要有数据页、索引页、Undo页、系统页等。

  • 页的管理:InnoDB使用称为“段(Segment)”、“区(Extent)”和“页(Page)”的结构来管理数据。
    • 页(Page):数据存储的基本单位,一个页通常大小为16KB。
    • 区(Extent):一个区由连续的64个页组成,大小为1MB。
    • 段(Segment):段是由多个区组成的,可以认为段是逻辑概念上的一个表或索引。

        (3).数据页结构

        一个数据页存储了多个行数据,并且每个页的结构通常包括以下部分:

  • 页头(Page Header):存储页的基本信息,如页类型、页大小等。
  • 用户记录(User Records):存储实际的数据行。
  • 页目录(Page Directory):用于快速定位用户记录。
  • 页尾(Page Trailer):用于检验页的完整性,防止数据被破坏。

        (4).InnoDB的缓冲池(Buffer Pool)

        InnoDB将大部分数据(索引和数据)缓存到内存中,以减少磁盘I/O操作。这个内存区域被称为缓冲池(Buffer Pool)。

  • Buffer Pool:Buffer Pool用来缓存数据页和索引页,是InnoDB性能优化的关键组件。通过Buffer Pool,InnoDB能够将频繁访问的页面保存在内存中,减少对磁盘的访问。
  • LRU算法:InnoDB使用LRU(Least Recently Used)算法来管理Buffer Pool中的页面,确保最近最少使用的页面先被淘汰。

        (5).事务与日志系统

        InnoDB通过重做日志(Redo Log)和回滚日志(Undo Log)来实现事务的ACID特性:

  • Redo Log(重做日志):记录数据的物理修改,用于事务的恢复。Redo Log是WAL(Write-Ahead Logging)机制的一部分,即先写日志再写磁盘。当系统崩溃时,Redo Log可用于恢复未完成的事务。
  • Undo Log(回滚日志):用于实现事务的回滚(Rollback)和MVCC(多版本并发控制)。Undo Log记录数据修改前的状态,当需要回滚时可以使用它来还原数据。

        (6).MVCC(多版本并发控制)

        InnoDB通过MVCC来实现高效的并发控制,避免了加锁的开销。MVCC通过维护每行数据的多个版本,实现了快照读和一致性读:

  • ReadView:在读取操作开始时,InnoDB会创建一个ReadView,确保读取到的是一个一致性视图,避免读取到其他事务正在修改的数据。
  • 事务版本链:每行数据都维护了多个版本,通过指向Undo Log的指针可以找到该行数据的历史版本。

        (7).锁机制

        InnoDB实现了行级锁定机制,主要包括共享锁(S锁)和排它锁(X锁),以及多粒度锁定的意向锁(Intent Lock)。

  • 行锁(Row Lock):锁定单个行,支持高并发。
  • 表锁(Table Lock):锁定整个表,锁的粒度较大,影响并发性能。
  • 意向锁(Intention Lock):用来表示事务想要对表中某些行加锁,分为意向共享锁(IS)和意向排它锁(IX)。

        (8).崩溃恢复

        InnoDB通过重做日志和检查点机制实现崩溃恢复。当系统崩溃时,InnoDB会根据Redo Log来恢复已提交但还未持久化的数据。回滚未提交的事务则使用Undo Log。


http://www.ppmy.cn/server/118414.html

相关文章

C# Tuple、ValueTuple

栏目总目录 Tuple Tuple是C# 4.0引入的一个新特性,主要用于存储一个固定数量的元素序列,且这些元素可以具有不同的类型。Tuple是一种轻量级的数据结构,非常适合用于临时存储数据,而无需定义完整的类或结构体。 优点 简便性&…

Android 后台服务之Persistent 属性

在 Android 开发中,有时我们需要后台服务持续运行,以保持应用的某些功能。例如,音乐播放器需要在后台播放音乐,或者健康应用需要持续跟踪用户的运动数据。后台服务是 Android 中的一种组件,它不与用户界面交互,能够在后台执行长时间运行的任务。由于 Android 系统的资源管…

【Linux】09.Linux 下的调试器——gdb/cgdb

一、gdb/cgdb的认识 我们在VS上调试时都是使用Debug版本的,但是在Linux下gcc/g默认生成的是Relaese版本,我们想要进行调试就要用-g选项生成Debug版本的程序。但是Linux下的gdb是一种命令行调试工具,因此就有了cgdb为我们提供可视化的调试界面…

【算法】差分思想:强大的算法技巧

📢博客主页:https://blog.csdn.net/2301_779549673 📢欢迎点赞 👍 收藏 ⭐留言 📝 如有错误敬请指正! 📢本文由 JohnKi 原创,首发于 CSDN🙉 📢未来很长&#…

从底层原理上解释 clickhouse 保证完全的幂等性

在分布式系统中,幂等性是指某个操作被多次执行,其效果和结果应该和执行一次相同。ClickHouse作为一个高效的OLAP数据库,在其底层架构和查询引擎中,通过多个机制和策略来确保操作的幂等性。具体来说,ClickHouse的幂等性…

【设计模式-外观】

这里写自定义目录标题 定义UML图角色作用代码使用场景 定义 为子系统中一组相关接口提供一致界面,定义一个高级接口,使得子系统更加容易使用。 UML图 角色作用 外观(Facade)角色:这是外观模式的核心,它知…

fmql之ubuntu移植

官方资料:ubuntu18的压缩包 目的:放到SD卡中启动ubuntu(官方是放在emmc中) 教程:99_FMQL45_大黄蜂开发板跑ubuntu18.04.docx 所需文件 其中,format_emmc_ext4.txt对emmc的分区是512M(放上述文…

算法打卡:第九章 动态规划part12

今日收获:不同的子序列,两个字符串的删除操作,编辑距离 1. 不同的子序列 题目链接:115. 不同的子序列 - 力扣(LeetCode) 思路: (1)dp数组表示两个字符串 i-1,j-1位置…