Mysql 存储引擎

MySQL提供了多种存储引擎来管理不同类型的表，每种存储引擎都有其特定的特性和用途。

1.存储引擎：

(1). InnoDB

特点：支持事务（ACID）、行级锁定、外键约束。
用途：适用于高可靠性和高并发的事务型应用，例如金融系统、ERP系统等。
优点：
支持事务和外键，保证数据完整性。
高效的行级锁，适合高并发的写操作。
支持崩溃恢复。
缺点：读性能相对MyISAM略差，尤其是在复杂查询时。

(2).MyISAM

特点：不支持事务和外键，支持表级锁定，查询速度较快。
用途：适用于读多写少的场景，例如数据仓库、分析系统等。
优点：
查询速度快，适合读取密集型操作。
表的存储格式简单，支持全文索引。
占用空间相对较小。
缺点：
不支持事务和外键，数据完整性和安全性较差。
使用表级锁，写操作并发性低。

(3). MEMORY

特点：数据存储在内存中，速度极快，数据非持久化。
用途：适用于临时表、缓存表和对性能要求极高的读操作。
优点：
读写速度非常快。
支持HASH索引，适合快速查找。
缺点：
数据不持久化，服务器重启后数据丢失。
表大小受可用内存限制，无法存储大量数据。

(4).CSV

特点：每个表对应一个CSV文件，数据以逗号分隔，适合数据交换。
用途：适用于需要将数据导入导出的场景。
优点：
表结构和数据文件简单易于读取和编辑。
缺点：
不支持索引、事务、外键等高级特性。
查询性能差。

(5).ARCHIVE

特点：用于存储大量的归档数据，支持高压缩比，只有插入和查询操作，不支持删除和更新。
用途：适合需要存储大量历史归档数据的场景，如日志记录。
优点：
高度压缩，节省存储空间。
插入操作非常快。
缺点：
不支持事务和索引。
不支持删除和更新。

(6).NDB Cluster (MySQL Cluster)

特点：分布式存储引擎，适用于MySQL Cluster，支持高可用性和自动分片。
用途：适用于需要高可用性和低延迟的分布式应用。
优点：
高可用性和冗余。
自动分片和数据复制。
缺点：
配置复杂，管理难度较高。
高速网络要求高。

(6).Federated

特点：提供访问远程MySQL数据库表的方式，不存储数据。
用途：适合需要在多个MySQL服务器之间分布数据的场景。
优点：
实现分布式数据存储。
缺点：
不支持事务和外键。
由于远程连接，查询性能较低。

(7).BLACKHOLE

特点：数据插入时被丢弃，不存储实际数据，支持事务。
用途：适合需要测试或记录日志（如复制）但不需要存储数据的场景。
优点：
插入速度非常快，因为不存储任何数据。
缺点：
不存储数据，仅作为“黑洞”使用。

2.如何选择合适的存储引擎？

高并发和事务支持：选择InnoDB。
读多写少，且对事务和外键无要求：选择MyISAM。
高性能临时表或缓存表：选择MEMORY。
数据归档或日志存储：选择ARCHIVE。
分布式高可用架构：选择NDB Cluster。
远程表访问：选择Federated。

存储引擎的选择应根据具体的应用场景、数据量、读写比、事务需求和备份恢复策略等因素来综合考虑。

3.Innodb的底层实现：

InnoDB是MySQL的默认存储引擎，具有高可靠性和高性能，支持事务处理、行级锁定和外键约束。InnoDB的底层实现非常复杂，包括了存储结构、事务机制、锁机制、缓存机制等多个方面。

(1).数据存储结构

InnoDB使用B+树来存储数据，并且采用聚簇索引（Clustered Index）方式。

聚簇索引（Clustered Index）：在InnoDB中，表数据按照主键顺序存储，主键索引（聚簇索引）和表数据是存储在一起的。每张表必须有一个聚簇索引，如果没有定义主键，InnoDB会选择一个唯一非空索引作为聚簇索引，否则会自动创建一个隐藏的主键。
辅助索引（Secondary Index）：辅助索引叶节点存储的是主键的值，因此查找辅助索引时需要先查到主键，再根据主键去聚簇索引查找数据（回表操作）。

(2).页结构和索引

InnoDB将存储空间分成称为“页”（Page）的最小存储单元，每个页的默认大小为16KB。InnoDB中的页类型主要有数据页、索引页、Undo页、系统页等。

页的管理：InnoDB使用称为“段（Segment）”、“区（Extent）”和“页（Page）”的结构来管理数据。
页（Page）：数据存储的基本单位，一个页通常大小为16KB。
区（Extent）：一个区由连续的64个页组成，大小为1MB。
段（Segment）：段是由多个区组成的，可以认为段是逻辑概念上的一个表或索引。

(3).数据页结构

一个数据页存储了多个行数据，并且每个页的结构通常包括以下部分：

页头（Page Header）：存储页的基本信息，如页类型、页大小等。
用户记录（User Records）：存储实际的数据行。
页目录（Page Directory）：用于快速定位用户记录。
页尾（Page Trailer）：用于检验页的完整性，防止数据被破坏。

(4).InnoDB的缓冲池（Buffer Pool）

InnoDB将大部分数据（索引和数据）缓存到内存中，以减少磁盘I/O操作。这个内存区域被称为缓冲池（Buffer Pool）。

Buffer Pool：Buffer Pool用来缓存数据页和索引页，是InnoDB性能优化的关键组件。通过Buffer Pool，InnoDB能够将频繁访问的页面保存在内存中，减少对磁盘的访问。
LRU算法：InnoDB使用LRU（Least Recently Used）算法来管理Buffer Pool中的页面，确保最近最少使用的页面先被淘汰。

(5).事务与日志系统

InnoDB通过重做日志（Redo Log）和回滚日志（Undo Log）来实现事务的ACID特性：

Redo Log（重做日志）：记录数据的物理修改，用于事务的恢复。Redo Log是WAL（Write-Ahead Logging）机制的一部分，即先写日志再写磁盘。当系统崩溃时，Redo Log可用于恢复未完成的事务。
Undo Log（回滚日志）：用于实现事务的回滚（Rollback）和MVCC（多版本并发控制）。Undo Log记录数据修改前的状态，当需要回滚时可以使用它来还原数据。

(6).MVCC（多版本并发控制）

InnoDB通过MVCC来实现高效的并发控制，避免了加锁的开销。MVCC通过维护每行数据的多个版本，实现了快照读和一致性读：