MySQL 数据存储实现详解

MySQL 数据存储实现详解

embedded/2024/11/15 6:13:55/

MySQL 是一种流行的关系型数据库管理系统，其数据存储实现涉及多个核心组件和技术，确保数据的高效管理和可靠性。以下是对 MySQL 数据存储机制的详细解释：

1. 存储引擎

MySQL 通过不同的存储引擎来管理数据的存储和处理。每种存储引擎具有不同的特性，适用于不同的场景：

1.1. InnoDB

事务支持：InnoDB 是 MySQL 的默认存储引擎，支持 ACID 事务特性（原子性、一致性、隔离性、持久性），确保数据的完整性和一致性。
行级锁定：InnoDB 使用行级锁定来减少锁争用，提高并发性能。这适用于高并发环境下的读写操作。
聚簇索引：数据和主键索引存储在同一 B+ 树中，数据按照主键顺序物理存储，提高了查询效率。
表空间：数据存储在表空间文件中，包括共享表空间和独立表空间。表空间的管理简化了数据存储和性能优化。

1.2. MyISAM

表级锁定：MyISAM 使用表级锁定，适用于读操作多于写操作的场景。尽管在高写负载时性能可能会下降，但它对于大多数读操作场景是有效的。
非聚簇索引：数据和索引分别存储在 .MYD 和 .MYI 文件中。这种分离存储方式使索引的管理更加灵活。
压缩表：支持表的压缩，节省存储空间。

1.3. MEMORY

内存存储：MEMORY 引擎将数据存储在内存中，提供非常高的访问速度，适合缓存和临时数据处理。数据在系统重启后会丢失。
哈希索引：使用哈希索引实现快速的等值查询，但不支持范围查询。

1.4. CSV

CSV 文件：将数据存储为 CSV 文件格式，适用于数据导入和导出，但不支持事务、索引或表级锁定。

2. 数据存储机制

2.1. 数据页

结构：MySQL 通过固定大小的数据页（如 4KB 或 8KB）来存储数据。每个数据页包含页头、数据区和空闲区域，优化了磁盘 I/O 操作。
存储：数据以行的形式存储在数据页中，页的大小和结构优化了数据访问和存储效率。

2.2. 行和列

行存储：每行数据包括所有列的值，以固定格式存储在数据页中，便于高效的数据检索和操作。
列存储：列数据存储在数据页中，依据表结构和索引设计优化了数据排列和查询性能。

3. 索引存储

3.1. B+ 树索引

结构：B+ 树是一种平衡的树结构，所有叶子节点在同一层，支持高效的数据检索和维护操作。
聚簇索引：InnoDB 使用聚簇索引，数据和索引在同一 B+ 树中存储，按主键顺序物理存储数据，提高查询效率。

3.2. 哈希索引

结构：哈希索引使用哈希函数将索引键映射到哈希表位置，适用于快速的等值查询，但不支持范围查询。
用途：主要用于 MEMORY 存储引擎，提供高效的键值查找性能。

3.3. 全文索引

功能：全文索引支持复杂的文本搜索，通过分词和索引建立优化文本数据的检索。适用于大规模文本数据的查询需求。

4. 事务日志

4.1. 重做日志（Redo Log）

作用：记录所有对数据库的更改操作，以确保事务的持久性。即使系统崩溃，重做日志也可以用于恢复未完成的事务。
机制：在数据页写入操作之前更新重做日志。恢复时，根据重做日志应用未完成的操作，确保数据一致性。

4.2. 撤销日志（Undo Log）

作用：记录对数据的修改，用于事务的回滚，恢复数据到原始状态。支持事务的原子性和隔离性。
机制：与重做日志配合使用，确保在事务回滚时能够恢复数据的完整性。

4.3. 二进制日志（Binary Log）

作用：记录所有对数据库的更改操作，如插入、更新和删除，主要用于数据恢复和主从复制。
机制：包含变更事件记录，可用于恢复到特定时间点或同步主从数据库，确保数据的一致性。

5. 缓存和缓冲

5.1. 缓冲池（Buffer Pool）

作用：InnoDB 使用缓冲池缓存数据页和索引页，减少磁盘 I/O 操作，提升性能。
机制：将经常访问的数据页保存在内存中，使用 LRU（最近最少使用）算法管理缓存页，提高数据访问速度。

5.2. 查询缓存（Query Cache）

作用：将查询结果缓存到内存中，避免重复计算，适合重复的查询请求。
机制：查询缓存检查缓存中是否存在结果，如果存在则直接返回，否则执行查询并存储结果到缓存中。（注意：MySQL 8.0 之后，查询缓存功能已被移除。）

6. 备份与恢复

6.1. 备份工具

mysqldump：生成 SQL 脚本文件用于数据库备份，适用于逻辑备份和恢复。支持单个表或整个数据库的备份。
mysqlpump：更高效的备份工具，支持并行备份和恢复，适合大规模数据备份。
MySQL Enterprise Backup：商业工具，提供增量备份、压缩备份等高级功能，适用于企业级数据保护需求。

6.2. 恢复机制

数据恢复：通过备份文件或二进制日志恢复数据。可以恢复整个数据库或单独的表，确保数据的一致性和完整性。
点-in-time 恢复：利用二进制日志恢复到特定时间点，以恢复数据并确保数据的一致性和完整性。

总结

MySQL 的数据存储机制通过以下核心技术实现高效的数据管理：

存储引擎：不同存储引擎（如 InnoDB 和 MyISAM）提供了不同的数据存储和管理特性。
数据页：数据以固定大小的页存储，优化了 I/O 性能和存储效率。
索引存储：使用 B+ 树、哈希和全文索引提升数据检索性能。
事务日志：重做日志和撤销日志确保事务的持久性和数据一致性。
缓存机制：缓冲池和查询缓存提高数据访问速度。
备份与恢复：通过备份工具和恢复机制保障数据的安全性和可恢复性。

这些技术和机制共同确保 MySQL 在高负载环境中能够高效、可靠地存储和管理数据。

http://www.ppmy.cn/embedded/107167.html

相关文章

ESD防静电监控系统助力电子制造行业转型升级

ESD防静电监控系统助力电子制造行业转型升级

在电子制造行业中，静电危害不容小觑。ESD 防静电监控系统的出现，为行业转型升级带来强大助力。电子元件对静电极为敏感，微小的静电放电都可能损坏元件，影响产品质量。ESD 防静电监控系统能够实时监测生产环境中的静电状况&#xf…

阅读更多...

AI-Talk开发板之LED

AI-Talk开发板之LED

一、说明 AI-Talk开发板上有一颗用户LED，连接在CH32 PA2管脚，低电平亮，高电平灭。相关电路图如下： 需要提前给CH32V003烧录特定的固件才能将CH32作为CSK6011A的exmcu，参考AI-Talk开发板更新CH32固件。二、工程 …

阅读更多...

C# 异步编程

C# 异步编程

栏目总目录异步编程 async 和 await 关键字是 C# 5.0 引入的两个非常重要的关键字，它们一起工作，使得异步编程变得简单和直观。 async 关键字 async 关键字用于标记一个方法、lambda 表达式、匿名方法或局部方法作为异步方法。这告诉编译器该方法内部…

阅读更多...

数据结构(三)——双向链表，循环链表，内核链表，栈和队列

数据结构(三)——双向链表，循环链表，内核链表，栈和队列

双链表产生原因：单链表只有一个指向后继的指针，如果要访问某节点的前驱结点，只能从头遍历，也就是访问后继节点的时间复杂度为1，访问前驱结点的时间复杂度为n。而引入双链表使得在插入、删除的…

阅读更多...

Django+Vue农产品销售系统的设计与实现

Django+Vue农产品销售系统的设计与实现

目录 1 项目介绍2 项目截图3 核心代码3.1 需要的环境3.2 Django接口层3.3 实体类3.4 config.ini3.5 启动类3.5 Vue 4 数据库表设计5 文档参考6 计算机毕设选题推荐7 源码获取 1 项目介绍博主个人介绍：CSDN认证博客专家，CSDN平台Java领域优质创作者&…

阅读更多...

vscode 快捷删除整个单词

vscode 快捷删除整个单词

在 Visual Studio Code (VSCode) 中删除单词可以通过几种不同的方法实现，主要取决于你使用的操作系统和键盘快捷键的偏好。以下是几种常见的方法： 方法一：使用键盘快捷键在 Windows 和 Linux 上删除光标后面的单词： Ctrl De…

阅读更多...

目标跟踪算法——ByteTrack算法原理解析

目标跟踪算法——ByteTrack算法原理解析

文章目录 ByteTrack1. ByteTrack算法步骤：2. 算法解释2.1 模型初始化2.2 模型更新算法流程2.2.1 检测结果划分，划分为高分和较低分段2.2.2 高分段处理手段2.2.3 最优匹配与未匹配划分2.2.4 低分框再匹配2.2.5 未确认轨迹处理2.2.6 更新状态 2.3 匈牙利匹…

阅读更多...

【大模型LLM第十一篇】微调自动化数据选择方式之MoDS

【大模型LLM第十一篇】微调自动化数据选择方式之MoDS

前言来自中科院自动化所的paper MoDS: Model-oriented Data Selection for Instruction Tuning link：https://arxiv.org/pdf/2311.15653 github：https://github.com/CASIA-LM/MoDS 一、摘要 sft已经成为让LLM遵循用户指令的一种方式。通常&#xf…

阅读更多...

最新文章