深入刨析 mysql 底层索引结构B+树

news/2024/9/23 8:35:45/

文章目录

  • 前言
  • 一、什么是索引?
  • 二、不同索引结构对比
    • 2.1 二叉树
    • 2.2 平衡二叉树
    • 2.3 B-树
    • 2.4 B+树
  • 三、mysql 的索引
    • 3.1 聚簇索引
    • 3.2 非聚簇索引


前言

很多人看过mysql索引的介绍:hash表、B-树、B+树、聚簇索引、主键索引、唯一索引、辅助索引、二级索引、联合索引、倒排索引、普通索引。。。等等。好像都知道,但是却分不清,本系列为大家系统分享介绍一下mysql的各种索引知识,将不同知识点串起来。


一、什么是索引?

MySQL官方对索引的定义为:索引(Index)是帮助MySQL高效获取数据的数据结构

二、不同索引结构对比

数据结构查找时间复杂度缺点优点
hash表O(1)- hash冲突; - 无法范围查随机查找效率高
二叉树O(logN)线性增加数据会退化成O(N);数据量较大时,树会变高;每个节点只能存储一个数据,IO次数多
平衡二叉树O(logN)- 数据量较大时,树会变高;- 每个节点只能存储一个数据,IO次数多- 线性增加数据不会退化成O(N);
b-树O(logN)- 范围查询时效率低; - 数据分散在非叶子节点,当数据量大时,树的高度也不低- 叶子节点和非叶子节点都可以存储数据; - m叉分裂,可以降低树的高度
b+树O(logN)- 非叶子节点只存key,不存data,大大降低了树的高度;- 叶子节点设计为链表,很好的支持了范围查询

2.1 二叉树

在这里插入图片描述

2.2 平衡二叉树

在这里插入图片描述

2.3 B-树

在这里插入图片描述

2.4 B+树

在这里插入图片描述
总结
1.索引为排好序的一种数据结构,用于提升数据库的查找速度。
2.Hash索引时间复杂度为O(1),树索引是O(log(n))。Hash 底层是哈希表实现,等值查询,可以快速定位数据。但不支持范围查询,无法用于排序分组,无法模糊查询等操作。
3.B+树作为索引优势:

  • 叶子节点存储实际记录行,记录行相对比较紧密的存储,适合大数据量磁盘存储;
  • 非叶子节点存储记录的PK(KEY数据小,相同内存情况下,节点可以多存KEY,增大了节点广度(B+树出度更大,进而树高更矮,磁盘IO次数更少))用于查询加速,适合内存存储;
  • 叶子之间,增加了链表。可以很好的支持范围查询,并且获取所有节点,不再需要中序遍历;
  • 更少查询次数:B+树出度更大,树高更低,查询次数更少;
  • 很适合磁盘存储,能够充分利用局部性原理,磁盘预读(为了减少IO操作,往往不严格按需读取,而是预读。B+树叶子结点存储相临,读取会快一些

mysql__41">三、mysql 的索引

3.1 聚簇索引

聚簇索引并不是一种单独的索引类型。而是一种数据存储方式(所用的用户记录都保存在页子节点)也就是所谓的索引即数据,数据即索引。

聚簇索引默认是主键,如果表中没有定义主键,InnoDB 会选择一个非空唯一索引代替。如果没有,InnoDB 会使用隐藏的_rowid 列来作为聚簇索引。

在这里插入图片描述
如下图所示,一张表 聚簇索引和非聚簇索引的关系:
在这里插入图片描述
特点:

  • 使用记录主键值的大小进行记录和页的排序,这包括三个方面的含义:
    • 页内 的记录是按照主键的大小顺序排成一个 单向链表 。
    • 各个存放 用户记录的页 也是根据页中用户记录的主键大小顺序排成一个 双向链表 。
    • 存放 目录项记录的页 分为不同的层次,在同一层次中的页也是根据页中目录项记录的主键大小顺序排成一个 双向链表 。
  • B+树的 叶子节点 存储的是完整的用户记录。
    所谓完整的用户记录,就是指这个记录中存储了所有列的值(包括隐藏列)。

优点:

  • 数据访问更快 ,因为聚簇索引将索引和数据保存在同一个B+树中,因此从聚簇索引中获取数据比非聚簇索引更快
  • 聚簇索引对于主键的 排序查找 和 范围查找 速度非常快
  • 按照聚簇索引排列顺序,查询显示一定范围数据的时候,由于数据都是紧密相连,数据库不用从多个数据块中提取数据,所以 节省了大量的io操作 。

缺点:

  • 插入速度严重依赖于插入顺序 ,按照主键的顺序插入是最快的方式,否则将会出现页分裂,严重影响性能。因此,对于InnoDB表,我们一般都会定义一个自增的ID列为主键
  • 更新主键的代价很高 ,因为将会导致被更新的行移动。因此,对于InnoDB表,我们一般定义主键为不可更新
  • 二级索引访问需要两次索引查找 ,第一次找到主键值,第二次根据主键值找到行数据。(也就是常说的回表,但是并不是一定会回表)

限制:

  • 对于mysql数据库中只有InnoDB支持聚簇索引,而MyISAM不支持聚簇索引。
  • 由于数据物理存储方式只能有一种,而每个mysql的表只能有一个聚簇索引,一般情况下就是该表的主键。
  • 如果没有定义主键,InnoDB会选择非空的唯一索引代替,如果没有这样的索引,InnoDB会隐式的定义一个主键来作为聚簇索引。
  • 为了充分利用聚簇索引的聚簇的特性,索引InnoDB表的主键列尽量选用有序的id,而不建议使用无需的id,比如uuid,md5,hash,字符串作为主键将无法保证数据的顺序增常。

3.2 非聚簇索引

非聚簇索引:不是根据主键构建的索引叫做非聚集索引或者二级索引或者辅助索引。

二级索引中如果将多个列作为索引,就叫做联合索引
如果索引类型为唯一索引,索引列的值必须唯一,但允许有空值。如果是组合索引,则列值的组合必须唯一

可视化数据结构的网址 https://www.cs.usfca.edu/~galles/visualization/Algorithms.html


http://www.ppmy.cn/news/1426035.html

相关文章

浏览器内置JS对象 / 事件 / 请求

浏览器内置JS对象&事件&请求 BOM - 【Browser】浏览器对象功能区域的相关操作 location - 跳转 / 读取路由数据 location.href > https://www.baidu.com/search?classbrowser#comments location.protocol > https; location.host > www.baidu.com; locati…

SpringCloud本地多网卡,服务注册地址处理

问题 Spring Cloud指定服务注册地址Dubbo指定服务注册地址 Spring Cloud指定服务注册地址 在bootstrap.yaml中写入如下内容,192.168.xxx.xxx是需要注册到注册中心的服务ip,也可以写成网段192.168.10.xxx spring:cloud:inetutils:preferred-networks: &…

Edge 浏览器的使用心得与深度探索

前言 Edge 浏览器是微软推出的一款现代化网络浏览器,旨在提供更快、更安全、更智能的网络浏览体验。作为一名前端开发者和网页浏览者,我在长期使用 Edge 浏览器的过程中积累了一些使用心得和对其功能的深度探索。在本文中,我将分享我对 Edge…

element-ui form表单自定义label的样式、内容

element-ui form表单自定义label的样式、内容 效果截图 代码 <el-form size"small" :inline"true" label-width"120px"><el-form-item prop"name"><div slot"label"><i style"color: red;"…

最小生成树算法的实现c++

最小生成树算法的实现c 题目链接&#xff1a;1584. 连接所有点的最小费用 - 力扣&#xff08;LeetCode&#xff09; 主要思路&#xff1a;使用krusal算法&#xff0c;将边的权值进行排序&#xff08;从小到大排序&#xff09;&#xff0c;每次将权值最小且未加入到连通分量中…

基于微信小程序投票评选系统的设计与实现(论文+源码)_kaic

摘 要 社会发展日新月异&#xff0c;用计算机应用实现数据管理功能已经算是很完善的了&#xff0c;但是随着移动互联网的到来&#xff0c;处理信息不再受制于地理位置的限制&#xff0c;处理信息及时高效&#xff0c;备受人们的喜爱。所以各大互联网厂商都瞄准移动互联网这个潮…

Script file ‘D:\Anaconda\Scripts\pip-script.py‘ is not present.

报错解释&#xff1a; 这个错误表明系统尝试执行的脚本文件 D:\Anaconda\Scripts\pip-script.py 不存在。这通常发生在尝试使用 pip 时&#xff0c;但 pip 没有正确安装或者路径设置不正确时。 解决方法&#xff1a; 确认 pip 是否已经安装在 Anaconda 中。可以通过 Anaconda…

C语言经典例题(22)

文章目录 1.简单计算器2.获得月份天数3.HTTP状态码4. 图像相似度5.有序序列插入一个数 1.简单计算器 题目描述&#xff1a; KK实现一个简单计算器&#xff0c;实现两个数的“加减乘除”运算&#xff0c;用户从键盘输入算式“操作数1运算符操作数2”&#xff0c;计算并输出表达…