每日学习一个数据结构-B+树

news/2024/12/22 14:58:55/

文章目录

    • 什么是B+树
      • 示意图
      • B+树的基本特点
      • B+树的优点
      • B+树的应用场
    • B+树分裂和合并的机制
      • 节点分裂
      • 节点合并
      • 注意事项

什么是B+树

B+树是一种自平衡的树数据结构,广泛应用于数据库和操作系统的索引结构中,特别是在MySQL的InnoDB存储引擎中。它通过保持数据排序,使得搜索、插入、删除等操作都能在对数时间内完成。以下是B+树的相关信息:

示意图

B+树示意图

B+树的基本特点

  • 所有值都出现在叶子节点:内部节点不存储数据,只存储键值,用于索引。
  • 叶子节点之间互相链接:叶子节点通过指针相互链接,方便范围查询。
  • 数据按关键字排序:叶子节点中的数据按照关键字大小排序,内部节点中的关键字也按大小排序。
  • 分支因子(M):每个内部节点可以有多个子节点,分支因子M决定了节点最多能存储的键值数。
  • 节点类型:内部节点包含键值及指向子节点的指针,不包含数据记录;叶子节点包含全部的数据记录。

B+树的优点

  • 高效的范围查询:由于叶子节点形成有序链表,B+树非常适合进行范围查询,只需遍历相应部分的链表即可。
  • 较低的树高度:B+树的高度相对较低,可以减少磁盘I/O操作,从而提高查询效率。
  • 节点分裂和合并操作相对较少:这减少了索引维护的开销。

B+树的应用场

B+树主要应用于数据库索引和文件系统的索引结构中,特别是在需要高效范围查询和大量数据存储的场景中表现出色。

B+树分裂和合并的机制

B+树节点分裂和合并的机制是其自平衡特性的关键部分,确保了树的高度保持在较小的范围内,从而优化了磁盘I/O操作和查询效率。以下是B+树节点分裂和合并的详细机制:

节点分裂

当一个节点中的关键字数量超过其最大容量(通常是分支因子M-1)时,该节点需要进行分裂。以下是分裂的步骤:

  1. 确定分裂点:选择节点中间的关键字作为分裂点。对于内部节点,分裂点通常是第⌈M/2⌉个关键字;对于叶子节点,分裂点通常是第⌈(M-1)/2⌉个关键字。
  2. 创建新节点:创建一个新的节点,并将原节点中分裂点右侧的关键字和对应的子节点(对于内部节点)或数据记录(对于叶子节点)移动到新节点中。
  3. 更新父节点:将分裂点的关键字插入到父节点中,并更新父节点中的指针,使其指向新创建的节点。如果父节点也满了,则递归地对父节点进行分裂。
  4. 调整指针:如果分裂发生在根节点,可能需要创建一个新的根节点,并将原来的根节点作为其子节点。

节点合并

当一个节点中的关键字数量低于其最小容量(通常是⌈M/2⌉-1)时,该节点可能需要合并。以下是合并的步骤:

  1. 确定合并节点:选择一个相邻的兄弟节点进行合并。通常选择关键字数量较多的兄弟节点。
  2. 移动关键字:将父节点中的一个关键字及其对应的子节点(对于内部节点)或数据记录(对于叶子节点)移动到当前节点中。
  3. 删除父节点中的关键字:从父节点中删除移动的关键字,并更新父节点中的指针。
  4. 删除空节点:如果合并后父节点中的关键字数量低于最小容量,递归地对父节点进行合并操作。
  5. 调整树结构:如果合并导致根节点为空,则删除根节点,并将新的根节点设置为原来的子节点。

注意事项

  • 平衡性:分裂和合并操作确保了B+树的平衡性,使得树的高度保持在较小的范围内。
  • 磁盘I/O优化:通过减少树的高度,B增强的树优化了磁盘I套操作,从而提高了查询效率。
  • 复杂性:虽然分裂和合并操作确保了树的平衡性,但它们也增加了插入和删除操作的复杂性。
    通过这些机制,B+树能够在插入和删除操作后保持平衡,确保高效的查询性能。

http://www.ppmy.cn/news/1528772.html

相关文章

LeetCode 面试经典150题 67.二进制求和

415.字符串相加 思路一模一样 题目:给你两个二进制字符串 a 和 b ,以二进制字符串的形式返回它们的和。 eg: 输入a“1010” b“1011” 输出“10101” 思路:从右开始遍历两个字符串,因为右边是低位先运算。如果…

Docker修改默认的存储路径

Docker 默认的存储路径位于 /var/lib/docker。要修改 Docker 的存储路径,请按照以下步骤操作: 1. 停止 Docker 服务: sudo systemctl stop docker 2.创建一个新的目录,用于存储 Docker 数据。例如,将数据存储在 /ap…

VMware安装rustdesk服务器

一、准备 首先准备服务器镜像:22.04 虚拟机硬件配置选1G RAM 20G ROM就行 二、虚拟机安装过程 安装过程中选最小体积安装,并勾选安装SSH 安装完成后在SSH工具中连接(步骤可视实际情况跳过): //需要先连接外网 1.安…

全国职业院校技能大赛(大数据赛项)-平台搭建hive笔记

在大数据时代,数据量呈爆炸性增长,传统的数据处理工具已难以满足需求。Hive作为一个开源的数据仓库工具,能够处理大规模数据集,提供了强大的数据查询和分析能力,是大数据学习中的关键工具。在全国职业院校技能大赛&…

VBA技术资料MF200:只能通过按钮关闭工作簿

我给VBA的定义:VBA是个人小型自动化处理的有效工具。利用好了,可以大大提高自己的工作效率,而且可以提高数据的准确度。“VBA语言専攻”提供的教程一共九套,分为初级、中级、高级三大部分,教程是对VBA的系统讲解&#…

一文入门生成式AI(理解ChatGPT的原理)

一、什么是生成式AI? 以ChatGPT为代表的生成式AI,是对已有的数据和知识进行向量化的归纳,总结出数据的联合概率。从而在生成内容时,根据用户需求,结合关联字词的概率,生成新的内容。 可以这么联想&#x…

《深度学习》PyTorch框架 优化器、激活函数讲解

目录 一、深度学习核心框架的选择 1、TensorFlow 1)概念 2)优缺点 2、PyTorch 1)概念 2)优缺点 3、Keras 1)概念 2)优缺点 4、Caffe 1)概念 2)优缺点 二、pytorch安装 1、安装 2、…

『 Linux 』HTTP(一)

文章目录 域名URLURLEncode和URLDecodeHTTP的请求HTTP的响应请求与响应的获取简单的Web服务器 域名 任何客户端在需要访问一个服务端时都需要一个IP和端口号,而当一个浏览器去访问一个网页时通常更多使用的是域名而不是IP:port的方式, www.baidu.com这是百度的域名; 实际上当浏…