从零实现一个数据库(DataBase) Go语言实现版 3.B树: 思路

news/2024/11/8 5:52:20/

英文源地址

关于B树和二叉查找树的直觉

我们的第一个直觉来自于平衡二叉树(BST).二叉树是用于排序数据的常用数据结构.在插入或移除键后保持树的良好形状就是’平衡’的意思.如前一章所述, 为了利用"页"(IO的最小单元), 应该使用n叉树而不是二叉树.
b树可以由二叉查找树推广得到.b树的每个节点包含多个键和其他节点的多个链接.在节点中查找键时, 所有键都用于确定下一个子节点.在这里插入图片描述
b树的平衡与二叉查找树不同, 流行的BST树比如红黑树或AVL树时在子树的高度上平衡的(通过旋转).虽然所有的b树叶节点的高度相同, 但b树通过节点的大小来平衡.

  1. 如果一个节点太大而无法放在一个页上, 则将其分为两个节点. 这将增加父节点的大小, 如果根节点被分割, 可能还会增加树的高度.
  2. 如果节点太小, 将尝试将其与兄弟节点合并

b树和嵌套数组

即使你对2-3tree不熟悉, 仍然可以使用嵌套数组获得一些直觉.
让我们从一个排好序的数组开始, 查询可以通过二分法来完成.但更新数组是O(n)的时间复杂度是我们需要解决的问题.更新一个大数组是很糟糕的, 所以我们把它分成更小的数组.假设我们将数组分成sqrt(n)个部分, 每个部分平均包含sqrt(n)个键.
在这里插入图片描述
要查询一个键, 我们必须首先确定哪个部分包含该键, 在sqrt(n)部分上的等分是O(logn).在这之后, 对这部分的键进行平分还是O(logn)-这不比之前差.而更新操作被改善为O(sqrt(n))
这是一个两层排序嵌套数组, 如果我们添加更多的层会怎么样?这是对b树的另一种直观理解.

b树的操作

查询一颗b树和查询一颗二分查找树是一样的.
更新b树更为复杂.从现在开始, 我们将使用b树的一种变体,成为b+树, b+树仅在叶子节点中存储值, 内存节点仅包含键.
从叶子节点开始键插入.叶节点就是键的排序列表.将键插入到叶子中是微不足道的.但是, 插入可能导致节点大小超过页面大小.在这种情况下, 我们需要将叶子节点拆分为2个节点, 每个节点包含一半的键, 以便两个叶子节点都适应一个页大小.
内部节点包含:

  1. 指向其子节点的指针列表
  2. 与指针列表配对的键列表.每个键都是对于子键的第一个键.

将一个叶子节点分成2个节点后, 父节点用新的指针和键替换旧的指针和键. 节点的大小会增加, 这可能会引发进一步的分裂.在这里插入图片描述
根节点分裂后, 会添加一个新的根节点. 这就是b树的生成过程.
键删除与插入相反. 节点永远不会为空, 因为小节点将合并到它的左兄弟或右兄弟节点中去.
当一个非叶子节点的根节点被简化为一个键时, 这个根节点可以被它唯一的子节点取代. 这就是b树收缩的方式.

不可变数据结构

不可变意味着用韵不会就地更新数据.一些类似的术语是’仅追加’, ‘写时复制’和’持久数据结构’('持久’这个词与我们之前讨论的persistence没有任何关系).
例如,在向叶子节点插入键时, 不要就地修改节点, 而是使用来自待更新节点的所有键和新键创建一个新节点.现在, 还必须更新父节点以指向新节点.
同样, 父节点与新指针重复. 在到达根节点之前, 整个路径都被复制了. 这有效地创建了与旧版本共存的树的新版本.
不可变数据结构有几个优势:
1.避免数据损坏, 不可变数据结构不修改现有数据, 它们只是添加新数据, 因此即使更新中断, 旧版本数据也保持完整.
2.容易并发.读操作可以与写操作并发执行, 因为读取操作可以在旧版本上不受影响地工作.

持久化和并发性将在后面地章节中讨论.现在, 我们将首先编写一个不可变地B+树.


http://www.ppmy.cn/news/87560.html

相关文章

FLOPS和FLOPs的区别

FLOPS 和FLOPs的定义分别如下: FLOPS Floating point operations per second:每秒执行的浮点运算, 也会被写作flops 或者flop/s, 比如在GPT-3的论文中就用了flops和petaflop/s 的写法 FLOPs Floating point operations 浮点运算&#xff0…

Student实体类内部比较器比较年龄,身高,名字

Student实体类代码如下所示&#xff1a; package com.test.Test08;public class Student implements Comparable<Student>{private int age;private double height;private String name;public int getAge() {return age;}public void setAge(int age) {this.age age;}p…

Docker实战2-发布后端Java项目

有了上篇Docker实战1-发布前端Vue项目的经验&#xff0c;发布后端就轻车熟路了。 1 准备文件 java打包 运行maven的package,生成jar文件&#xff0c;target/dsm-service-1.0-SNAPSHOT.jar DockerFile # Docker image for springboot file run FROM openjdk:11.0.11-jdk-sli…

JS CSS 关于 Shadow dom 的用法

一、什么是 Shadow DOM 你是否好奇过&#xff0c;浏览器自带的元素的样式是如何实现的&#xff0c;例如 video、input &#xff0c;又或者在某些网站中看到一些非浏览器自带且没见过的元素&#xff1f; 如果你打开 F12 查看定位该元素的信息&#xff0c;你会发现啥都没看到&am…

QTP10.0安装及问题

1、如果没有特殊要求&#xff0c;安装都是直接选下一步 2、然后出现问题就是 提示脚本调试器没有下载成功&#xff1a; 看提示就是缺了一个东西&#xff0c;另外下载安装就可以 百度网盘 请输入提取码 链接&#xff1a;https://pan.baidu.com/s/195hEKOPbpp37okysutcqEQ 提取…

UE5.1.1C++从0开始(11.AI与行为树)

怕有些朋友不知道教程指的是哪一个&#xff0c;我在这里把教程的网址贴出来&#xff1a;https://www.bilibili.com/video/BV1nU4y1X7iQ?p1 这一章开始进入电脑玩家逻辑的编写&#xff0c;因为是第一次接触&#xff0c;所以老师也没有讲什么很难的问题&#xff0c;这里还是老样…

树莓派 CM4 应用开机自启设置

需求&#xff1a;基于树莓派写了一个应用&#xff0c;让其开机自启 1&#xff0c;屏蔽 开机警告信息 在/boot/config.txt末尾添加语句 avoid_warnings2 2&#xff0c;替换欢迎界面 用自己的图片 替换/usr/share/plymouth/themes/pix/splash.png 3&#xff0c;应用开机自启…

Rust每日一练(Leetday0011) 下一排列、有效括号、搜索旋转数组

目录 31. 下一个排列 Next Permutation &#x1f31f;&#x1f31f; 32. 最长有效括号 Longest Valid Parentheses &#x1f31f;&#x1f31f;&#x1f31f; 33. 搜索旋转排序数组 Search-in-rotated-sorted-array &#x1f31f;&#x1f31f; &#x1f31f; 每日一练刷…