1. 堆排序简介
堆排序(heapsort)是由 J. W. J. Williams 于 1964 年发明的。是一种基于比较的排序算法,和选择排序一样,堆排序将数据序列分为已排序区域和未排序区域两部分。通过从未排列区域中获取最大元素并将其插入已排序区域,迭代这个操作来缩小未排序区域。与选择排序不同的是,堆排序不会对未排序区域进行线性扫描,而是通过维护堆中未排序区域的数据结构以到达高效获取最大元素的目的。堆排序的平均时间复杂度为 O ( n log n ) O{\left(n\log n\right)} O(nlogn),空间复杂度为 O ( 1 ) O{\left(1\right)} O(1)(原地算法)。
2. 原理
将数组转化为最大堆(Max-Heap),根结点的键值是所有堆结点键值中最大者的二叉树。
Array [ p a r e n t ( i ) ] ≥ Array [ i ] {\text{Array}}{\left[parent{\left(i\right)} \right]}\ge{\text{Array}}{\left[i\right]} Array[parent(i)]≥Array[i]
接着重复取出最大堆中的最大值(即根节点值)插入已排序区域,并维护残余堆的最大堆特性就可完成排序。
3. 步骤
- 建立最大堆
- 取出最大值(即根节点),并维护残余堆。
- 递归步骤2,完成排序
3.1 数组索引和堆节点位置的关系
数组如下:
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 |
---|---|---|---|---|---|---|---|---|
26 | 3 | 44 | 38 | 5 | 47 | 15 | 36 | 26 |
可以看成
由此上可以看出:
- 数组 [ i ] {\left[i\right]} [i]的左子节点的位置为 2 × i + 1 2\times i+1 2×i+1。
- 数组 [ i ] {\left[i\right]} [i]的右子节点的位置为 2 × i + 2 2\times i+2 2×i+2。
- 数组 [ i ] {\left[i\right]} [i]的父节点的位置为
- i i i为偶数则父节点位置为 i − 2 2 \frac{i-2}{2} 2i−2
- i i i为基数则父节点位置为 i − 1 2 \frac{i-1}{2} 2i−1
- 可以简化为数组 [ i ] {\left[i\right]} [i]的父节点位置为 ⌊ i − 1 2 ⌋ \lfloor \frac{i-1}{2}\rfloor ⌊2i−1⌋
3.2 建立最大堆
从数组后面向前扫描并调整堆满足最大堆的特性:
数组中[7]=36 和 [8]=26 都满足小于父节点 [3]=38;继续向前扫描得 [6]=15 也满足小于父节点 [2]=44;继续: