排序算法进一步总结

ops/2024/12/20 7:00:18/

归并排序 (Merge Sort)
归并排序是建立在归并操作上的一种有效的算法>排序算法。该算法是采用分治法 (Divide and Conquer) 的一个非常典型的应用。归并排序是一种稳定的排序方法。将已有序的子序列合并,得到完全有序的序列;即先使每个子序列有序,再使子序列段间有序。若将两个有序表合并成一个有序表,称为 2 - 路归并。

和选择排序一样,归并排序的性能不受输入数据的影响,但表现比选择排序好的多,因为始终都是 $O(nlogn)$ 的时间复杂度。代价是需要额外的内存空间。

算法步骤
归并算法>排序算法是一个递归过程,边界条件为当输入序列仅有一个元素时,直接返回,具体过程如下:

如果输入内只有一个元素,则直接返回,否则将长度为 $n$ 的输入序列分成两个长度为 $n/2$ 的子序列;
分别对这两个子序列进行归并排序,使子序列变为有序状态;
设定两个指针,分别指向两个已经排序子序列的起始位置;
比较两个指针所指向的元素,选择相对小的元素放入到合并空间(用于存放排序结果),并移动指针到下一位置;
重复步骤 3 ~ 4 直到某一指针达到序列尾;
将另一序列剩下的所有元素直接复制到合并序列尾。

算法分析
稳定性:稳定
时间复杂度:最佳:$O(nlogn)$, 最差:$O(nlogn)$, 平均:$O(nlogn)$
空间复杂度:$O(n)$
快速排序 (Quick Sort)
快速排序用到了分治思想,同样的还有归并排序。乍看起来快速排序和归并排序非常相似,都是将问题变小,先排序子串,最后合并。不同的是快速排序在划分子问题的时候经过多一步处理,将划分的两组数据划分为一大一小,这样在最后合并的时候就不必像归并排序那样再进行比较。但也正因为如此,划分的不定性使得快速排序的时间复杂度并不稳定。

快速排序的基本思想:通过一趟排序将待排序列分隔成独立的两部分,其中一部分记录的元素均比另一部分的元素小,则可分别对这两部分子序列继续进行排序,以达到整个序列有序。

算法步骤
快速排序使用分治法(Divide and conquer)策略来把一个序列分为较小和较大的 2 个子序列,然后递归地排序两个子序列。具体算法描述如下:

从序列中随机挑出一个元素,做为 “基准”(pivot);
重新排列序列,将所有比基准值小的元素摆放在基准前面,所有比基准值大的摆在基准的后面(相同的数可以到任一边)。在这个操作结束之后,该基准就处于数列的中间位置。这个称为分区(partition)操作;
递归地把小于基准值元素的子序列和大于基准值元素的子序列进行快速排序。

算法分析
稳定性:不稳定
时间复杂度:最佳:$O(nlogn)$, 最差:$O(n^2)$,平均:$O(nlogn)$
空间复杂度:$O(logn)$
堆排序 (Heap Sort)
堆排序是指利用堆这种数据结构所设计的一种算法>排序算法。堆是一个近似完全二叉树的结构,并同时满足堆的性质:即子结点的值总是小于(或者大于)它的父节点。

算法步骤
将初始待排序列 $(R_1, R_2, \dots, R_n)$ 构建成大顶堆,此堆为初始的无序区;
将堆顶元素 $R_1$ 与最后一个元素 $R_n$ 交换,此时得到新的无序区 $(R_1, R_2, \dots, R_{n-1})$ 和新的有序区 $R_n$, 且满足 $R_i \leqslant R_n (i \in 1, 2,\dots, n-1)$;
由于交换后新的堆顶 $R_1$ 可能违反堆的性质,因此需要对当前无序区 $(R_1, R_2, \dots, R_{n-1})$ 调整为新堆,然后再次将 $R_1$ 与无序区最后一个元素交换,得到新的无序区 $(R_1, R_2, \dots, R_{n-2})$ 和新的有序区 $(R_{n-1}, R_n)$。不断重复此过程直到有序区的元素个数为 $n-1$,则整个排序过程完成

算法分析
稳定性:不稳定
时间复杂度:最佳:$O(nlogn)$, 最差:$O(nlogn)$, 平均:$O(nlogn)$
空间复杂度:$O(1)$
计数排序 (Counting Sort)
计数排序的核心在于将输入的数据值转化为键存储在额外开辟的数组空间中。 作为一种线性时间复杂度的排序,计数排序要求输入的数据必须是有确定范围的整数。

计数排序 (Counting sort) 是一种稳定的算法>排序算法。计数排序使用一个额外的数组 C,其中第 i 个元素是待排序数组 A 中值等于 i 的元素的个数。然后根据数组 C 来将 A 中的元素排到正确的位置。它只能对整数进行排序。

算法步骤
找出数组中的最大值 max、最小值 min;
创建一个新数组 C,其长度是 max-min+1,其元素默认值都为 0;
遍历原数组 A 中的元素 A[i],以 A[i] - min 作为 C 数组的索引,以 A[i] 的值在 A 中元素出现次数作为 C[A[i] - min] 的值;
对 C 数组变形,新元素的值是该元素与前一个元素值的和,即当 i>1 时 C[i] = C[i] + C[i-1];
创建结果数组 R,长度和原始数组一样。
从后向前遍历原始数组 A 中的元素 A[i],使用 A[i] 减去最小值 min 作为索引,在计数数组 C 中找到对应的值 C[A[i] - min],C[A[i] - min] - 1 就是 A[i] 在结果数组 R 中的位置,做完上述这些操作,将 count[A[i] - min] 减小 1。

算法分析
当输入的元素是 n 个 0 到 k 之间的整数时,它的运行时间是 $O(n+k)$。计数排序不是比较排序,排序的速度快于任何比较算法>排序算法。由于用来计数的数组 C 的长度取决于待排序数组中数据的范围(等于待排序数组的最大值与最小值的差加上 1),这使得计数排序对于数据范围很大的数组,需要大量额外内存空间。

稳定性:稳定
时间复杂度:最佳:$O(n+k)$ 最差:$O(n+k)$ 平均:$O(n+k)$
空间复杂度:$O(k)$
桶排序 (Bucket Sort)
桶排序是计数排序的升级版。它利用了函数的映射关系,高效与否的关键就在于这个映射函数的确定。为了使桶排序更加高效,我们需要做到这两点:

在额外空间充足的情况下,尽量增大桶的数量
使用的映射函数能够将输入的 N 个数据均匀的分配到 K 个桶中
桶排序的工作的原理:假设输入数据服从均匀分布,将数据分到有限数量的桶里,每个桶再分别排序(有可能再使用别的算法>排序算法或是以递归方式继续使用桶排序进行。

算法步骤
设置一个 BucketSize,作为每个桶所能放置多少个不同数值;
遍历输入数据,并且把数据依次映射到对应的桶里去;
对每个非空的桶进行排序,可以使用其它排序方法,也可以递归使用桶排序;
从非空桶里把排好序的数据拼接起来。

算法分析
稳定性:稳定
时间复杂度:最佳:$O(n+k)$ 最差:$O(n^2)$ 平均:$O(n+k)$
空间复杂度:$O(n+k)$
基数排序 (Radix Sort)
基数排序也是非比较的算法>排序算法,对元素中的每一位数字进行排序,从最低位开始排序,复杂度为 $O(n×k)$,$n$ 为数组长度,$k$ 为数组中元素的最大的位数;

基数排序是按照低位先排序,然后收集;再按照高位排序,然后再收集;依次类推,直到最高位。有时候有些属性是有优先级顺序的,先按低优先级排序,再按高优先级排序。最后的次序就是高优先级高的在前,高优先级相同的低优先级高的在前。基数排序基于分别排序,分别收集,所以是稳定的。

算法步骤
取得数组中的最大数,并取得位数,即为迭代次数 $N$(例如:数组中最大数值为 1000,则 $N=4$);
A 为原始数组,从最低位开始取每个位组成 radix 数组;
对 radix 进行计数排序(利用计数排序适用于小范围数的特点);
将 radix 依次赋值给原数组;
重复 2~4 步骤 $N$ 次

算法分析
稳定性:稳定
时间复杂度:最佳:$O(n×k)$ 最差:$O(n×k)$ 平均:$O(n×k)$
空间复杂度:$O(n+k)$
基数排序 vs 计数排序 vs 桶排序

这三种算法>排序算法都利用了桶的概念,但对桶的使用方法上有明显差异:

基数排序:根据键值的每位数字来分配桶
计数排序:每个桶只存储单一键值
桶排序:每个桶存储一定范围的数值
————————————————

                            版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
                        
原文链接:https://blog.csdn.net/2401_85327573/article/details/144560035


http://www.ppmy.cn/ops/143408.html

相关文章

美的集团后端实习面试

前言 碎碎念没必要看 不过,hr还有面试官都很好,面试官也不严厉,虽然没开摄像头,但是面起来很舒服,然后面试官感觉就像是跟同龄人聊天一样,很可爱的小姐姐😃。~~ 流程啥的就不说了,…

C++算法第十一天

本篇文章我们继续学习动态规划 第一题 题目链接 题目解析 代码原理 代码编写 class Solution { public: int uniquePathsWithObstacles(vector<vector<int>>& obstacleGrid) { int m obstacleGrid.size(), n obstacleGrid[0].size(); //建表 vector<v…

WebRTC搭建与应用(一)-ICE服务搭建

WebRTC搭建与应用(一) 近期由于项目需要在研究前端WebGL渲染转为云渲染&#xff0c;借此机会对WebRTC、ICE信令协议等有了初步了解&#xff0c;在此记录一下&#xff0c;以防遗忘。 第一章 ICE服务搭建 文章目录 WebRTC搭建与应用(一)前言一、ICE是什么&#xff1f;二、什么…

服务器数据恢复—RAIDZ离线硬盘数超过热备盘数导致阵列崩溃的数据恢复案例

服务器存储数据恢复环境&#xff1a; ZFS Storage 7320存储阵列中有32块硬盘。32块硬盘分为4组&#xff0c;每组8块硬盘&#xff0c;共组建了3组RAIDZ&#xff0c;每组raid都配置了热备盘。 服务器存储故障&#xff1a; 服务器存储运行过程中突然崩溃&#xff0c;排除人为误操…

游戏渠道假量解决方案

某推广公司在推广过程中被查出“短期内点击量激增”“存在同一地址多次访问”“已注册用户重复注册”等数据作弊行为&#xff0c;法院判罚退还服务费200余万元&#xff0c;并赔偿违约金约350万元。 某公司为提升其游戏在应用商店榜单排名&#xff0c;委托某网络公司进行下载、注…

循环神经网络(RNN)在时序预测中的应用与优势

目录 ​编辑 引言 RNN的基本结构与工作原理 RNN的记忆能力 参数共享与灵活性 动态特征提取 处理变长序列 序列到序列的学习 解决梯度消失和爆炸问题 端到端学习 RNN在实际应用中的优势 RNN的挑战与改进 结论 引言 在数据科学和机器学习领域&#xff0c;时序预测是…

使用 Python 实现 WebSocket 服务器与客户端通信

简介 WebSocket 是一种基于 TCP 协议的通信协议&#xff0c;能够在客户端与服务器之间进行全双工&#xff08;双向&#xff09;通信。相比传统的 HTTP 协议&#xff0c;WebSocket 可以实现实时数据的传输&#xff0c;尤其适合需要实时交互的应用场景&#xff0c;如在线游戏、实…

3D目标检测数据集及评价指标

1. KITTI 一个前视双目数据集&#xff0c;附有雷达数据&#xff0c;主要用于单目3D目标检测模型。数据集根据遮挡将目标分为三档&#xff0c;分别是未遮挡Easy&#xff0c;半遮挡Mod.&#xff0c;和大部分遮挡Hard&#xff0c;一般模型检测指标都是根据这三类标签分别计算mAP。…