快速排序详解

一、定义

快速排序（英语：Quicksort），又称分区交换排序（英语：partition-exchange sort），简称「快排」，是一种被广泛运用的排序算法。

二、基本原理

快速排序是一个基于分治的排序方法。

给定一个数组 $a$ ，该数组共有 $n$ 个元素，我们需要对其进行 从小到大（也可以从大到小）的排序。

假设要排序的区间为 $[l, r]$ ：

如果区间长度小于等于 1，那就直接退出（因为只有一个元素不用排序）。
否则在该区间中选择任意一个元素 $x$ 作为 基准元素。将大于 $x$ 的元素放到 $x$ 的右边；将小于 $x$ 的元素放到 $x$ 的左边，等于 $x$ 的元素随便放哪边。
此时， $x$ 的位置实际上就已经确定了，再对 $x$ 的左右两边的区间分别进行递归即可。

注意：为了保证时间复杂度，实际操作的时候，一般是随机选择区间的某一元素当作基准元素。

三、步骤与实现

1.步骤

在编写代码时，为了将大于 $x$ 和小于 $x$ 的元素放到 $x$ 的两边，我们并不需要使用额外的存储空间，只需要使用两个指针 $i$ 和 $j$ 。现在我们要对区间 $[l, r]$ 中的元素进行排序（我们这里选择第一个元素，即 $a [i]$ 当作 $x$ ）。

初始的时候， $i = l, j = r$
首先，指针 $j$ 向左找到第一个小于等于 $x$ 的元素，把它放到位置 $i$ 上；接着，指针 $i$ 向右找到第一个大于等于 $x$ 的元素，把它放到位置 $j$ 上
一直重复这个过程，直到两个指针 $i$ 和 $j$ 同时指向了同一位置 $p$ ，最后把位置 $p$ 的值改为 $x$
此时对于区间 $[l, r]$ ，元素 $x$ 已经被放到了正确的位置 $p$ 上
所以我们接下来只需要处理另外两个区间 $[l, p - 1]$ 和 $[p + 1, r]$ ，递归这个过程即可

2.代码实现

void quick_sort(int l,int r){//区间 [l,r] 的元素个数为 r - l + 1//如果区间元素个数 <= 1 就直接返回，即 r - l + 1 <= 1//化简一下就是 l >= rif(l >= r) return;//选择第一个元素当作 xint x = a[l];int i = l ,j = r;while(i < j){//先从右往左找到第一个 <= x 的元素while(i < j && a[j] > x) j--;//把找到的元素放到位置 i 上if(i < j) a[i++] = a[j];//再从左往右找到第一个 >= x 的元素while(i < j && a[i] < x) i++;//把找到的元素放到位置 j 上if(i < j) a[j--] = a[i];}//最后，i 和 j 同时指向了同一个位置 p//我们就把 a[p] 的值赋为 x//x 的位置就已经确定了a[i] = x;//再递归的处理剩下的两个区间，即 [l , p - 1] 和 [p + 1 , r]quick_sort(l,i-1);quick_sort(i+1,r);
}

我们可以试着完成一下，这道快速排序的模板题

完整代码：

#include <iostream>
#include <algorithm>using namespace std;const int N = 1e5+10;
int a[N];void quick_sort(int l,int r){if(l >= r) return;int x = a[l];int i = l ,j = r;while(i < j){while(i < j && a[j] > x) j--;if(i < j) a[i++] = a[j];while(i < j && a[i] < x) i++;if(i < j) a[j--] = a[i];}a[i] = x;quick_sort(l,i-1);quick_sort(i+1,r);
}int main(){int n;cin>>n;for(int i = 1;i <= n;i++) scanf("%d",&a[i]);quick_sort(1,n);for(int i = 1;i <= n;i++) printf("%d ",a[i]);return 0;
}

点击提交之后，会发现有两个测试点 TLE了，也就是超时了。。。

在这里插入图片描述

实际上快速排序的 平均时间复杂度是 $O (n l o g n)$ 的，最坏时间复杂度是 $O(n^2)$ 的。

上面我们提交的那份代码，就被这两个测试点的数据卡到了 $O(n^2)$ 。

题目的数据范围：

在这里插入图片描述
$N最大是 10^5，N^2 = 10^{10}$ 。一般的 OJ ，1s只能计算 $10^8$ ，所以肯定会超时。

为什么会被卡到 $O(n^2)$ ？

我们试着对这个数组 $a = [1, 2, 3, 4, 5, 6, 7]$ ，区间 $[0, 6]$ 进行排序。

在这里插入图片描述
首先我们先要从右往左找到 第一个小于等于 $1$ 的元素。

没有找到小于等于 $1$ 的元素，但是两个指针相遇了， $1$ 的位置确定了。

在这里插入图片描述
接下来对区间 $[1, 6]$ 的元素进行排序。

在这里插入图片描述
首先我们先要从右往左找到 第一个小于等于 $2$ 的元素。

没有找到小于等于 $2$ 的元素，但是两个指针相遇了， $2$ 的位置确定了。

在这里插入图片描述
接下来对区间 $[2, 6]$ 的元素进行排序。

在这里插入图片描述
。。。。

我们发现对于数组 $a = [1, 2, 3, 4, 5, 6, 7]$ ，区间 $[0, 6]$ ，我们要递归的区间分别为：

$[0, 6]$ ，指针移动的次数为6
$[1, 6]$ ，指针移动的次数为5
$[2, 6]$ ，指针移动的次数为4
$[3, 6]$ ，指针移动的次数为3
$[4, 6]$ ，指针移动的次数为2
$[5, 6]$ ，指针移动的次数为1

总结：如果我们选择区间的第一个元素，也就是 $a [l]$ 当作基准元素 $x$ 的话。对于这种已经排好序的数组，再进行排序的话，一共会递归 $n - 1$ 层。第一层指针扫过的次数为 $n - 1$ ;第二层指针扫过的次数为 $n - 2$ ；第三层指针扫过的次数为 $n - 3$ .。。。

$\frac{n(n-1)}{2}$

故，时间复杂度是 $O(n^2)$ 。

取区间的第一个元素作为基准元素 $x$ 的话，是可以构造出一组数据直接把你卡成 $O(n^2)$ 的。同理，取最后一个元素或者是取中间那个元素，也是可以构造出把你卡成 $O(n^2)$ 的数据的。

正确的做法：对于区间 $[l, r]$ ，我们应该是随机选择一个元素当作基准元素 $x$ 。

代码：

    //随机选择swap(a[l] , a[l + rand() % (r - l + 1)]);int x = a[l];

我们先将第一个元素 $a [l]$ 和区间 $[l, r]$ 中随机一个元素交换，再选择 $a [l]$ 当作 $x$ ，这样就相当于直接从 $[l, r]$ 中随机选择了一个元素。

正确的代码：

#include <iostream>
#include <algorithm>using namespace std;const int N = 1e5+10;
int a[N];void quick_sort(int l,int r){if(l >= r) return;//随机选择swap(a[l] , a[l + rand() % (r - l + 1)]);int x = a[l];int i = l ,j = r;while(i < j){while(i < j && a[j] > x) j--;if(i < j) a[i++] = a[j];while(i < j && a[i] < x) i++;if(i < j) a[j--] = a[i];}a[i] = x;quick_sort(l,i-1);quick_sort(i+1,r);
}int main(){int n;cin>>n;for(int i = 1;i <= n;i++) scanf("%d",&a[i]);quick_sort(1,n);for(int i = 1;i <= n;i++) printf("%d ",a[i]);return 0;
}