【分治】--- 快速选择算法

server/2024/11/26 9:47:30/

 Welcome to 9ilk's Code World

       

(๑•́ ₃ •̀๑) 个人主页:        9ilk

(๑•́ ₃ •̀๑) 文章专栏:     算法Journey  


🏠 颜色划分

📌 题目解析

颜色分类

  • 本题要求我们原地对元数组划分0,1,2三个区域,也就是不能使用辅助数组,同时不能使用库中内置的sort函数。

📌 算法原理

【双指针算法】--- 移动零 && 复写零_移动零 双指针-CSDN博客

在做这道题中,我们可以复习一下移动零的思路。在这道题中也是要求我们对数组进行划分,只不过划分为非0和0两个区域。移动零这道题中可以使用双指针dest和cur来界定非0和0两个区域,当进行遍历数组的指针cur遇到非0的数时,此时需要移动dest将这个非0的数并入[0,dest]区间;当遇到0时,此时0就是在[dest,cur]的区域内,只需让cur继续移动即可;最后直到cur遍历完数组

类比移动零的思路,我们可以先把数组划分为全是2和非2的区域,然后再把非2的区域划分为非1和1的区域

class Solution {
public:// 思路:三指针// 首先将整个数组划分为两块void sortColors(vector<int>& nums) {int cur = 0;int dest = -1;// 第一次划分左边是0,1 右边是2while (cur < nums.size()) {if (nums[cur] == 2)cur++;else {dest++;swap(nums[dest], nums[cur]);cur++;}}// 划分左边区域cur = 0;dest = -1;while (cur < nums.size()) {if (nums[cur] == 2)break;if (nums[cur] == 1)cur++;else if(nums[cur] == 0){dest++;swap(nums[dest], nums[cur]);cur++;}}}
};

我们能否让cur指针遍历完数组的同时,一次性把三个区域划分好呢?

我们可以规定:[0,left]属于全都是0的区域,[left+1,i-1]属于全是1的区域,[right,n-1]属于全都是2

的区域,而同样的我们需要一个遍历数组的指针i,因此[i,right]属于待扫描的区域。

Q:为什么i遇到2交换完后i不能向前移动,而遇到1时可以?

--right之后,right所处的位置是待扫描的,此时交换过来之后不知道是0/1/2,仍然需要处理,需要重新判断;而++left之后,由于left所处的位置是i扫描过的,所以可以放心交换。

Q:i遍历到何时结束?

当i遍历到right时说明三个区域 已经划分完了,没有继续往后走的必要了。

参考代码:

class Solution {
public:void sortColors(vector<int>& nums){int n = nums.size();int left = -1;int i = 0;int right = n;while (i != right){if (nums[i] == 0) swap(nums[++left], nums[i++]);else if (nums[i] == 1)i++;elseswap(nums[--right], nums[i]);}}
};

🏠 排序数组

📌 题目解析

排序数组

  • 本题也不允许使用内置函数比如sort()。

📌 算法原理

本篇博客我们讲解的是快速选择算法,所以本题我们采用快速排序求解下。

先回忆一下简单的一个快速排序的基本思想:

  • 先确定一个基准key。
  • right移动时寻找比key小的,left移动时寻找比key大的。
  • swap(nums[right],nums[left]);
  • 数组被划分为左边是小于key,右边是大于key。
  • 左边部分也按照上述逻辑处理,右边部分也这样处理,直到无法再划分区间。

快速排序整体思想中主要也是对数组进行区域划分,将左边划分为小于等于key,右边划分大于key,但是本道题单纯这样写一个快排是会超时的,当数组都是重复的元素时,此时快排会退化为O(N^2)。如果我们使用前面的"数组分三块"的快速选择算法,此时处理完整个数组,处理左右两边时就不需要处理重复元素了,因为重复元素都被划分进中间区域了

总结步骤:

优化 :  在常规快排中,我们常选取左端的第一个数作为key,当数组接近有序时,此时会退化为O(N^2),此时我们可以采取三数取中/随机数尽可能避免这种极端情况。同时我们选择随机数时可以选择让rand()%(right-left+1)使取值范围为[left,right],再加上left之后就能映射到我们选的区间。

参考代码:

class Solution {
public:void QuickSort(vector<int>& nums, int left, int right){if (left >= right)return;int randi = rand()%(right-left+1);randi += left; //随机数int key = nums[randi];int i = left;int begin =  left  - 1;int end   =  right + 1 ;while (i != end){ if(nums[i] < key)//< key区域swap(nums[++begin],nums[i++]);else if(nums[i] == key)  // ==key区域i++;else // > key区域swap(nums[--end],nums[i]);}//排左边 右边QuickSort(nums, left, begin);QuickSort(nums, end, right);}vector<int> sortArray(vector<int>& nums){srand(time(NULL));QuickSort(nums, 0, nums.size() - 1);return nums;}
};

🏠 数组中的第k大个元素

📌 题目解析

数组中的第K个最大元素

  • 本题需要设计时间复杂度为O(N)的算法

📌 算法原理

  • 思路1:排序 + 计数器
class Solution {
public:int findKthLargest(vector<int>& nums, int k){ sort(nums.begin(),nums.end());int cur = nums.size() - 1;int count = 0;while(count < k){count++;if(count < k)cur--;}// 1 2 3 4 5 6  k = 2return nums[cur];}
};
  • 思路2 :堆排序(Top K)
class Solution {
public:
//建大堆int findKthLargest(vector<int>& nums, int k){ priority_queue<int> pq(nums.begin(),nums.end());while(k>1){pq.pop();k--;}return pq.top();}
};
  • 思路3 :桶排序

   前面两种思路虽然能解决问题,但严格讲并不是O(N)的时间复杂度,而桶排序就完美的符合,但是需要空间换时间,我们可以根据题目给定的数据范围开好数组进行映射。

class Solution {
public:
//桶排序 相对映射 int findKthLargest(vector<int>& nums, int k){ int arr [20001] = {0};//遍历nfor(auto e : nums){arr[e+10000]++;}int num = 0;//遍历20001for(int i = 20000;i>=0;i--){k = k - arr[i];if(k <= 0){num = i-10000;break;}}return num;}
};

基于快速选择算法,我们可以快速划分出三个区域,基于三个区域各自元素个数定位出第k大元素的区间。

参考代码:

class Solution {
public:int QuickSort(vector<int>& nums,int left,int right,int k){if(left == right)return nums[left];int key = nums[left];int begin = left-1;int end = right+1;int i = left;while(i < end){if(nums[i] < key) swap(nums[++begin],nums[i++]);else if(nums[i] == key) i++;else swap(nums[--end],nums[i]);  } // [left,begin] (begin,end) [end,right]int midNum = end - begin - 1;int RightNum = right - end + 1;if (LeftNum >= k) return QuickSort(nums, left, begin, k);else if (midNum + LeftNum >= k) return key;elsereturn QuickSort(nums, end, right, k - midNum - LeftNum);}int findKthLargest(vector<int>& nums, int k){return QuickSort(nums,0,nums.size()-1,k);          }
};

注:考虑到退化的情况我们可以自行采取随机数/三路取中的优化方法。

快速选择算法也常常用于解决TopK问题,和快排不同的是,快速选择并不对左右两部分子数组都进行递归,而只对寻找的目标所在的子数组进行递归。也正因如此,快速选择算法将平均时间复杂度从O(nlogn)降到O(n),而最坏情况下时间复杂度为O(n^2)。同时你也可以这样理解当用基于快速选择的快速排序处理全是重复元素的数组时,一次快速选择就能结束排序了,直接降到O(N)。

  • 思路5:库函数

nth_element函数第一个参数是起始位置,第二个参数是要查找元素的位置,第三个参数是最后一个元素位置+1;nth_element(a,a+k,a+n)意思就是把数组中第k小(默认是第k小)的数放在k下标,而对其他元素没有排序,但是k左边都是比它小的,k右边都是比它大的。如果你想求第k大,可以传第四个参数也就是仿函数,也可以将求第k大转化为求第n-k+1小,对应就是array[n-k];

class Solution
{
public:int findKthLargest(vector<int>& a, int k) {int n = a.size();nth_element(a.begin(),a.begin()+n-k,a.end());return a[n-k];}
};

🏠 最小的k个数

📌 题目解析

最小的k个数

  • 本题要返回的不是第k小的数,而是要返回前k小的所有数,顺序不限。

📌 算法原理

  • 思路1:排序(NlogN)
  • 思路2:堆(Nlogk)
  • 思路3:快速选择算法 O(N)

当快速选择完之后就能把数组划分为三个区域,左边是比第k小还要小的数,中间是第k小,右边是比第k小的数还要大的数,我们直接返回左边和中间即可。

参考代码:

vector<int> getLeastNumbers(vector<int>&nums, int k)
{ srand(time(NULL));qsort(nums,0,nums.size()-1,k);return{nums.begin(),nums.begin()+k
};
void qsort(vector<int>&nums,int l,int 1, int r, int k)
{if(l>=r)return;
//1.随机选择一个基准元素+数组分三块  int key = getRandom(nums,1,r);int left=1,right=right=r +1, i = 1, i = 1;while(i<right){if(nums[i]<key) swap(nums[++left],nums[i++]);else if(nums[i]== key) i++;else swap(nums[--right],nums[i]);}// [1,left][left + 1, right - 1][right,r]//2.分情况讨论int a = left-1+1,b=right-left-1;if(a>k) qsort(nums,1,left,k);else if(a+b>=k)return;else qsort(nums,right,r,k-a - a - b);
}
int getRandom(vector<int>&nums,intl,int l, int r)
{return nums[rand() %(r-1+1)+1)+1) + 1];
}

总结: 本篇博客我们介绍了快速排序的衍生算法快速选择算法,本算法也是基于分治的思想进行快速定位区间,其可以使某些需要 O(nlogn)时间复杂度的问题,在平均复杂度O(n)下完成。常见的例子是求数组的第 k 小的数,Top k问题等,与快排不同的是快速选择只对寻找的的目标所在的子数组进行递归。


http://www.ppmy.cn/server/145019.html

相关文章

git: 修改gitlab仓库提交地址

git: 修改gitlab仓库提交地址 右键git bash here 1、进入到项目my-project所在位置 2、查看当前项目远程仓库地址 3、修改远程仓库地址 4、再次查看新的远程仓库地址以确认修改成功 cd /my-project git remote -v # 查看当前远程仓库地址 git remote set-url origin 新的Gi…

keepalived双机热备方案实现Nginx高可用

问题描述 只用一台Nginx做反向代理&#xff0c;如果这台Nginx出现故障(比如宕机)&#xff0c;则服务不可用。 以下给出keepalived双机热备方案实现Nginx高可用的方法。先介绍几个概念&#xff1a; 高可用 高可用&#xff08;High Availability&#xff09;是指系统或服务能…

初识Linux—— 基本指令(下)

前言&#xff1a; 本篇继续来学习Linux的基础指令&#xff0c;继续加油&#xff01;&#xff01;&#xff01; 本篇文章对于图片即内容详解&#xff0c;已同步到本人gitee&#xff1a;Linux学习: Linux学习与知识讲解 Linux指令 1、查看文件内容的指令 cat ​ cat 查看文件…

招商蛇口|在低密园林里,开启生活的“任意门”

“最好的建筑是这样的&#xff0c;我们深处在其中,却不知道自然在哪里终了&#xff0c;艺术在哪里开始。” 凭借深耕西安10载的城市远见&#xff0c;以及建立在成功人居经验之上的敏锐洞察&#xff0c;招商蛇口将林语堂名言里的生活&#xff0c;变成了现实。 都市化越是加速&…

RabbitMQ 之 死信队列

一、死信的概念 先从概念解释上搞清楚这个定义&#xff0c;死信&#xff0c;顾名思义就是无法被消费的消息&#xff0c;字面意思可以这样理 解&#xff0c;一般来说&#xff0c;producer 将消息投递到 broker 或者直接到 queue 里了&#xff0c;consumer 从 queue 取出消息进行…

2024算法基础公选课练习四(综合2)

一、前言 最后几个题确实有难度&#xff0c;这次有两题没整出来 二、题目总览 三、具体题目 3.1 问题 A: 水题系列1-B(班级排位) 思路 最暴力的思路是写线段树&#xff0c;然后暴力枚举两个端点&#xff0c;总体时间复杂度为O(n^2*logn)最坏会到1e9的数量级&#xff0c;可能…

【Java 学习】详细讲解---包和导包、Scanner类、输入源

1. 包 1.1 什么是包&#xff1f; 举个例子&#xff0c;你和你的同学有不同的家庭&#xff0c;你们都有自己的爸爸妈妈&#xff0c;都有自己的家。在自己的家中你们可以按照自己爱好摆放东西&#xff0c;都互不干扰。但是&#xff0c;假如你们的家都在一起&#xff0c;你们就不…

未来可期:保研后的人工智能研究生活

哈喽&#xff0c;大家好&#xff01;好久没有更新博客了&#xff0c;今天想和大家分享一个好消息&#xff5e; 我已经成功保研至 南昌大学数学与计算机学院&#xff0c;研究方向是 人工智能 -- 人体行为识别。 回顾大学三年的时光&#xff0c;虽然谈不上轰轰烈烈&#xff0c;但…