优先级队列 ( PriorityQueue )

news/2024/10/9 5:54:15/

文章目录

  • 前言
  • 一、优先级队列
    • 1.1、概念
  • 二、优先级队列的模拟实现
    • 2.1、堆的概念
    • 2.2、堆的存储方式 
    • 2.3、堆的创建
    • 2.4、堆的插入与删除
  • 三、常用接口介绍
    • 3.1、Top-k问题
    • 3.2、使用PriorityQueue创建大小堆,解决TOPK问题

前言

        前几篇我们讲解过队列,其是一种先进先出(FIFO)的数据结构,但在某些特殊情况下,我们操作的数据可能拥有优先级,在出队列时需要优先级高的数据先出。比如排队检票时,我们经常看到“军人优先”;或者我们在电脑玩游戏时,如果有电话打过来,我们会先处理未接电话。在此情况下使用队列显然很不合适。那么我们就要引入优先级队列(堆)


一、优先级队列

1.1、概念

        提供返回最高优先级对象和添加新的对象的两个最基本的操作的数据结构就是优先级队列(Priority Queue)

二、优先级队列的模拟实现

2.1、堆的概念

      如果有一个关键码的集合K = {k0,k1, k2,…,kn-1},把它的所有元素按完全二叉树的顺序存储方式存储在一个一维数组中,并满足:(Ki = K2i+1 且 Ki >= K2i+2) i = 0,1,2…,则称为小堆(或大堆)。将根节点最大的堆叫做最大堆大根堆,根节点最小的堆叫做最小堆小根堆。  

堆的性质:

       \, \square\, 堆中某个节点的值总是不大于或不小于其父节点的值;

        \square 堆总是一棵完全二叉树。

2.2、堆的存储方式 

     堆是一棵完全二叉树,因此可以层序的规则采用顺序的方式来高效存储

 注意:对于非完全二叉树,则不适合使用顺序方式进行存储,因为为了能够还原二叉树,空间中必须要存储空节点,就会导致空间利用率比较低。

     将元素存储到数组中后,可以根据二叉树章节的性质5对树进行还原。假设i为节点在数组中的下标,则有:

\bullet  如果 i 为0,则i表示的节点为根节点,否则i节点的双亲节点为 (i - 1) / 2

\bullet  如果2 * i + 1 小于节点个数,则节点i的左孩子下标为2 * i + 1,否则没有左孩子

\bullet  如果2 * i + 2 小于节点个数,则节点i的右孩子下标为2 * i + 2,否则没有右孩子

2.3、堆的创建

    对于集合{ 27,15,19,18,28,34,65,49,25,37 }中的数据,如果将其创建成堆呢? 

2.3.1、堆的向下调整 

     仔细观察上图后发现:根节点的左右子树已经完全满足堆的性质,因此只需将根节点向下调整好即可。 

向下过程(以小堆为例):

  1. 让parent标记需要调整的节点,child标记parent的左孩子(注意:parent如果有孩子一定先是有左孩子)

  2. 如果parent的左孩子存在,即:child < size, 进行以下操作,直到parent的左孩子不存在       

        \bullet parent右孩子是否存在,存在找到左右孩子中最小的孩子,让child进行标记

        \bullet parent与较小的孩子child比较,如果:

                \bullet  parent小于较小的孩子child,调整结束

                \bullet 否则:交换parent与较小的孩子child,交换完成之后,parent中大的元素向下移动,可能导致子树不满足对的性质,因此需要继续向下调整,即 parent = child;child = parent*2+1; 然后继续第2步

public class Heap {public int[] arr;public int usedSize=0;public Heap(){this.arr=new int[10];}public void initHeap(int[] array){for (int i = 0; i < arr.length; i++) {this.arr[i]= array[i];this.usedSize++;}}public void siftDown(int parent,int usedSize){int child=parent*2+1;while(child<usedSize){if(child+1<usedSize&&arr[child]<arr[child+1]){child++;}if(arr[child]>arr[parent]){int tmp=arr[child];arr[child]=arr[parent];arr[parent]=tmp;parent=child;child=2*parent+1;}else{break;}}}

   注意:在调整以parent为根的二叉树时,必须要满足parent的左子树和右子树已经是堆了才可以向下调整。

2.3.2、堆的创建

    对于普通的序列{1,5,3,8,7,6},左右子树不满足堆的特性,如何创建堆呢?

代码如下:

public void createHeap(){for (int parent = (this.usedSize-1-1)/2; parent >= 0; parent--) {siftDown(parent,this.usedSize);}}

2.4、堆的插入与删除 

2.4.1、堆的插入

    堆的插入总共需要两个步骤:

1. 先将元素放入到底层空间中(注意:空间不够时需要扩容)

2. 将最后新插入的节点向上调整,直到满足堆的性质

    例如插入“10” 元素,先放在堆的底部,然后进行调整:

 public void push(int val){if(isFull()){arr=Arrays.copyOf(arr,arr.length*2);}arr[usedSize]=val;siftUp(usedSize);this.usedSize++;}public boolean isFull(){return this.usedSize==arr.length;}

 2.4.2、堆的删除

注意:堆的删除一定删除的是堆顶元素。

具体如下:

1. 将堆顶元素和堆中最后一个元素交换

2. 将堆中有效数据个数减少一个

3. 对堆顶元素进行向下调整

三、堆的应用

3.1、Top-k问题

TOP-K问题:即求数据集合中前K个最大的元素或者最小的元素,一般情况下数据量都比较大。

比如:专业前10名、世界500强、富豪榜、游戏中前100的活跃玩家等。

对于Top-K问题,能想到的最简单直接的方式就是排序,但是:如果数据量非常大,排序就不太麻烦了(可能数据都不能一下子全部加载到内存中)。最佳的方式就是用堆来解决,基本思路如下:

        1. 用数据集合中前K个元素来建堆

                 \bullet  前k个最大的元素,则建小堆

                 \bullet  前k个最小的元素,则建大堆

        2. 用剩余的N-K个元素依次与堆顶元素来比较,不满足则替换堆顶元素 将剩余N-K个元素依次与堆顶元素比完之后,堆中剩余的K个元素就是所求的前K个最小或者最大的元素

最小K个数icon-default.png?t=O83Ahttps://leetcode.cn/problems/smallest-k-lcci/description/解题代码:

class IntCmp implements Comparator<Integer>{public int compare(Integer o1,Integer o2){return o2.compareTo(o1);}
}
class Solution {public int[] smallestK(int[] arr, int k) {PriorityQueue<Integer> priorityQueue=new PriorityQueue<>(new IntCmp());int[] ret=new int[k];if(arr==null||k==0){return ret;}for(int i=0;i<k;i++){priorityQueue.offer(arr[i]);}for(int j=k;j<arr.length;j++){int val=priorityQueue.peek();if(val>arr[j]){priorityQueue.poll();priorityQueue.offer(arr[j]);}}for(int i=0;i<k;i++){ret[i]=priorityQueue.poll();}return ret;}
}

 3.2、使用PriorityQueue创建大小堆,解决TOPK问题

//使用比较器创建小根堆
class LessIntComp implements Comparator<Integer>{@Overridepublic int compare(Integer o1, Integer o2) {return o1 - o2;}
}
//使用比较器创建大根堆
class GreaterIntComp implements Comparator<Integer>{@Overridepublic int compare(Integer o1, Integer o2) {return o2 - o1;}
}
public class TestDemo<E> {//求最小的K个数,通过比较器创建大根堆public static int[] smallestK(int[] array, int k) {if(k <= 0) {return new int[k];}GreaterIntComp greaterCmp = new GreaterIntComp();PriorityQueue<Integer> maxHeap = new PriorityQueue<>(greaterCmp);
//先将前K个元素,创建大根堆for(int i = 0; i < k; i++) {maxHeap.offer(array[i]);}
//从第K+1个元素开始,每次和堆顶元素比较for (int i = k; i < array.length; i++) {int top = maxHeap.peek();if(array[i] < top) {maxHeap.poll();maxHeap.offer(array[i]);}}
//取出前K个int[] ret = new int[k];for (int i = 0; i < k; i++) {int val = maxHeap.poll();ret[i] = val;}return ret;}public static void main(String[] args) {int[] array = {4,1,9,2,8,0,7,3,6,5};int[] ret = smallestK(array,3);System.out.println(Arrays.toString(ret));}
}


http://www.ppmy.cn/news/1536499.html

相关文章

三层网络与三层组网

"三层组网"和"三层网络"虽然名字相似&#xff0c;但它们的含义却有所不同 三层网络 三层网络指的是网络层的概念&#xff0c;它工作在OSI模型的第三层——网络层。网络层的主要功能是通过IP地址进行路由和转发数据包。三层网络设备&#xff0c;如路由器或…

怎样查局域网里的所有ip?

如果想高效管理网络设备&#xff0c;识别配置、更新和维护各类连接设备&#xff0c;排查网络故障&#xff0c;提升网络安全性&#xff0c;监控异常 IP 活动&#xff0c;发现潜在威胁等需要知道局域网。那么怎样查局域网里的所有ip呢&#xff1f; 一、局域网IP是什么&#xff1…

npm仓库镜像源

修改镜像源为淘宝镜像:输入以下命令并回车 npm config set registry https://registry.npmmirror.com 修改镜像源为腾讯镜像源&#xff1a;输入以下命令并回车 npm config set registry http://mirrors.cloud.tencent.com/npm/ 修改镜像源为华为镜像源&#xff1a;输入以下命…

Web和UE5像素流送、通信教程

一、web端配置 首先打开Github地址&#xff1a;https://github.com/EpicGamesExt/PixelStreamingInfrastructure 找到自己虚幻引擎对应版本的项目并下载下来&#xff0c;我这里用的是5.3。 打开项目找到PixelStreamingInfrastructure-master > Frontend > implementat…

渗透测试入门学习——使用python脚本自动跟踪csrf_token实现对网站登录界面的暴力破解

目录 写在前面 使用方法 相关代码 写在前面 最近在学习使用Burp Suite时发现其intruder模块无法实现多种模式的混合使用&#xff0c;就如想要暴力破解账号和口令两个区域并同时跟踪网页的csrf_token时BP似乎不能很方便的实现这一功能&#xff0c;于是自己在练习时就想到了用…

Golang 进阶4—— 网络编程

Golang 进阶4—— 网络编程 注意&#xff0c;该文档只适合有编程基础的同学&#xff0c;这里的go教程只给出有区别的知识点 网络编程&#xff1a; 把分布在不同地理区域的计算机与专门的外部设备用通信线路互连成一个规模大&#xff0c;功能强的网络系统&#xff0c;从而使众…

机器学习K近邻算法——分类问题K近邻算法示例

针对“数据8.1”&#xff0c;讲解分类问题的K近邻算法&#xff0c;以V1&#xff08;转型情况&#xff09;为响应变量&#xff0c;以V2&#xff08;存款规模&#xff09;、V3&#xff08;EVA&#xff09;、V4&#xff08;中间业务收入&#xff09;、V5&#xff08;员工人数&…

PHP爬虫:获取商品SKU详细信息的利器

在电子商务领域&#xff0c;SKU&#xff08;Stock Keeping Unit&#xff09;即库存单位&#xff0c;是商品信息管理中的基础元素。获取商品的SKU详细信息对于电商运营者来说至关重要&#xff0c;它直接关系到库存管理、订单处理、客户服务等多个方面。PHP作为一种广泛使用的服务…