C++笔记20•数据结构:哈希(Hash)•

news/2024/9/19 4:57:52/ 标签: 笔记, 数据结构, 哈希算法, c++

哈希

1.无序的关联式容器(unordered_map&unordered_set) 

unordered_map与unordered_set几乎与map与set是一样的,只是性能unordered_map与unordered_set比map与set更优一些。还有就是unordered_map与unordered_set是无序的,map与set是有序的(会将数据进行排序)。

unordered_map:官方实现

unordered_set:官方实现

unordered_map、unordered_set与map、set对比与联系

  • 都可以可以实现key和key/value的搜索场景,并且功能和使用基本一样。
  • map/set的底层是使用红黑树实现的,遍历出来是有序的,增删查改的时间复杂度是0(logN)
  • unordered_map/unordered_set的底层是使用哈希表实现的,遍历出来是无序的,增删查改的时间复杂度是O(1)(不是1次,是常数次),说明性能map/set更一些
  • map和set是双向迭代器,unordered_map和unorded_set是单向迭代器。
  • unordered系列的关联式容器之所以效率比较高,是因为其底层使用了哈希结构。

2.哈希表

2.1哈希概念:

     顺序结构以及平衡树中,元素关键码与其存储位置之间没有对应的关系,因此在查找一个元素 时,必须要经过关键码的多次比较 顺序查找时间复杂度为 O(N) ,平衡树中为树的高度,即 O(log N),搜索的效率取决于搜索过程中元素的比较次数。
      ※理想的搜索方法:可以不经过任何比较,一次直接从表中得到要搜索的元素。
    如果构造一种存储结构,通过某种函数 (hashFunc) 使元素的存储位置与它的关键码之间能够建立 一一映射的关系,那么在查找时通过该函数可以很快找到该元素
解释说明插入和搜索:
当向该结构中:
插入元素
根据待插入元素的关键码,以此函数计算出该元素的存储位置并按此位置进行存放
搜索元素
对元素的关键码进行同样的计算,把求得的函数值当做元素的存储位置,在结构中按此位置
取元素比较, 若关键码相等,则搜索成功
       该方式即为哈希 ( 散列 ) 方法, 哈希方法中使用的转换函数称为哈希 ( 散列 ) 函数,构造出来的结构称 哈希表 (Hash Table)( 或者称 散列表 )。
举例:
数据集合 {1 7 6 4 5 9}
哈希函数设置为: hash(key) = key % capacity ;
key为待插入的值(1 7 6 4 5 9)
capacity为存储元素底层空间总的大小(申请的存储空间的容量)。
但是:这种插入看似合理,但是也有很大的弊端, 如果插入11呢?
hash(11)=11%10=1,1映射过去,1的位置已经被占了。这个问题就是 哈希冲突
2.2哈希冲突
     对于两个数据元素的关键字key_i和 key_j(i != j),有key_i != key_j,但有:Hash(key_i) == Hash(key_j),即:不同关键字通过相同哈希哈数计算出相同的哈希地址,该种现象称为哈希冲突 或哈希碰撞
       引起哈希冲突的一个原因可能是: 哈希函数设计不够合理
       哈希函数设计原则
  •  哈希函数的定义域必须包括需要存储的全部关键码,而如果散列表允许有m个地址时,其值域必须在0m-1之间
  • 哈希函数计算出来的地址能均匀分布在整个空间中
  • 哈希函数应该比较简单
2.3常用的哈希函数:
2.3.1 . 直接定址法 --( 常用 )
取关键字的某个线性函数为散列地址: Hash Key = A*Key + B
优点:简单、均匀
缺点:需要事先知道关键字的分布情况
使用场景:适合查找比较小且连续的情况
2.3.2. 除留余数法--(常用)
设散列表中允许的 地址数为 m ,取一个不大于 m ,但最接近或者等于 m 的质数 p 作为除数,
按照哈希函数: Hash(key) = key% p(p<=m), 将关键码转换成哈希地址
2.3.3 . 平方取中法 --( 不常用 )
假设关键字为 1234 ,对它平方就是 1522756 ,抽取中间的 3 227 作为哈希地址;
再比如关键字为 4321 ,对它平方就是 18671041 ,抽取中间的 3 671( 710) 作为哈希地址
平方取中法比较适合:不知道关键字的分布,而位数又不是很大的情况
2.3.4 . 折叠法 --(不常用 )
折叠法是将关键字从左到右分割成位数相等的几部分 ( 最后一部分位数可以短些 ) ,然后将这
几部分叠加求和,并按散列表表长,取后几位作为散列地址。
折叠法适合事先不需要知道关键字的分布,适合关键字位数比较多的情况
注意:哈希函数设计的越精妙,产生哈希冲突的可能性就越低,但是无法避免哈希冲突
2.4哈希冲突解决方法:解决哈希冲突两种常见的方法是:闭散列开散列
2.4.1 闭散列
闭散列:也叫开放定址法,当发生哈希冲突时,如果哈希表未被装满,说明在哈希表中必然还有 空位置,那么可以把 key 存放到冲突位置中的 下一个 空位置中去。
  • 线性探测 :  从发生冲突的位置开始,依次向后探测,直到寻找到下一个空位置为止,一次只前进一个
  • 二次探测 :  从发生冲突的位置开始,依次向后探测,直到寻找到下一个空位置为止一次前进i^2个

2.4.2 开散列

     开散列法又叫链地址法 ( 开链法 ) ,首先对关键码集合用散列函数计算散列地址,具有相同地 址的关键码归于同一子集合,每一个子集合称为一个桶,各个桶中的元素通过一个单链表链 接起来,各链表的头结点存储在哈希表中。所以这个哈希表也就是一个存储节点指针的指针数组。
开散列中每个桶中放的都是发生哈希冲突的元素


http://www.ppmy.cn/news/1525983.html

相关文章

前端深拷贝

什么是 structuredClone()&#xff1f; structuredClone() 是 2022 年引入的全局函数&#xff0c;支持深度克隆 JavaScript 对象。与 JSON.stringify() 和 JSON.parse() 等传统方法不同&#xff0c;它们难以处理复杂的结构和循环引用&#xff0c;而 structuredClone() 可以毫不…

C到C++入门基础知识

一&#xff1a;命名空间&#xff1a;namespace &#xff08;一&#xff09;&#xff1a;命名空间的定义 注&#xff1a;命名空间只能定义在全局&#xff0c;不能定义在函数内部。 &#xff08;1&#xff09;类似于C语言的结构体&#xff0c;C语言的命名空间定义为&#xff1…

【React】React18.2.0核心源码解读

前言 本文使用 React18.2.0 的源码&#xff0c;如果想回退到某一版本执行git checkout tags/v18.2.0即可。如果打开源码发现js文件报ts类型错误请看本人另一篇文章&#xff1a;VsCode查看React源码全是类型报错如何解决。 阅读源码的过程&#xff1a; 下载源码 观察 package…

Docker 数据目录迁移:一篇详细的技术指南

在使用Docker进行容器化部署时,有时我们需要将Docker的数据目录(默认位于/var/lib/docker)迁移到新的位置。这可能是由于磁盘空间不足、存储优化或系统迁移等原因。本文将详细介绍如何将Docker数据目录迁移到新的目录下,包括所有必要的步骤和代码实现。 一、背景知识 Doc…

数据结构————二叉树基础知识(零基础包会的!)

今天带来数据结构二叉树的知识&#xff0c;保证大家不会离散数学或者没有数据结构基础&#xff0c;也能明明白白的。 一&#xff0c;树 1&#xff0c;树的结构 我们在了解什么是二叉树之前我们先了解下什么是树&#xff0c;树是一种非线性的数据结构&#xff0c;它是由n个节点…

Kafka 命令详解及使用示例

文章目录 Kafka 命令详解及使用示例Kafka 命令详解kafka-topics.sh&#xff1a;主题管理创建主题创建带副本的主题修改主题分区数了解分区分布列出主题查看主题详情删除主题 kafka-console-producer.sh&#xff1a;消息生产者发送消息到主题带键值对的消息消息生产性能优化带分…

node前端开发基本设置

加快下载源速度 要将 npm 切换到淘宝的源镜像&#xff0c;你可以按照以下步骤操作&#xff1a; 查看当前 npm 源&#xff1a; npm config get registry这个命令会显示当前使用的 npm 源地址&#xff0c;默认情况下它会是 https://registry.npmjs.org/。 切换到淘宝镜像&#…

基于SpringBoot的校园新闻网站设计与实现

需要项目源码请联系我&#xff0c;目前有各类成品 毕设 javaweb ssh ssm springboot等等项目框架&#xff0c;源码丰富。 专业团队&#xff0c;咨询就送开题报告&#xff0c;活动限时免费&#xff0c;有需要的朋友可以来留言咨询。 一、摘要 本论文主要论述了如何使用JAVA语言…

CISC 和 RISC 架构的对比

研究 RISC 架构优缺点的最简单方法是将其与其前身进行对比&#xff1a; CISC&#xff08;复杂指令集计算机&#xff09;架构。 内存中的两个数字相乘 右图表示一台普通计算机的存储方案。 主存储器被划分为编号从&#xff08;行&#xff09;1&#xff1a;&#xff08;列&…

计算机组成原理(第二次笔记)

各种码 真值 (书写用)&#xff1a; 将用“”、“-” 表示正负的二进制数称为真值 机器不能识别书写格式&#xff0c;故用“0/1”表示“/-”符号。 机器码 (机器内部使用)&#xff1a; 将符号和数值一起编码表示的二进制数称为机器码。 常用机器码&#xff1a;原码、 反码、 补…

Centos 执行yum安装 出现Failed connect to mirrors.163.com:80; 拒绝连接

错误如下: http://mirrors.163.com/centos/7/os/x86_64/repodata/repomd.xml: [Errno 14] curl#7 - "Failed connect to mirrors.163.com:80; 拒绝连接 解决办法&#xff1a; 换镜像源地址 添加阿里的源 wget -O /etc/yum.repos.d/CentOS-Base.repo http://mirrors.al…

OCR 通用端到端模型GOT

摘要 在人工智能领域&#xff0c;光学字符识别&#xff08;OCR&#xff09;技术已经取得了显著的进展。随着技术的不断进步&#xff0c;我们正迈向OCR 2.0时代。本文将介绍由Vary团队开发的通用端到端模型GOT&#xff0c;这一模型在OCR领域具有革命性的潜力。 论文概览 论文…

一. rpc基本学习

1. 什么是rpc&#xff0c;为什么有了http还要rpc 我们常说的http&#xff0c;应该是说的http1&#xff0c;http只是应用层的一个协议 Rpc是一种调用方式&#xff0c;全称叫远程过程调用&#xff0c;对应本地调用&#xff0c;rpc是一种调用方式&#xff0c;不是一种协议 更具体…

Qt与MQTT交互通信

MQTT全称是&#xff08;Message Queuing Telemetry Transport&#xff09;&#xff0c;即消息队列遥测传输协议 是一种基于发布/订阅&#xff08;Publish/Subscribe&#xff09;模式的轻量级通讯协议&#xff0c;并且该协议构建于TCP/IP协议之上&#xff0c;常用于互联网中&am…

【贪心算法】(二)贪心算法区间问题及进阶习题

贪心算法区间问题及进阶习题 贪心算法解决区间问题跳跃问题1. 跳跃游戏2. 跳跃游戏 Ⅱ 重叠区间问题3. 用最少数量的箭引爆气球4. 无重叠区间5. 划分字母区间6. 合并区间 其他问题7. 最大子序和8. 加油站9. 监控二叉树 贪心算法解决区间问题 跳跃问题 对于跳跃问题这一类问题&…

《OpenCV计算机视觉》—— 图像轮廓检测与绘制

文章目录 一、轮廓的检测二、轮廓的绘制图像轮廓检测与绘制的代码实现 三、轮廓的近似 一、轮廓的检测 轮廓检测是指在包含目标和背景的数字图像中&#xff0c;忽略背景和目标内部的纹理以及噪声干扰的影响&#xff0c;采用一定的技术和方法来实现目标轮廓提取的过程注意:做轮…

数据格式:什么是JSON和XML

JSON和XML都是数据交换的一种格式&#xff0c;用于在不同的系统和应用程序之间传输和存储数据。本文将解释JSON和XML的基础内容&#xff0c;并探讨两者的不同。 一 什么是JSON&#xff1f; 1. JSON&#xff08;JavaScript Object Notation&#xff09;即JavaScript对象标记法…

ThinkPHP Email功能如何配置才能发送邮件?

ThinkPHP Email发送流程&#xff1f;使用ThinkPHP发Email方法&#xff1f; ThinkPHP作为一款流行的PHP框架&#xff0c;提供了强大的Email功能&#xff0c;使得开发者能够轻松实现邮件发送。AokSend将详细介绍如何配置ThinkPHP Email功能&#xff0c;以确保邮件能够顺利发送。…

【Go】Go语言基本语法--注释、变量、常量

✨✨ 欢迎大家来到景天科技苑✨✨ &#x1f388;&#x1f388; 养成好习惯&#xff0c;先赞后看哦~&#x1f388;&#x1f388; &#x1f3c6; 作者简介&#xff1a;景天科技苑 &#x1f3c6;《头衔》&#xff1a;大厂架构师&#xff0c;华为云开发者社区专家博主&#xff0c;…

【C++】vector常见用法

&#x1f525;个人主页&#x1f525;&#xff1a;孤寂大仙V &#x1f308;收录专栏&#x1f308;&#xff1a;C从小白到高手 &#x1f339;往期回顾&#x1f339;&#xff1a;[C]string类 &#x1f516; 流水不争&#xff0c;争的是滔滔不息。 文章目录 一、vector的介绍vector…