C++笔记20•数据结构:哈希(Hash)•

ops/2024/12/22 15:02:04/

哈希

1.无序的关联式容器(unordered_map&unordered_set) 

unordered_map与unordered_set几乎与map与set是一样的,只是性能unordered_map与unordered_set比map与set更优一些。还有就是unordered_map与unordered_set是无序的,map与set是有序的(会将数据进行排序)。

unordered_map:官方实现

unordered_set:官方实现

unordered_map、unordered_set与map、set对比与联系

  • 都可以可以实现key和key/value的搜索场景,并且功能和使用基本一样。
  • map/set的底层是使用红黑树实现的,遍历出来是有序的,增删查改的时间复杂度是0(logN)
  • unordered_map/unordered_set的底层是使用哈希表实现的,遍历出来是无序的,增删查改的时间复杂度是O(1)(不是1次,是常数次),说明性能map/set更一些
  • map和set是双向迭代器,unordered_map和unorded_set是单向迭代器。
  • unordered系列的关联式容器之所以效率比较高,是因为其底层使用了哈希结构。

2.哈希表

2.1哈希概念:

     顺序结构以及平衡树中,元素关键码与其存储位置之间没有对应的关系,因此在查找一个元素 时,必须要经过关键码的多次比较 顺序查找时间复杂度为 O(N) ,平衡树中为树的高度,即 O(log N),搜索的效率取决于搜索过程中元素的比较次数。
      ※理想的搜索方法:可以不经过任何比较,一次直接从表中得到要搜索的元素。
    如果构造一种存储结构,通过某种函数 (hashFunc) 使元素的存储位置与它的关键码之间能够建立 一一映射的关系,那么在查找时通过该函数可以很快找到该元素
解释说明插入和搜索:
当向该结构中:
插入元素
根据待插入元素的关键码,以此函数计算出该元素的存储位置并按此位置进行存放
搜索元素
对元素的关键码进行同样的计算,把求得的函数值当做元素的存储位置,在结构中按此位置
取元素比较, 若关键码相等,则搜索成功
       该方式即为哈希 ( 散列 ) 方法, 哈希方法中使用的转换函数称为哈希 ( 散列 ) 函数,构造出来的结构称 哈希表 (Hash Table)( 或者称 散列表 )。
举例:
数据集合 {1 7 6 4 5 9}
哈希函数设置为: hash(key) = key % capacity ;
key为待插入的值(1 7 6 4 5 9)
capacity为存储元素底层空间总的大小(申请的存储空间的容量)。
但是:这种插入看似合理,但是也有很大的弊端, 如果插入11呢?
hash(11)=11%10=1,1映射过去,1的位置已经被占了。这个问题就是 哈希冲突
2.2哈希冲突
     对于两个数据元素的关键字key_i和 key_j(i != j),有key_i != key_j,但有:Hash(key_i) == Hash(key_j),即:不同关键字通过相同哈希哈数计算出相同的哈希地址,该种现象称为哈希冲突 或哈希碰撞
       引起哈希冲突的一个原因可能是: 哈希函数设计不够合理
       哈希函数设计原则
  •  哈希函数的定义域必须包括需要存储的全部关键码,而如果散列表允许有m个地址时,其值域必须在0m-1之间
  • 哈希函数计算出来的地址能均匀分布在整个空间中
  • 哈希函数应该比较简单
2.3常用的哈希函数:
2.3.1 . 直接定址法 --( 常用 )
取关键字的某个线性函数为散列地址: Hash Key = A*Key + B
优点:简单、均匀
缺点:需要事先知道关键字的分布情况
使用场景:适合查找比较小且连续的情况
2.3.2. 除留余数法--(常用)
设散列表中允许的 地址数为 m ,取一个不大于 m ,但最接近或者等于 m 的质数 p 作为除数,
按照哈希函数: Hash(key) = key% p(p<=m), 将关键码转换成哈希地址
2.3.3 . 平方取中法 --( 不常用 )
假设关键字为 1234 ,对它平方就是 1522756 ,抽取中间的 3 227 作为哈希地址;
再比如关键字为 4321 ,对它平方就是 18671041 ,抽取中间的 3 671( 710) 作为哈希地址
平方取中法比较适合:不知道关键字的分布,而位数又不是很大的情况
2.3.4 . 折叠法 --(不常用 )
折叠法是将关键字从左到右分割成位数相等的几部分 ( 最后一部分位数可以短些 ) ,然后将这
几部分叠加求和,并按散列表表长,取后几位作为散列地址。
折叠法适合事先不需要知道关键字的分布,适合关键字位数比较多的情况
注意:哈希函数设计的越精妙,产生哈希冲突的可能性就越低,但是无法避免哈希冲突
2.4哈希冲突解决方法:解决哈希冲突两种常见的方法是:闭散列开散列
2.4.1 闭散列
闭散列:也叫开放定址法,当发生哈希冲突时,如果哈希表未被装满,说明在哈希表中必然还有 空位置,那么可以把 key 存放到冲突位置中的 下一个 空位置中去。
  • 线性探测 :  从发生冲突的位置开始,依次向后探测,直到寻找到下一个空位置为止,一次只前进一个
  • 二次探测 :  从发生冲突的位置开始,依次向后探测,直到寻找到下一个空位置为止一次前进i^2个

2.4.2 开散列

     开散列法又叫链地址法 ( 开链法 ) ,首先对关键码集合用散列函数计算散列地址,具有相同地 址的关键码归于同一子集合,每一个子集合称为一个桶,各个桶中的元素通过一个单链表链 接起来,各链表的头结点存储在哈希表中。所以这个哈希表也就是一个存储节点指针的指针数组。
开散列中每个桶中放的都是发生哈希冲突的元素


http://www.ppmy.cn/ops/107900.html

相关文章

力扣 55题 跳跃游戏 记录

题目描述 给你一个非负整数数组 nums &#xff0c;你最初位于数组的 第一个下标 。数组中的每个元素代表你在该位置可以跳跃的最大长度。判断你是否能够到达最后一个下标&#xff0c;如果可以&#xff0c;返回 true &#xff1b;否则&#xff0c;返回 false 。示例 1&#xff…

sv标准研读第一章-综述

第1章 综述 1.1范围 本标准为IEEE 1800™SystemVerilog语言提供了语法和语义的定义&#xff0c;这是一种统一的硬件设计、规范和验证语言。该标准包括对行为级、寄存器传输级(RTL)和门级硬件描述、testbentch、coverage、assertion、面向对象和约束随机结构的支持&#xff0c…

免费无广告的音乐播放软件

酷狗音乐概念版可以免费听歌&#xff0c;但是新版本会有很多广告。 实测v2.4.2这个版本的最好用&#xff0c;没有广告和花里胡哨的功能&#xff0c;点播放后会自动签到领1日会员&#xff0c;音乐不会断播。 如果遇到暂时没有版权的歌&#xff0c;直接点击收藏&#xff0c;再到…

【大数据分析与挖掘算法】matlab实现——Apriori关联规则算法

实验一 &#xff1a;Apriori关联规则算法 一、实验目的 掌握有关Apriori关联规则算法的理论知识&#xff0c;从中了解关联规则的数学模型、基本思想、方法及应用。 二、实验任务 根据某超市的五条客户购物清单记录&#xff0c;使用Apriori关联规则算法进行计算&#xff0c;…

TCP远程命令执行

目录 一. 命令集 二. 命令执行模块实现 三. 服务端模块实现 四. 服务端调用模块实现 五. 客户端模块实现 六. 效果展示 此篇教大家如何利用TCP进行远程命令执行。 一. 命令集 将值得信任的命令放进一个txt文件中&#xff0c;执行命令时&#xff0c;就去这…

芯旺微,车规级32位MCU KF32A芯片简介

文章目录 1. 产品功能特点2. 行业应用3. 开发环境(IDE)4. 开发资源5. KungFu 内核参考1. 产品功能特点 2. 行业应用 汽车照明汽车车窗控制汽车空调面板汽车控制器3. 开发环境(IDE)

人工智能中的RAG指的是什么

目录 RAG的工作原理 RAG的优势 应用场景 例子 总结 在人工智能领域&#xff0c;RAG&#xff08;Retrieval-Augmented Generation&#xff0c;检索增强生成&#xff09;是一种结合检索和生成技术的模型架构。它将外部知识库中的信息检索与大规模语言模型&#xff08;如GPT&…

【大疆 SDR 图传 P1 】 功能拆解,通信功能剖析

大疆 SDR 图传 P1 拆解视频P1 SoC1、哲酷2、小米3、大疆&#xff08;文章主角&#xff09; 一、为什么说SDR技术1、sdr 软件无线电2、影视博主的测评方法3、第一个说自己SDR的还是这个老登 二、大疆的图传发展历程1、FPGA AD93632、 P1 自研1、2个DSP和一个CPU A72、音频子系统…