C++笔记20•数据结构:哈希(Hash)•

devtools/2024/9/19 11:11:19/ 标签: 笔记, 数据结构, 哈希算法, c++

哈希

1.无序的关联式容器(unordered_map&unordered_set) 

unordered_map与unordered_set几乎与map与set是一样的,只是性能unordered_map与unordered_set比map与set更优一些。还有就是unordered_map与unordered_set是无序的,map与set是有序的(会将数据进行排序)。

unordered_map:官方实现

unordered_set:官方实现

unordered_map、unordered_set与map、set对比与联系

  • 都可以可以实现key和key/value的搜索场景,并且功能和使用基本一样。
  • map/set的底层是使用红黑树实现的,遍历出来是有序的,增删查改的时间复杂度是0(logN)
  • unordered_map/unordered_set的底层是使用哈希表实现的,遍历出来是无序的,增删查改的时间复杂度是O(1)(不是1次,是常数次),说明性能map/set更一些
  • map和set是双向迭代器,unordered_map和unorded_set是单向迭代器。
  • unordered系列的关联式容器之所以效率比较高,是因为其底层使用了哈希结构。

2.哈希表

2.1哈希概念:

     顺序结构以及平衡树中,元素关键码与其存储位置之间没有对应的关系,因此在查找一个元素 时,必须要经过关键码的多次比较 顺序查找时间复杂度为 O(N) ,平衡树中为树的高度,即 O(log N),搜索的效率取决于搜索过程中元素的比较次数。
      ※理想的搜索方法:可以不经过任何比较,一次直接从表中得到要搜索的元素。
    如果构造一种存储结构,通过某种函数 (hashFunc) 使元素的存储位置与它的关键码之间能够建立 一一映射的关系,那么在查找时通过该函数可以很快找到该元素
解释说明插入和搜索:
当向该结构中:
插入元素
根据待插入元素的关键码,以此函数计算出该元素的存储位置并按此位置进行存放
搜索元素
对元素的关键码进行同样的计算,把求得的函数值当做元素的存储位置,在结构中按此位置
取元素比较, 若关键码相等,则搜索成功
       该方式即为哈希 ( 散列 ) 方法, 哈希方法中使用的转换函数称为哈希 ( 散列 ) 函数,构造出来的结构称 哈希表 (Hash Table)( 或者称 散列表 )。
举例:
数据集合 {1 7 6 4 5 9}
哈希函数设置为: hash(key) = key % capacity ;
key为待插入的值(1 7 6 4 5 9)
capacity为存储元素底层空间总的大小(申请的存储空间的容量)。
但是:这种插入看似合理,但是也有很大的弊端, 如果插入11呢?
hash(11)=11%10=1,1映射过去,1的位置已经被占了。这个问题就是 哈希冲突
2.2哈希冲突
     对于两个数据元素的关键字key_i和 key_j(i != j),有key_i != key_j,但有:Hash(key_i) == Hash(key_j),即:不同关键字通过相同哈希哈数计算出相同的哈希地址,该种现象称为哈希冲突 或哈希碰撞
       引起哈希冲突的一个原因可能是: 哈希函数设计不够合理
       哈希函数设计原则
  •  哈希函数的定义域必须包括需要存储的全部关键码,而如果散列表允许有m个地址时,其值域必须在0m-1之间
  • 哈希函数计算出来的地址能均匀分布在整个空间中
  • 哈希函数应该比较简单
2.3常用的哈希函数:
2.3.1 . 直接定址法 --( 常用 )
取关键字的某个线性函数为散列地址: Hash Key = A*Key + B
优点:简单、均匀
缺点:需要事先知道关键字的分布情况
使用场景:适合查找比较小且连续的情况
2.3.2. 除留余数法--(常用)
设散列表中允许的 地址数为 m ,取一个不大于 m ,但最接近或者等于 m 的质数 p 作为除数,
按照哈希函数: Hash(key) = key% p(p<=m), 将关键码转换成哈希地址
2.3.3 . 平方取中法 --( 不常用 )
假设关键字为 1234 ,对它平方就是 1522756 ,抽取中间的 3 227 作为哈希地址;
再比如关键字为 4321 ,对它平方就是 18671041 ,抽取中间的 3 671( 710) 作为哈希地址
平方取中法比较适合:不知道关键字的分布,而位数又不是很大的情况
2.3.4 . 折叠法 --(不常用 )
折叠法是将关键字从左到右分割成位数相等的几部分 ( 最后一部分位数可以短些 ) ,然后将这
几部分叠加求和,并按散列表表长,取后几位作为散列地址。
折叠法适合事先不需要知道关键字的分布,适合关键字位数比较多的情况
注意:哈希函数设计的越精妙,产生哈希冲突的可能性就越低,但是无法避免哈希冲突
2.4哈希冲突解决方法:解决哈希冲突两种常见的方法是:闭散列开散列
2.4.1 闭散列
闭散列:也叫开放定址法,当发生哈希冲突时,如果哈希表未被装满,说明在哈希表中必然还有 空位置,那么可以把 key 存放到冲突位置中的 下一个 空位置中去。
  • 线性探测 :  从发生冲突的位置开始,依次向后探测,直到寻找到下一个空位置为止,一次只前进一个
  • 二次探测 :  从发生冲突的位置开始,依次向后探测,直到寻找到下一个空位置为止一次前进i^2个

2.4.2 开散列

     开散列法又叫链地址法 ( 开链法 ) ,首先对关键码集合用散列函数计算散列地址,具有相同地 址的关键码归于同一子集合,每一个子集合称为一个桶,各个桶中的元素通过一个单链表链 接起来,各链表的头结点存储在哈希表中。所以这个哈希表也就是一个存储节点指针的指针数组。
开散列中每个桶中放的都是发生哈希冲突的元素


http://www.ppmy.cn/devtools/112723.html

相关文章

本专题大纲

本文为本专题大纲&#xff0c;附有超链接方便索引。 GO&#xff01;GO&#xff01;GO&#xff01;概念 《绿⽪书》 第⼀章&#xff1a;验证导论 笔记 《验证漫游指南》 第⼀章&#xff1a;芯⽚验证全视第⼆章&#xff1a;验证的策略第三章&#xff1a;验证的⽅法第四章&am…

opencv彩色图像转灰度图原理

opencv彩色图像转灰度图原理 在OpenCV中&#xff0c;将彩色图像转换为灰度图像的基本原理是使用颜色空间转换的方法。具体来说&#xff0c;OpenCV提供了cvtColor函数&#xff0c;它可以将图像从一个颜色空间转换到另一个。 对于从BGR颜色空间&#xff08;OpenCV中的默认彩色图…

【ARM】中断术语介绍

外设产生中断给到gic&#xff0c;gic通过内部判断此中断是FIQ还是IRQ&#xff0c;这个过程就称为assert&#xff08;断言&#xff09; 此中断被发到哪里面去叫target cpu跳转到此中断的中断向量表中叫做taken 整个过程就做routing distribute决定将中断发给哪个cpu&#xff08…

Linux线程同步:深度解析条件变量接口

&#x1f351;个人主页&#xff1a;Jupiter. &#x1f680; 所属专栏&#xff1a;Linux从入门到进阶 欢迎大家点赞收藏评论&#x1f60a; 目录 &#x1f351;Linux线程同步&#x1f409;条件变量---实现线程同步&#x1f4a7;同步概念与竞态条件&#x1f406;条件变量接口*初始…

JNI 详细介绍

一 介绍 java调⽤c&#xff0c;c代码可以通过JNIEnv执行java代码。 安卓NDK 已经对JNI环境进行了集成&#xff0c;我们可以通过android studio来快速搭建一个项目。 二 项目搭建 打开android studio 创建工程&#xff0c;创建工程选择模板Native C 三 模板格式介绍 生成的…

Python数据分析及可视化教程--商城订单为例-适用电商相关进行数据分析---亲测可用!!!!

前言:Python 是进行数据分析和可视化的强大工具,常用的库包括 Pandas、NumPy、Matplotlib 和 Seaborn。以下是一个基本的教程概述,介绍了如何使用这些库来进行数据分析和可视化: Python数据分析及可视化教程 1、 环境准备2、数据准备3、开始数据分析3.1、导入库3.2、加载数…

深入理解数据分析的使用流程:从数据准备到洞察挖掘

数据分析是企业和技术团队实现价值的核心。 5 秒内你能否让数据帮你做出决策&#xff1f; 通过本文&#xff0c;我们将深入探讨如何将原始数据转化为有意义的洞察&#xff0c;帮助你快速掌握数据分析的关键流程。 目录 数据分析的五个核心步骤1. 数据获取常用数据获取方式 2. 数…

《C++模板元编程:高效实现编译期斐波那契数列计算》

在 C的神秘世界里&#xff0c;模板元编程犹如一把神奇的钥匙&#xff0c;能打开许多高性能编程的大门。今天&#xff0c;我们就来深入探讨如何在 C的模板元编程中实现一个在编译期计算斐波那契数列的算法&#xff0c;同时确保在面对非常大的输入时不会导致编译时间过长。 一、…

【开发环境搭建】Macbook M1搭建Java开发环境

JDK 安装与配置 下载并安装 JDK&#xff1a; ARM64 DMG 安装包下载链接&#xff1a;JDK21 for Mac (ARM64)。双击下载的 DMG 文件&#xff0c;按照提示安装 JDK。 配置环境变量&#xff1a; 打开终端&#xff0c;使用 vim 编辑 .bash_profile 文件&#xff1a; vim ~/.bash_pr…

_Array类,类似于Vector,其实就是_string

例子&#xff1a; using namespace lf; using namespace std;int main() {_Array<int> a(10, -1);_Array<_string> s { _t("one"), _t("two") };_pcn(a);_pcn(s);} 结果&#xff1a; 源代码_Array.h&#xff1a; /***********************…

直播相关03-录制麦克风声音, ffmpeg 命名,使用命令行完成录音

一 ffmpeg 命令 ffmpeg arg1 arg2 -i arg3 arg4 arg5ffmpeg 全局参数 输入文件参数 -i 输入文件 输出文件参数 输出文件arg1&#xff1a;全局参数 arg2&#xff1a;输入文件参数 arg3&#xff1a;输入文件 arg4&#xff1a;输出文件参数 arg5&#xff1a;输出文件 二 ffprobe …

根据NVeloDocx Word模板引擎生成Word(四)

前面介绍了《E6低代码开发平台》的Word模版引擎NVeloDocx&#xff0c;实现了表单的基本字段、子表、单张图片、二维码、条形码怎么基于NVelocity脚本输出到Word文件&#xff0c;都是些比较简单且常用的需求。 本篇介绍怎么基于NVeloDocx在Word中插入图表&#xff0c;目前只支持…

HarmonyOS Next鸿蒙NDK使用示例

创建一个Native C项目 跟普通项目相比&#xff0c;主要区别是多了一个cpp文件夹、oh-package.json5中的dependencies引入还有build-profile.json5中的externalNativeOptions配置&#xff0c;abiFilters是支持的CPU架构&#xff0c;目前移动端项目只支持arm64-v8a、x86_64两种。…

笔试强训day07

在字符串中找出连续最长的数字串 #include <bits/stdc.h>using namespace std; const int N 500; char s[N]; bool check(char c) {return c > 0 && c < 9; } int main() {scanf("%s", s);int l -1, r -1;int n strlen(s);int left 0, rig…

Spring Boot 常用注解

1. 基础 Spring 注解 Component 标记一个类作为 Spring IoC 容器的一个组件。Repository 标记一个 DAO 类&#xff0c;同时提供了异常转换机制。Service 标记业务逻辑层的服务类。Controller 标记一个 Web 层的控制器类。RestController 结合了 Controller 和 ResponseBody&am…

GO Govaluate

govaluate 是一个用于在 Go 语言中动态求值表达式的库。它允许你解析和评估字符串形式的表达式&#xff0c;这些表达式可以包含变量、函数以及逻辑、算术和比较操作。它非常适合在运行时处理复杂的逻辑规则和条件表达式&#xff0c;而不需要重新编译代码。 安装 govaluate go…

C语言自定义类型结构体(24)

文章目录 前言一、结构体类型的声明结构体回顾结构体的特殊声明结构体的自引用 二、结构体的内存对齐对齐规则为什么存在内存对齐&#xff1f;修改默认对齐数 三、结构体传参四、结构体实现位段什么是位段位段的内存分配位段的跨平台问题位段的应用位段使用的注意事项 总结 前言…

Linux学习-Ansible(一)

环境- Rocky-Linux8.6 安装部署Ansible # 安装ansible [rootharbor ansible]# dnf install -y ansible-core #查看安装信息 [rootharbor ansible]# ansible-doc --version ansible-doc [core 2.12.2]config file /root/ansible/ansible.cfgconfigured module search path […

动态规划---不相交的线

题目&#xff1a; 在两条独立的水平线上按给定的顺序写下 nums1 和 nums2 中的整数。 现在&#xff0c;可以绘制一些连接两个数字 nums1[i] 和 nums2[j] 的直线&#xff0c;这些直线需要同时满足&#xff1a; nums1[i] nums2[j]且绘制的直线不与任何其他连线&#xff08;非水…

SQLITE3数据库实现信息的增删改查

#include <myhead.h> #include <sqlite3.h> typedef struct { int id; char name[20]; int age; int money; }woker; int callbake(void *arg,int n,char **a,char **b)//回调 输出查找到的工人信息 { for(int i 0;i<n;i) { …