【Java基础】HashMap 原理

news/2024/11/20 7:11:10/

文章目录

    • 1、HashMap 设置值的原理
    • 2、HashMap 获取值原理
    • 3、HashMap Hash优化
    • 4、HashMap 寻址优化
    • 5、HashMap 是如何解决Hash冲突的?
      • 5.1 get数据的时候,如果定位到指定位置的元素是一个链表,怎么办呢?
      • 5.2 红黑树
    • 6、数组扩容
      • 6.1 数组长度为16,计算index
      • 6.2 数组长度为32, 计算index
      • 6.3 扩容总结:

1、HashMap 设置值的原理

  1. 根据key计算HashCode,
  2. 再使用HashCode对 数组长度取模,结果一定是存放到数组中 的某一个位置。
  3. 得到指定位置索引之后,就往指定位置设置数据即可。

2、HashMap 获取值原理

  1. 根据key计算hashCode,
  2. 再使用hashCode对 数据长度取模,得到一个数组索引,
  3. 然后再根据索引从数组中获取指定数据即可。

3、HashMap Hash优化

      // JDK 1.8以后的HashMap里面的一段源码static final int hash(Object key) {int h;return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
}

答案:hash数组一般不会太大,使用 key 的hashCode 和 key的hashCode 右移16位 进行异或运算的目的就是让 高低16位都参与运算,减少hash冲突

4、HashMap 寻址优化

hash & (n - 1)

当n为2的n次方的时候, hash & (n - 1) = hash % n

答案:hash & (n - 1) -> 效果是跟hash对n取模,效果是一样的,但是与运算的性能要比hash对n取模要高很多,数学问题,数组的长度会一直是2的n次方,只要他保持数组长度是2的n次方

5、HashMap 是如何解决Hash冲突的?

使用链表法解决。
在数据的指定位置,挂一个链表,这个链表里放多个元素,让多个 key-value 放在数据的同一个位置

5.1 get数据的时候,如果定位到指定位置的元素是一个链表,怎么办呢?

get 的时候,如果定位到数组发现这个位置挂了一个链表哦,此时就会遍历 链表,从链表里面选择到自己需要的那个 kye-value 就可以了。

5.2 红黑树

为了解决hash冲突的问题,就会在 数据的指定为值挂一个链表,如果链表的长度达到了一定的长度之后,就会将链表转换成红黑树,通过遍历一颗红黑树找到一个元素,此时时间复杂度是 O(logn), 性能比链表要高一些。
如果链表过长,遍历的性能不高,因此当链表长度超过一定限制的时候,就会将链表转换成红黑树,提升搜索性能。

6、数组扩容

6.1 数组长度为16,计算index

n - 1  0000 0000 0000 0000 0000 0000 0000 1111
hash1  1111 1111 1111 1111 0000 1111 0000 0101
&      0000 0000 0000 0000 0000 0000 0000 0101 = 5(index = 5的位置)n - 1  0000 0000 0000 0000 0000 0000 0000 1111
hash2  1111 1111 1111 1111 0000 1111 0001 0101
&      0000 0000 0000 0000 0000 0000 0000 0101 = 5(index = 5的位置)

6.2 数组长度为32, 计算index

n-1    0000 0000 0000 0000 0000 0000 0001 1111
hash1  1111 1111 1111 1111 0000 1111 0000 0101
&结果   0000 0000 0000 0000 0000 0000 0000 0101 = 5(index = 5的位置)n-1    0000 0000 0000 0000 0000 0000 0001 1111
hash2  1111 1111 1111 1111 0000 1111 0001 0101
&结果   0000 0000 0000 0000 0000 0000 0001 0101 = 21(index = 21的位置)

6.3 扩容总结:

数据扩容 -> 2倍扩容 -> 重新对map中的每一个元素进行寻址->通过判断二进制结果是否多出来了一个bit为,判断index的位置是否变化;

如果数组的长度扩容之后 = 32,重新对每个hash值进行寻址,也就是用每个hash值跟新数组的length - 1进行与操作

  • 判断二级制结果是否多出来一个bit的1
  • 如果没有多,那么还是原来的index
  • 如果多了出来,那么新的index = oldIndex + oldCap
  • 通过这个方法避免了rehash的时候,用每个hash对数据的长度进行取模,取模的性能不高,位运算的性能比较高。

http://www.ppmy.cn/news/1273519.html

相关文章

数据仓库与数据挖掘小结

更加详细的只找得到pdf版本 填空10分 判断并改错10分 计算8分 综合20分 客观题 填空10分 判断并改错10分--错的要改 mooc中的--尤其考试题 名词解释12分 4个,每个3分 经常碰到的专业术语 简答题40分 5个,每道8分 综合 画roc曲线 …

什么是计算机网络?计算机网络基础知识

1.网络的组成部分:由主机,路由器,交换机等组成 2.网络结构:网络的网络 3.信息交换方式:电路交换和分组交换 4.网络分层:分清职责,物理层,链路层,网络层,运…

SpringBoot 整合 ExcelEasy

ExcelEasy 是一个基于 Spring Boot 的 Excel 导入导出框架&#xff0c;它提供了简单易用的 API 来操作 Excel 文件&#xff0c;可以轻松实现 Excel 的导入导出。 1. 添加依赖 在 pom.xml 文件中添加 ExcelEasy 的依赖&#xff1a; <dependency><groupId>com.ali…

Linux 之 性能优化

uptime $ uptime -p up 1 week, 1 day, 21 hours, 27 minutes$ uptime12:04:11 up 8 days, 21:27, 1 user, load average: 0.54, 0.32, 0.23“12:04:11” 表示当前时间“up 8 days, 21:27,” 表示运行了多长时间“load average: 0.54, 0.32, 0.23”“1 user” 表示 正在登录…

频谱论文:面向频谱地图构建的频谱态势生成技术研究

#频谱# [1]李竟铭.面向频谱地图构建的频谱态势生成技术研究.2019.南京航空航天大学,MA thesis.doi:10.27239/d.cnki.gnhhu.2019.000556. &#xff08;南京航空航天大学&#xff09; 频谱地图是对无线电环境的抽象表达&#xff0c;它可以直观、多维度地展现频谱态势信息&…

数据修复:.BlackBit勒索病毒来袭,安全应对方法解析

导言&#xff1a; 黑色数字罪犯的新玩具——.BlackBit勒索病毒&#xff0c;近来成为网络安全领域的头号威胁。这种恶意软件以其高度隐秘性和毁灭性而引起广泛关注。下面是关于.BlackBit勒索病毒的详细介绍&#xff0c;如不幸感染这个勒索病毒&#xff0c;您可添加我们的技术服…

C 库函数 - time()

描述 C 库函数 time_t time(time_t *seconds) 返回自纪元 Epoch&#xff08;1970-01-01 00:00:00 UTC&#xff09;起经过的时间&#xff0c;以秒为单位。如果 seconds 不为空&#xff0c;则返回值也存储在变量 seconds 中。 声明 下面是 time() 函数的声明。 time_t time(t…

智慧校园2.0物联网管理平台建设方案:PPT全文22页,附下载

关键词&#xff1a;物联网解决方案&#xff0c;智慧校园解决方案&#xff0c;物联网平台建设方案&#xff0c;物联网应用技术 一、智慧校园2.0物联网管理平台建设背景 1、教育现代化和强国建设的需要&#xff1a;近年来&#xff0c;国家为了加快推进教育现代化、教育强国建设…