当前位置: 开发笔记 > 编程语言 > 正文

HashMap之原理及死锁

作者：O臭煊儿O | 来源：互联网 | 2023-06-29 12:35

众所周知，HashMap是一个用于存储Key-Value键值对的集合，每一个键值对也叫做Entry。这些个键值对（Entry）分散存储在一个数组当中，这个数组就是HashMap的主干。Hash

众所周知，HashMap是一个用于存储Key-Value键值对的集合，每一个键值对也叫做Entry。这些个键值对（Entry）分散存储在一个数组当中，这个数组就是HashMap的主干。

HashMap数组每一个元素的初始值都是Null。

这里写图片描述

对于HashMap，我们最常使用的是两个方法：Get 和 Put。

1.put方法的原理

比如调用 hashMap.put(“apple”, 0) ，插入一个Key为“apple”的元素。这时候我们需要利用一个哈希函数来确定Entry的插入位置（index）： length表示初始化时候，HashMap的

    hash =  Hash（“apple”）
    index = hash & (length - 1)

假定最后计算出的index是2，那么结果如下：

这里写图片描述

但是，因为HashMap的长度是有限的，当插入的Entry越来越多时，再完美的Hash 函数也难免会出现index冲突的情况，比如：

这里写图片描述

这个时候该怎么办呢，我们可以利用链表来解决。

HashMap数组的每一个元素不止是一个Entry对象，也是一个链表的头节点。每一个Entry对象通过Next指针指向它的下一个Entry节点。当新来的Entry映射到冲突的数组位置时，只需要插入到对应的链表即可：

这里写图片描述

需要注意的是，新来的Entry节点插入链表时，使用的是“头插法”。至于为什么不插入链表尾部，是因为HashMap的发明者认为，后插入的Entry被查找的可能性更大。且插入到最后的话，那时间复杂度也会上升。

2.get方法的原理

首先会把输入的Key做一次Hash映射，得到对应的index：

   hash = Hash("apple")
   index = hash & (length-1)

由于刚才所说的Hash冲突，同一个位置有可能匹配到多个Entry，这时候就需要顺着对应链表的头节点，一个一个向下来查找。假设我们要查找的Key是“apple”：

这里写图片描述

第一步，我们查看的是头节点Entry6，Entry6的Key是banana，显然不是我们要找的结果。

第二步，我们查看的是Next节点Entry1，Entry1的Key是apple，正是我们要找的结果。

问题1：HashMap的初始长度，为什么？HashMap的最大容量？

问题2：高并发下 HashMap 可能会出现死锁？

问题3：java8中，HashMap的结构有什么样的优化？

问题1：HashM安排的初始长度，为什么？

初始长度是 16，每次扩展或者是手动初始化，长度必须是 2的幂。

因为： index = HashCode(Key) & (length - 1)，如果 length是 2的幂的话，则 length - 1就是全是 1的二进制数，比如 16 - 1 = 1111，这样相当于是坐落在长度为 length的hashMap上的位置只和 HashCode的后四位有关，这只要给出的HashCode算法本身分布均匀，算出的index就是分布均匀的。

因为HashMap的key是int类型，所以最大值是2^31次方，但是查看源码，当到达 2^30次方，即 MAXIMUM_CAPACITY,之后，便不再进行扩容。

问题2：高并发情况下，为什么HashMap出现死锁？

我们看到默认HashMap的初始长度是16，比较小，每一次push的时候，都会检查当前容量是否超过预定的 threshold，如果超过，扩大HashMap容量一倍，整个表里的所有元素都需要按照新的hash算法被算一遍，这个代价较大。提到死锁，对于HashMap来说，貌似只能和链表操作有关。

正常ReHash过程，每个元素重新算hash值，将链表翻转（目的遍历每个bucket上的链表还是用的是头插法，时间复杂度最低），放到对应的bucket上的链表中。

并发时候的reHash过程

     1 while(null != e) {
     2     Entry next = e.next;
     3     if (rehash) {
     4         e.hash = null == e.key ? 0 : hash(e.key);
     5     }
     6     int i = indexFor(e.hash, newCapacity);
     7     e.next = newTable[i];
     8     newTable[i] = e;
     9     e = next;
    10 }

我们可以再简化一下

    1 while(null != e) {
    2     Entry next = e.next;
    3     e.next = newTable[i];
    4     newTable[i] = e;
    5     e = next;
    6 }

过程：

（1）线程1，先被中断，线程2执行reHash过程

（2）线程2将原表 bucket 1 处的链表分发到新表 bucket 1 和 bucket 3 上（hash值的后2位，第一位不同，则不是01就是11），分散到 bucket 3上的值有两个， key(3), key(7)，遍历原表Bucket 1 上的链表，采用头插法，结果就是链表反转且还属于新表此bucket的元素放到此bucket上。此时 key(7) -> key(3) -> null

（3）此时线程 2 被中断，线程 1调度。此时线程 1 中 e 是 key(3)-> null

   执行 next = e.next , 得到 next = null

   e.next = newTable[i]， e.next = key(7)->key(3)->null，所以 e是 key(3)->key(7)->key(3)

   newTable[i] = e;  此时newTable[i] 就是一个 循环链表。

　　 e = next, e是null，跳出循环

这样等到get方法到对应的链表上取数据时，就会发生死循环。

问题3：java8对hashMap做了什么优化？

简单说： java7中 hashMap每个桶中放置的是链表，这样当hash碰撞严重时，会导致个别位置链表长度过长，从而影响性能。

java8中，HashMap 每个桶中当链表长度超过8之后，会将链表转换成红黑树，从而提升增删改查的速度。

推荐阅读

java
Java之HashMap在多线程情况下导致死循环的问题

PS：不得不说Java编程思想这本书是真心强大..学习内容:1.HashMap<K,V>在多线程的情况下出现的死循环现象当初学Java的时候只是知道HashMap< ... [详细]

蜡笔小新 2023-09-11 03:05:31
java
Java集合详解5：深入理解LinkedHashMap和LRU缓存

Java集合详解5：深入理解LinkedHashMap和LRU缓存今天我们来深入探索一下LinkedHashMap的底层原理，并且使用linkedhashmap来实现LRU缓存。具体代码在我的 ... [详细]

蜡笔小新 2023-09-23 10:53:28
get
java1.7集合源码赏析系列：HashTable、ConcurrentHashMap、HashMap差异分析

HashTable与ConcurrentHashMap均可实现HashMap的功能，对外提供了键值对存储的数据结构。但是在内部结构及实现上有何区别，性能上的差异到底在哪里又是如何导致的 ... [详细]

蜡笔小新 2023-09-14 08:45:47
get
Java HashSet和HashMap源码剖析

转载自：http:www.blogjava.netCarpenterLeearchive20160427430268.html总体介绍之所以把HashSet和HashMa ... [详细]

蜡笔小新 2023-09-10 22:23:41
get
关于LinkedHashMap实现LRU缓存算法

缓存这个东西就是为了提高运行速度的，由于缓存是在寸土寸金的内存里面，不是在硬盘里面，所以容量是很有限的。LRU这个算法就是把最近一次使用时间离现在时间最远的数据删除掉。先说说List：每 ... [详细]

蜡笔小新 2023-09-10 10:48:58
get
手写HashMap，快手面试官直呼内行

手写HashMap，快手面试官直呼内行-手写HashMap？这么狠，面试都卷到这种程度了？第一次见到这个面试题，是在某个不方便透露姓名的Offer收割机大佬的文章：这……我当 ... [详细]

蜡笔小新 2023-09-05 19:32:25
string
HashMap的相关问题及其底层数据结构和操作流程

本文介绍了关于HashMap的相关问题，包括其底层数据结构、JDK1.7和JDK1.8的差异、红黑树的使用、扩容和树化的条件、退化为链表的情况、索引的计算方法、hashcode和hash()方法的作用、数组容量的选择、Put方法的流程以及并发问题下的操作。文章还提到了扩容死链和数据错乱的问题，并探讨了key的设计要求。对于对Java面试中的HashMap问题感兴趣的读者，本文将为您提供一些有用的技术和经验。 ... [详细]

蜡笔小新 2023-12-10 17:07:36
string
HashMap的扩容知识详解

本文详细介绍了HashMap的扩容知识，包括扩容的概述、扩容条件以及1.7版本中的扩容方法。通过学习本文，读者可以全面了解HashMap的扩容机制，提升对HashMap的理解和应用能力。 ... [详细]

蜡笔小新 2023-12-09 17:20:36
get
Map集合Map map = new HashMap();

01Map集合概述A:Map集合概述:我们通过查看Map接口描述,发现Map接口下的集合与Collection接口下的集合，它们存储数据的形式不同a:Collection中的集合 ... [详细]

蜡笔小新 2023-09-06 21:09:58
get
Java中HashMap遍历

在Java中有多种遍历HashMap的方法，注意Java中所有的Map类型都实现了共有的Map接口，所以接下来方法适用于所有Map（如：HaspMap，TreeMap,Linked ... [详细]

蜡笔小新 2023-09-05 13:16:58
get
比较Map的性能

单线程化的ConcurrentHashMap的性能要比同步的HashMap的性能稍好一些，而且在并发应用中，这种作用就十分明显了。ConcurrentHashMap的实现，假定大多数常用的操 ... [详细]

蜡笔小新 2023-09-23 15:40:25
string
类 Hashtable及与HashMap的区别

类Hashtable<K,V>所有已实现的接口：Serializable,Cloneable,Map<K,V>此类实现一个哈希表，该哈希表将键映 ... [详细]

蜡笔小新 2023-09-10 09:48:30
typescript
Typescript如何从哈希图中删除值？

我找到了这篇有关在Typescript中实现哈希图的帖子，除了从哈希图中删除某些内容 ... [详细]

蜡笔小新 2023-09-10 09:26:38
get
Java中怎么对HashMap按键值排序

本篇文章给大家分享的是有关Java中怎么对HashMap按键值排序，小编觉得挺实用的，因此分享给大家学习，希望大家阅读完这篇文章后可以有所收获，话 ... [详细]

蜡笔小新 2023-09-09 14:01:50
get
集合框架--Map集合之HashMap存储自定义对象

将学生对象和学生的归属地通过键与值存储到map集合中。importjava.util.HashMap;importjava.util.Iterator;importjava.uti ... [详细]

蜡笔小新 2023-09-09 04:43:44

O臭煊儿O

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章