当前位置: 开发笔记 > 编程语言 > 正文

【转】由HashMap哈希算法引出的求余%和与运算&转换问题

作者：合约100年 | 来源：互联网 | 2023-08-29 15:08

目录1、引出问题2、结论3、分析过程4、总结回到顶部1、引出问题在前面讲解HashMap的源码实现时，有

1、引出问题
2、结论
3、分析过程
4、总结

回到顶部

1、引出问题

　　在前面讲解 HashMap 的源码实现时，有如下几点：

　　①、初始容量为 1<<4，也就是2⁴ = 16

　　②、负载因子是0.75，当存入HashMap的元素占比超过整个容量的75%时，进行扩容，而且在不超过int类型的范围时，进行2次幂的扩展(指长度扩为原来2倍)

　　扩大一倍

　　③、新添加一个元素时，计算这个元素在HashMap中的位置，也就是本篇文章的主角哈希运算。分为三步：

　　第一步：取 hashCode 值： key.hashCode()

　　第二步：高位参与运算：h>>>16

　　第三步：取模运算：(n-1) & hash

1     static final int hash(Object key) {
2         int h;
3         return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
4     }
5 
6     tab[i = (n - 1) & hash]；

　　ps：第 6 行代码是我自己加的。

　　我们知道一个好的哈希算法能够使得元素分布的更加均匀，从而减少哈希冲突。HashMap 在这块的处理就很巧妙：

　　首先第一步取得 hashCode，该方法是一个用native修饰的本地方法，返回的是一个 int 类型的值（根据内存地址换算出来的一个值），通常我们都会重写该方法。

　　第二步将取得的哈希值无符号右移16位，高位补0。并与前面第一步获得的hash码进行按位异或^ 运算。这是为了当length比较小的时候，也能保证考虑到高低Bit位都参与到Hash的计算中，同时不会有太大的开销。

　　本文的重点是第三步，将经过前面两步获取的 hash 值，与HashMap的集合长度减 1 进行按位与 & 运算：(n-1) & hash。但是其实很多哈希算法，为了使元素分布均匀，都是用的取模运算，用一个值去模上总长度，即 n%hash。我们知道在计算机中 & 的效率比 % 高很多，那么如何将 % 转换为 & 运算呢？在HashMap 中，是用的 (n - 1) & hash 进行运算的，那么这是为什么呢？

　　这就是本篇博客我们将要明白的问题。

回到顶部

2、结论

　　我们先给出结论：

　　当 lenth = 2ⁿ 时，X % length = X & (length - 1)

　　也就是说，长度为2的n次幂时，模运算 % 可以变换为按位与 & 运算。

　　比如：9 % 4 = 1，9的二进制是 1001 ,4-1 = 3,3的二进制是 0011。 9 & 3 = 1001 & 0011 = 0001 = 1

　　再比如：12 % 8 = 4,12的二进制是 1100,8-1 = 7,7的二进制是 0111。12 & 7 = 1100 & 0111 = 0100 = 4

　　上面两个例子4和8都是2的n次幂，结论是成立的，那么当长度不为2的n次幂呢？

　　比如：9 % 5 = 4，9的二进制是 1001，5-1 = 4,4的二进制是0100。9 & 4 = 1001 & 0100 = 0000 = 0。显然是不成立的。

　　为什么是这样？下面我们来详细分析。

回到顶部

3、分析过程

　　首先我们要知道如下规则：

　　①、"<<" 左移：右边空出的位上补0，左边的位将从字头挤掉，左移一位其值相当于乘2。

　　②、">>"右移：右边的位被挤掉，右移一位其值相当于除以2。对于左边移出的空位，如果是正数则空位补0，若为负数，可能补0或补1，这取决于所用的计算机系统。

　　③、">>>"无符号右移，右边的位被挤掉，对于左边移出的空位一概补上0。

　　根据二进制数的特点，相信大家很好理解。

　　对于给定一个任意的十进制数X_nX_n-1X_n-2....X₁X₀，我们将其用二进制的表示方法分解：

　　X_nX_n-1X_n-2....X₁X₀ = X_n*2ⁿ+X_n-1*2^n-1+......+X₁*2¹+X₀*2⁰ 3-1公式

　　这里的十进制数只有三位，同理当有N位时，后面2的幂次方依次从 0 开始递增到 N 。

　　回到上面的结论： lenth = 2ⁿ 时，X % length = X & (length - 1)

　　以及对于除法，被除数是满足分配率的（除数不满足）：

　　成立：（a+b）÷c=a÷c+b÷c 3-2公式

　　不成立：a÷（b+c）≠a÷c+b÷c

　　通过 3-1公式以及 3-2 公式，我们可以得出当任意一个十进制除以一个2^k的数时，我们可以将这个十进制转换成3-1公式的表示形式：

　　(X_nX_n-1X_n-2....X₁X₀) / 2^k = (X_n*2ⁿ+X_n-1*2^n-1+......+X₁*2¹+X₀*2⁰) / 2^k = X_n*2ⁿ / 2^k +X_n-1*2^n-1 / 2^k+......+ X₁*2¹/ 2^k+ X₀*2⁰ / 2^k

　　如果我们想求上面公式的余数，相信大家一眼就能看出来：

　　①、当 0<= k <= n 时，余数为 X_k*2^k+X_k-1*2^k-1+......+X₁*2¹+X₀*2⁰,也就是说比 k 大的 n次幂，我们都舍掉了（大的都能整除 2^k），比k小的我们都留下来了(小的不能整除2^k)。那么留来下来即为余数。

　　②、当 k > n 时，余数即为整个十进制数。

　　看到这里，我们离证明结论已经很近了。再回到上面说的二进制的移位操作，向右移 n 位，表示除以 2ⁿ 次方，由此我们得到一个很重要的结论：

　　一个十进制数对一个2ⁿ 的数取余，我们可以将这个十进制转换为二进制数，将这个二进制数右移n位，移掉的这 n 位数即是余数。

　　知道怎么算余数了，那么我们怎么去获取这移掉的 n 为数呢？

　　我们再看2⁰,2¹,2²....2ⁿ用二进制表示如下：

　　0001，0010，0100，1000，10000......

　　我们把上面的数字减一：

　　0000，0001，0011，0111，01111......

　　根据与运算符&的规律，当位上都是 1 时，结果才是 1，否则为 0。所以任意一个二进制数对 2^k 取余时，我们可以将这个二进制数与（2^k-1）进行按位与运算，保留的即使余数。

　　这就完美的证明了前面给出的结论：

　　当 lenth = 2ⁿ 时，X % length = X & (length - 1)

　　注意，一定要是2ⁿ次方，才满足上面的公式，否则就是错误的。

回到顶部

4、总结

　　通过上面的分析过程了，我们完美了证明了公式的正确性。在回到 HashMap 的实现过程，我们知道HashMap的初始容量为啥是 1<<4 了吧，而且每次扩容都是扩大一倍。因为必须要完美的满足 hash 算法。

推荐阅读

object
JDK源码学习之HashTable(附带面试题)的学习笔记

本文介绍了JDK源码学习之HashTable(附带面试题)的学习笔记，包括HashTable的定义、数据类型、与HashMap的关系和区别。文章提供了干货，并附带了其他相关主题的学习笔记。 ... [详细]

蜡笔小新 2023-12-12 13:05:17
object
如何自行分析定位SAP BSP错误

The“BSPtag”Imentionedintheblogtitlemeansforexamplethetagchtmlb:configCelleratorbelowwhichi ... [详细]

蜡笔小新 2023-12-14 19:58:05
instance
iOS数据库Sqlite的SQL语句分类和常见约束关键字

本文介绍了iOS数据库Sqlite的SQL语句分类和常见约束关键字。SQL语句分为DDL、DML和DQL三种类型，其中DDL语句用于定义、删除和修改数据表，关键字包括create、drop和alter。常见约束关键字包括if not exists、if exists、primary key、autoincrement、not null和default。此外，还介绍了常见的数据库数据类型，包括integer、text和real。 ... [详细]

蜡笔小新 2023-12-12 18:42:03
python
模板引擎StringTemplate的使用方法和特点

本文介绍了模板引擎StringTemplate的使用方法和特点，包括强制Model和View的分离、Lazy-Evaluation、Recursive enable等。同时，还介绍了StringTemplate语法中的属性和普通字符的使用方法，并提供了向模板填充属性的示例代码。 ... [详细]

蜡笔小新 2023-12-11 21:45:03
python
SpringBoot uri统一权限管理的实现方法及步骤详解

本文详细介绍了SpringBoot中实现uri统一权限管理的方法，包括表结构定义、自动统计URI并自动删除脏数据、程序启动加载等步骤。通过该方法可以提高系统的安全性，实现对系统任意接口的权限拦截验证。 ... [详细]

蜡笔小新 2023-12-14 16:11:30
random
Java容器中的compareto方法排序原理解析

本文从源码解析Java容器中的compareto方法的排序原理，讲解了在使用数组存储数据时的限制以及存储效率的问题。同时提到了Redis的五大数据结构和list、set等知识点，回忆了作者大学时代的Java学习经历。文章以作者做的思维导图作为目录，展示了整个讲解过程。 ... [详细]

蜡笔小新 2023-12-14 13:53:31
random
Spring特性实现接口多类的动态调用详解

本文详细介绍了如何使用Spring特性实现接口多类的动态调用。通过对Spring IoC容器的基础类BeanFactory和ApplicationContext的介绍，以及getBeansOfType方法的应用，解决了在实际工作中遇到的接口及多个实现类的问题。同时，文章还提到了SPI使用的不便之处，并介绍了借助ApplicationContext实现需求的方法。阅读本文，你将了解到Spring特性的实现原理和实际应用方式。 ... [详细]

蜡笔小新 2023-12-14 03:24:19
buffer
java 模拟get post请求_Java后台模拟发送http的get和post请求，并测试

个人学习使用：谨慎参考1Client类importcom.thoughtworks.gauge.Step;importcom.thoughtworks.gauge.T ... [详细]

蜡笔小新 2023-12-13 14:20:23
object
Java中vector的使用详解

本文详细介绍了Java中vector的使用方法和相关知识，包括vector类的功能、构造方法和使用注意事项。通过使用vector类，可以方便地实现动态数组的功能，并且可以随意插入不同类型的对象，进行查找、插入和删除操作。这篇文章对于需要频繁进行查找、插入和删除操作的情况下，使用vector类是一个很好的选择。 ... [详细]

蜡笔小新 2023-12-13 14:14:39
object
Java学习笔记之面向对象编程（OOP）

本文介绍了Java学习笔记中的面向对象编程（OOP）内容，包括OOP的三大特性（封装、继承、多态）和五大原则（单一职责原则、开放封闭原则、里式替换原则、依赖倒置原则）。通过学习OOP，可以提高代码复用性、拓展性和安全性。 ... [详细]

蜡笔小新 2023-12-13 08:44:30
object
Java中包装类的设计原因以及操作方法

本文主要介绍了Java中设计包装类的原因以及操作方法。在Java中，除了对象类型，还有八大基本类型，为了将基本类型转换成对象，Java引入了包装类。文章通过介绍包装类的定义和实现，解答了为什么需要包装类的问题，并提供了简单易用的操作方法。通过本文的学习，读者可以更好地理解和应用Java中的包装类。 ... [详细]

蜡笔小新 2023-12-12 15:48:10
express
java boolean 大小_java boolean 大小

先看官方文档TheJavaTutorialshavebeenwrittenforJDK8.Examplesandpracticesdescribedinthispagedontta ... [详细]

蜡笔小新 2023-12-12 13:36:56
object
OpenStack及其构成简介

本文介绍了OpenStack的逻辑概念以及其构成简介，包括了软件开源项目、基础设施资源管理平台、三大核心组件等内容。同时还介绍了Horizon(UI模块)等相关信息。 ... [详细]

蜡笔小新 2023-12-12 06:47:38
import
Java中的Hashtable clear()方法详解

本文介绍了Java中Hashtable的clear()方法，该方法用于清除和移除指定Hashtable中的所有键。通过示例程序演示了clear()方法的使用。 ... [详细]

蜡笔小新 2023-12-11 17:32:13
object
如何用JNI技术调用Java接口以及提高Java性能的详解

本文介绍了如何使用JNI技术调用Java接口，并详细解析了如何通过JNI技术提高Java的性能。同时还讨论了JNI调用Java的private方法、Java开发中使用JNI技术的情况以及使用Java的JNI技术调用C++时的运行效率问题。文章还介绍了JNIEnv类型的使用方法，包括创建Java对象、调用Java对象的方法、获取Java对象的属性等操作。 ... [详细]

蜡笔小新 2023-12-11 14:53:02

合约100年

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章