JavaHashtable类源码解析

作者：黄霖hy | 来源：互联网 | 2023-05-19 01:16

老生常谈的问题——Hashtable和HashMap有什么区别大家一般都能说出几条，比如Hashtable是线程安全的，不支持null作为key和value值等等。那么，要仔细了解这个问题还是直接

老生常谈的问题——Hashtable和HashMap有什么区别

大家一般都能说出几条，比如Hashtable是线程安全的，不支持null作为key和value值等等。那么，要仔细了解这个问题还是直接从Hashtable的源码入手。

先列一下我找到的区别：

继承类不同，Hashtable继承的是Dictionary这是一个废弃类，而HashMap继承的是AbstractMap
产生时间不同，Hashtable自JDK1.0版本就有了，而HashMap是JDK1.2才加入的，同时Hashtable可能因为历史原因并不是我们习惯的驼峰法命名的
Hashtable比HashMap多提供了elments()方法用于返回此Hashtable中的value的枚举
Hashtable既不支持null key也不支持null value
Hashtable的默认大小是11，扩大的逻辑是*2+1，对于给定大小不会做扩展。而HashMap是16，扩大时*2，初始大小会转换成恰好大于等于的2的指数次幂
Hashtable中的遍历操作是从高位开始的，而HashMap是从低位开始
Hashtable处理冲突元素时插入到链表头部，而HashMap是插入到链表尾部
Hashtable的hashcode方法计算所有entry的hashcode总和，HashMap没有这样的方法，同时HashMap在计算hash值时会用高位右移16位与低位异或来打散散列值，避免位与操作造成冲突过多
Hashtable每一次定位都要做一次完整的除法取余数，而HashMap使用的是与数组大小-1的位与计算，效率高很多
Hashtable的方法都加上了synchronized是线程安全的方法，而HashMap不是，所以单线程时前者额外开销很大。JDK8以后Hashtable也用了modCount来保证在遍历过程中其他线程修改对象的fast-fail机制。但是，即使是多线程环境下，依然应该优先选择对HashMap进行一些特殊处理而不是用Hashtable，因为所有方法都加上synchronized的程序并发性很差。实际上就我个人经验而言，在一些特定的具体情况下，比如大规模写入key值连续数据（出自今年的第四届阿里中间件性能挑战赛复赛题），链表法解决冲突性能可能不如开放地址法，即使加上了红黑树。所以说对于一些对极致压榨性能的情况下，适当的可以抛弃一些通用的集合而尝试自由发挥造轮子。

首先从最上方的注释中可以看到Hashtable自JDK1.0版本就有了，而HashMap是JDK1.2才加入的。观察一下类的声明，我们可以看到他们继承的类也是不同的，Hashtable继承的是Dictionary,Dictionary这个类从注释上写着已经是obsolete被废弃了，所以连带Hashtable也基本不用了。Hashtable也有元素个数，数组大小，负载因子这些属性，不用元素个数用的是count不是size。也是使用链表法来解决冲突。

public class Hashtable
    extends Dictionary
    implements Map, Cloneable, java.io.Serializable
public class HashMap extends AbstractMap
    implements Map, Cloneable, Serializable

构造函数可以看出默认大小是11，同时初始大小给定多少初始数组就多大，不会做扩展到2的指数次幂这样的操作。threshold=initialCapacity*loadFactor这点和HashMap相同。

    public Hashtable(int initialCapacity, float loadFactor) {
        if (initialCapacity <0)
            throw new IllegalArgumentException("Illegal Capacity: "+
                                               initialCapacity);
        if (loadFactor <= 0 || Float.isNaN(loadFactor))
            throw new IllegalArgumentException("Illegal Load: "+loadFactor);

        if (initialCapacity==0)
            initialCapacity = 1;
        this.loadFactor = loadFactor;
        table = new Entry[initialCapacity];
        threshold = (int)Math.min(initialCapacity * loadFactor, MAX_ARRAY_SIZE + 1);
    }

    public Hashtable() {
        this(11, 0.75f);
    }

contains这个方法是从表尾开始向前搜索的，同时也没有使用==来比较

    public synchronized boolean contains(Object value) {
        if (value == null) {
            throw new NullPointerException();
        }

        Entry tab[] = table;
        for (int i = tab.length ; i-- > 0 ;) {
            for (Entry e = tab[i] ; e != null ; e = e.next) {
                if (e.value.equals(value)) {
                    return true;
                }
            }
        }
        return false;
    }

从containsKey可以看出，Hashtable的index计算逻辑是使用key.hashCode()的后31位然后除以tab.length取余数。HashMap的那种按位与的操作仅当操作数低位全是1时才等价为取余操作，也就是2的指数次幂-1才可成立，这样做计算速度比除法快很多，不过冲突数量会增加，所以加入了一些打散的设计比如hashCode高位与低位异或。

    public synchronized boolean containsKey(Object key) {
        Entry tab[] = table;
        int hash = key.hashCode();
        int index = (hash & 0x7FFFFFFF) % tab.length;
        for (Entry e = tab[index] ; e != null ; e = e.next) {
            if ((e.hash == hash) && e.key.equals(key)) {
                return true;
            }
        }
        return false;
    }

扩展方法rehash的扩大方式是旧数组大小*2+1，而HashMap是*2，要重新计算每一个的index所以效率低，同时冲突时将后面的元素插入到前面元素的前一位，所以会改变顺序

    protected void rehash() {
        int oldCapacity = table.length;
        Entry[] oldMap = table;

        // overflow-conscious code
        int newCapacity = (oldCapacity <<1) + 1;//新大小=旧大小*2+1
        if (newCapacity - MAX_ARRAY_SIZE > 0) {
            if (oldCapacity == MAX_ARRAY_SIZE)
                // Keep running with MAX_ARRAY_SIZE buckets
                return;
            newCapacity = MAX_ARRAY_SIZE;
        }
        Entry[] newMap = new Entry[newCapacity];//创建一个新的数组

        modCount++;
        threshold = (int)Math.min(newCapacity * loadFactor, MAX_ARRAY_SIZE + 1);
        table = newMap;

        for (int i = oldCapacity ; i-- > 0 ;) {
            for (Entry old = (Entry)oldMap[i] ; old != null ; ) {
                Entry e = old;
                old = old.next;

                int index = (e.hash & 0x7FFFFFFF) % newCapacity;//重新计算每一个元素的index
                e.next = (Entry)newMap[index];//前后元素有冲突时，后面的元素插入到前面元素的前面
                newMap[index] = e;
            }
        }
    }

对于插入结点同样要先检查是否存在key值相同的点，存在则不插入，然后检查是否需要扩展数组，插入时如果发生冲突，也是将要插入的元素放在链表的首位，而putVal方法是放入尾部的。同时，可以看到Hashtable是不支持null作为key或value值的

    public synchronized V put(K key, V value) {
        // Make sure the value is not null
        if (value == null) {//value为null直接报错
            throw new NullPointerException();
        }

        // Makes sure the key is not already in the hashtable.
        Entry tab[] = table;
        int hash = key.hashCode();//若key为null这里会报错
        int index = (hash & 0x7FFFFFFF) % tab.length;
        @SuppressWarnings("unchecked")
        Entry entry = (Entry)tab[index];
        for(; entry != null ; entry = entry.next) {
            if ((entry.hash == hash) && entry.key.equals(key)) {
                V old = entry.value;
                entry.value = value;
                return old;
            }
        }

        addEntry(hash, key, value, index);
        return null;
    }
    private void addEntry(int hash, K key, V value, int index) {
        modCount++;

        Entry tab[] = table;
        if (count >= threshold) {
            // Rehash the table if the threshold is exceeded
            rehash();

            tab = table;
            hash = key.hashCode();
            index = (hash & 0x7FFFFFFF) % tab.length;
        }

        // Creates the new entry.
        @SuppressWarnings("unchecked")
        Entry e = (Entry) tab[index];
        tab[index] = new Entry<>(hash, key, value, e);
        count++;
    }

Hashtable的hashcode方法计算所有entry的hash值总和

    public synchronized int hashCode() {
        int h = 0;
        if (count == 0 || loadFactor <0)
            return h;  // Returns zero

        loadFactor = -loadFactor;  // Mark hashCode computation in progress
        Entry[] tab = table;
        for (Entry entry : tab) {
            while (entry != null) {
                h += entry.hashCode();
                entry = entry.next;
            }
        }

        loadFactor = -loadFactor;  // Mark hashCode computation complete

        return h;
    }

elements这个方法是Hashtable多出来的，返回所有value值的枚举

    public synchronized Enumeration elements() {
        return this.getEnumeration(VALUES);
    }

我们可以注意到，Hashtable的方法都加上了synchronized，他们是线程安全的，但是对于本身是线程安全的情况就会大幅度影响性能，JDK8开始引入modCount来作为fast-fail机制，防止其他线程的非synchronzied方法对Hashtable进行修改。

推荐阅读

object
HashMap和HashTable的实现原理

一、HashMap1.HashMap概述：HashMap是基于哈希表的Map接口的非同步实现。此实现提供所有可选的映射操作，并允许使用null值和null键。此类不保证映射的顺序，特别是 ... [详细]

蜡笔小新 2023-08-08 13:57:40
copy
java中的hashmap与hashtable的区别

HashMap和Hashtable的区别主要的区别有三点：线程安全性，同步(synchronization)，以及速度。（两者都是无序排放）HashMap几乎可以等价于Hashtable，除了Hash ... [详细]

蜡笔小新 2023-07-30 16:31:49
object
JDK源码学习之HashTable(附带面试题)的学习笔记

本文介绍了JDK源码学习之HashTable(附带面试题)的学习笔记，包括HashTable的定义、数据类型、与HashMap的关系和区别。文章提供了干货，并附带了其他相关主题的学习笔记。 ... [详细]

蜡笔小新 2023-12-12 13:05:17
object
Java程序设计第4周学习总结及注释应用的开发笔记

本文由编程笔记#小编为大家整理，主要介绍了201521123087《Java程序设计》第4周学习总结相关的知识，包括注释的应用和使用类的注释与方法的注释进行注释的方法，并在Eclipse中查看。摘要内容大约为150字，提供了一定的参考价值。 ... [详细]

蜡笔小新 2023-12-11 21:21:22
object
HashMap 和Hashtable 的区别?

hashmap线程不安全允许有null的键和值效率高一点、方法不是Synchronize的要提供外同步有containsvalue和containsKey方法HashMap是Java1 ... [详细]

蜡笔小新 2023-08-30 01:25:20
get
ArrayList、Vector、HashMap、HashTable、HashSet的默认初始容量、加载因子、扩容增量、具体区别

要讨论这些常用的默认初始容量和扩容的原因是：当底层实现涉及到扩容时，容器或重新分配一段更大的连续内存（如果是离散分配则不需要重新分配，离散分配都是插入新元素时动态分配内存），要将容器原来的数据全部复 ... [详细]

蜡笔小新 2023-08-06 12:58:52
object
Java笔记十二.常用API-Hashtable类及其与HashMap、HashSet的区别

常用API-Hashtable类及其与HashMap、HashSet的区别转载请表明出处：http:blog.csdn.netu012637501(嵌入式_小J的天空)一、Hashtable&l ... [详细]

蜡笔小新 2023-07-20 07:43:05
object
（2.1.8）Java之集合类：set、list、hashmap、hashtable等和迭代器iterator

一、容器常见的集合类有这些种：实现Collection接口的：Set、List以及他们的实现类。实现Map接口的：HashMap及其实现类编程爱好者学习，下面我我们通过一个图来整体描述一下：这个图片没 ... [详细]

蜡笔小新 2023-07-07 20:02:37
object
HashTable与HashMap的区别

引入：之前有看过这个这两个区别，但没有很认真地思考，上次电话面试的时候就问到了这个问题，当时有点印象但说不上来，就开始问度娘，下面是我了解到的。HashMap和Hashtable都实现 ... [详细]

蜡笔小新 2023-06-30 19:03:42
object
DataSet绑定Hashtable为DropDownList提供数据源

把某些固定的数据源绑定写到类的方法里，能够使代码更好的适应变化。下面的方法并没有放到类里只是简单的做了示范：protectedvoidPage_Load(objectsen ... [详细]

蜡笔小新 2023-06-24 12:49:04
object
java命令运行

Java在运行已编译完成的类时，是通过java虚拟机来装载和执行的，java虚拟机通过操作系统命令JAVA_HOMEbinjava–option来启 ... [详细]

蜡笔小新 2023-12-12 19:26:55
object
模板引擎StringTemplate的使用方法和特点

本文介绍了模板引擎StringTemplate的使用方法和特点，包括强制Model和View的分离、Lazy-Evaluation、Recursive enable等。同时，还介绍了StringTemplate语法中的属性和普通字符的使用方法，并提供了向模板填充属性的示例代码。 ... [详细]

蜡笔小新 2023-12-11 21:45:03
object
Java面经整理及相关概念解析

本文整理了Java面试中常见的问题及相关概念的解析，包括HashMap中为什么重写equals还要重写hashcode、map的分类和常见情况、final关键字的用法、Synchronized和lock的区别、volatile的介绍、Syncronized锁的作用、构造函数和构造函数重载的概念、方法覆盖和方法重载的区别、反射获取和设置对象私有字段的值的方法、通过反射创建对象的方式以及内部类的详解。 ... [详细]

蜡笔小新 2023-12-10 22:17:08
object
HashMap的相关问题及其底层数据结构和操作流程

本文介绍了关于HashMap的相关问题，包括其底层数据结构、JDK1.7和JDK1.8的差异、红黑树的使用、扩容和树化的条件、退化为链表的情况、索引的计算方法、hashcode和hash()方法的作用、数组容量的选择、Put方法的流程以及并发问题下的操作。文章还提到了扩容死链和数据错乱的问题，并探讨了key的设计要求。对于对Java面试中的HashMap问题感兴趣的读者，本文将为您提供一些有用的技术和经验。 ... [详细]

蜡笔小新 2023-12-10 17:07:36
copy
HashTable实现购物车

用户购买商品时if(e.CommandName.ToLower()"buy"){判断用户购物车是否为空如果为空则分配 ... [详细]

蜡笔小新 2023-06-24 22:05:31

黄霖hy

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章