热门标签 | HotTags
当前位置:  开发笔记 > 运维 > 正文

散列算法与散列码(实例讲解)

下面小编就为大家带来一篇散列算法与散列码(实例讲解)。小编觉得挺不错的,现在就分享给大家,也给大家做个参考。一起跟随小编过来看看吧

一、引入

/**
 * Description:新建一个类作为map的key
 */
public class Groundhog
{
  protected int number;

  public Groundhog(){
  }
  public Groundhog(int number)
  {
    this.number = number;
  }

  @Override
  public String toString()
  {
    return "Groundhog{" + "number=" + number + '}';
  }
}

/**
 * Description:新建一个类作为map的value
 */
public class Prediction
{
  private boolean shadow=Math.random() > 0.5;

  @Override
  public String toString()
  {
    if (shadow) return "Six more weeks of Winter";
    else return "Early Spring!";
  }
}

/**
 * Description:测试类
 */
public class SpringDetector
{
  public static void detectSpring(Class grondHotClass) throws Exception{
    Constructor cOnstructor= grondHotClass.getConstructor(new Class[]{int.class});
    Map map=new HashMap();
    for (int i=0;i<10;i++){
      map.put(constructor.newInstance(new Object[]{new Integer(i)}),new Prediction());
    }
    System.out.println("map="+map);

    Groundhog groundhog=(Groundhog)constructor.newInstance(new Object[]{new Integer(3)});
    System.out.println(groundhog);

    if (map.containsKey(groundhog)) {//查找这个key是否存在
      System.out.println((Prediction)map.get(groundhog));
    }else {
      System.out.println("key not find:"+groundhog);
    }

  }
  public static void main(String[] args)
  {
    try {
      detectSpring(Groundhog.class);
    } catch (Exception e) {
      e.printStackTrace();
    }
  }
}

看这个结果,问题就来了,map中明明存在Groudhog{number=3},为什么结果显示的是Key not find呢??问题出在哪里呢?原来是Groudhog类没有重写hashCode()方法,所以这里是使用Object的hashCode()方法生成散列码,而他默认是使用对象的地址计算散列码。因此,由Groudhog(3)生成的第一个实例的散列码与Groudhog(3)生成的散列码是不同的,所以无法查找到 key。但是仅仅重写hashCode()还是不够的,除非你重写equals()方法。原因在于不同的对象可能计算出同样的hashCode的值,hashCode 的值并不是唯一的,当hashCode的值一样时,就会使用equals()判断当前的“键”是否与表中的存在的键“相同”,即“

如果两个对象相同,那么他们的hashCode值一定相同。
如果两个对象的hashCode值相同,他们不一定相同。
正确的equals()方法必须满足下列5个条件:
1、自反性: x.equals(x) 一定成立。
2、对称性: 如果x.equals(y)成立,那么y.equals(x)也一定成立。
3、传递性:如果x.equals(y)=true ,y.equals(z)=true,那么x.equals(z)=true也成立。
4、一致性:无论调用x.equal(y)多少次,返回的结果应该保持一致。
5、对任何不是null的x,x.equals(null)一定返回false。

二、理解hashCode()

散列的价值在于速度:散列使得查询得以快速执行。由于速度的瓶颈是对“键”进行查询,而存储一组元素最快的数据结构是数组,所以用它来代表键的信息,注意:数组并不保存“键”的本身。而通过“键”对象生成一个数字,将其作为数组的下标索引。这个数字就是散列码,由定义在Object的hashCode()生成(或成为散列函数)。同时,为了解决数组容量被固定的问题,不同的“键”可以产生相同的下标。那对于数组来说?怎么在同一个下标索引保存多个值呢??原来数组并不直接保存“值”,而是保存“值”的 List。然后对 List中的“值”使用equals()方法进行线性的查询。这部分的查询自然会比较慢,但是如果有好的散列函数,每个下标索引只保存少量的值,只对很少的元素进行比较,就会快的多。

不知道大家有没有理解我上面在说什么。不过没关系,下面会有一个例子帮助大家理解。不过我之前一直被一个问题纠结:为什么一个hashCode的下标存的会有多个值?因为hashMap里面只能有唯一的key啊,所以只能有唯一的value在那个下标才对啊。这里就要提出一个新的概念哈希冲突的问题,借用网上的一个例子:

比如:数组的长度是5。这时有一个数据是6。那么如何把这个6存放到长度只有5的数组中呢。按照取模法,计算6%5,结果是1,那么就把6放到数组下标是1的位置。那么,7就应该放到2这个位置。到此位置,哈希冲突还没有出现。这时,有个数据是11,按照取模法,11%5=1,也等于1。那么原来数组下标是1的地方已经有数了,是6。这时又计算出1这个位置,那么数组1这个位置,就必须储存两个数了。这时,就叫哈希冲突。冲突之后就要按照顺序来存放了。所以这里Java中用的解决方法就是在这个hashCode上存一个List,当遇到相同的hashCode时,就往这个List里add元素就可以了。这才是hash原理的精髓所在啊!哈哈、纠结我一天。

三、HashMap的性能因子

容量(Capacity):散列表中的数量。

初始化容量(Initial capacity):创建散列表时桶的数量。HashMap 和 HashSet都允许你在构造器中制定初始化容量。

尺寸(Size):当前散列表中记录的数量。

负载因子(Load factor):等于"size/capacity"。负载因子为0,表示空的散列表,0.5表示半满的散列表,依次类推。轻负载的散列表具有冲突少、适宜插入与适宜查询的特点(但是使用迭代器遍历会变慢)。HashMap和hashSet的构造器允许你制定负载因子。这意味着,当负载达到制定值时,容器会自动成倍的增加容量,并将原有的对象重新分配,存入新的容器内(这称为“重散列”rehashing)。HashMap默认的负载因子为0.75,这很好的权衡了时间和空间的成本。

备注:为使散列分布均衡,Java的散列函数都使用2的整数次方来作为散列表的理想容量。对现代的处理器来说,除法和求余是最慢的动作。使用2的整数次方的散列表,可用掩码代替除法。因为get()是使用最多的操作,求余数的%操作是其开销的大部分,而使用2的整数次方可以消除此开销(也可能对hashCode()有些影响)

四、怎么重写hashCode()

现在的IDE工具中,一般都能自动的帮我们重写了hashCode()和equals()方法,但那或许并不是最优的,重写hashCode()有两个原则:

必须速度快,并且必须有意义。也就是说,它必须基于对象的内容生成散列码。

应该产生分布均匀的散列码。如果散列码都集中在一块,那么在某些区域的负载就会变得很重。

下面是怎么写出一份像样的hashCode()的基本指导:

1、给int变量result 赋予某个非零值常量,例如 17。

2、为每个对象内每个有意义的属性f (即每个可以做equals()的属性)计算出一个 int 散列码c:

3、合并计算得到的散列值:result=37*result+c;

4、返回 result;

5、检查hashCode()最后生成的结果,确保相同的对象有相同的散列码。

五、自定义HashMap

下面我们将自己写一个hashMap,便于了解底层的原理,大家如果看的懂下面的代码,也就很好的理解了hashCode的原理了。

/**
 * Description:首先新建一个类作为map中存储的对象并重写了hashCode()和equals()方法
 */
public class MPair implements Map.Entry,Comparable
{
  private Object key,value;

  public MPair(Object key,Object value)
  {
    this.key = key;
    this.value=value;
  }
  @Override
  public int compareTo(Object o)
  {
    return ((Comparable)key).compareTo(((MPair)o).key);
  }
  
  @Override
  public Object getKey()
  {
    return key;
  }

  @Override
  public Object getValue()
  {
    return value;
  }

   @Override
  public int hashCode()
  {
    int result = key != null &#63; key.hashCode() : 0;
    result = 31 * result + (value != null &#63; value.hashCode() : 0);
    return result;
  }

  @Override
  public boolean equals(Object o)
  {
    return key.equals(((MPair)o).key);
  }

  @Override
  public Object setValue(Object v)
  {
    Object result=value;
    this.value=v;
    return result;
  }
  
  @Override
  public String toString()
  {
    return "MPair{" + "key=" + key + ", value=" + value + '}';
  }
public class SimpleHashMap extends AbstractMap
{
  
  private static final int SZ=3;//定一个初始大小的哈希表容量
  private LinkedList[] linkedLists=new LinkedList[SZ];//建一个hash数组,用linkedList实现
  public Object put(Object key,Object value){
    Object result=null;
    int index=key.hashCode() % SZ;//对key的值做求模法求出index
    if (index<0) index=-index;
    if (linkedLists[index]==null) linkedLists[index]=new LinkedList();//如果这个index位置没有对象,就新建一个

    LinkedList linkedList = linkedLists[index];//取出这个index的对象linkedList
    MPair mPair = new MPair(key,value);//新建要存储的对象mPair
    ListIterator listIterator = linkedList.listIterator();
    boolean found =false;
    while (listIterator.hasNext()){//遍历这个index位置的List,如果查找到跟之前一样的对象(根据equals来比较),则更新那个key对应的value
      Object next = listIterator.next();
      if (next.equals(mPair)){
        result = ((MPair) next).getValue();
        listIterator.set(mPair);//更新动作
        found=true;
        break;
      }
    }
    if (!found) linkedLists[index].add(mPair);//如果没有找到这个对象,则在这index的List对象上新增一个元素。
    return result;

  }

  public Object get(Object key){
    int index = key.hashCode() % SZ;
    if (index<0) index=-index;
    if (linkedLists[index]==null) return null;
    LinkedList linkedList = linkedLists[index];
    MPair mPair=new MPair(key,null);//新建一个空的对象值,因为equals()的比较是看他们的key是否相等,而在List中的遍历对象的时候,是通过key来查找对象的。
    ListIterator listIterator = linkedList.listIterator();
    while (listIterator.hasNext()){
      Object next = listIterator.next();
      if (next.equals(mPair)) return ((MPair)next).getValue();//找到了这个key就返回这个value
    }
    return null;

  }

  @Override
  public Set entrySet()
  {
    Set set=new HashSet();
    for (int i=0;i

六、结语

不知道大家理解了没?整了我一天,终于还算大概理解了其中的原理了。文笔比较粗糙,大家凑活看吧,毕竟,不会做饭的作家不是好程序员啊!哈哈...... 或者,可能我有很多理解的不到位的地方,还请大家不吝指教!


推荐阅读
  • 胡蜂能进行逻辑推理的研究成果
    最新研究表明,胡蜂具备一定的逻辑推理能力,能够进行传递性推理。研究人员通过实验发现,胡蜂在避免电击的测试中,能够正确选择符合逻辑的选项。这项研究成果对于了解无脊椎动物的认知能力具有重要意义,也为解析胡蜂社会结构的进化提供了线索。 ... [详细]
  • 35岁程序员连续被2家公司裁掉,网友酸了,成功入职成事业编晒出福利
    这篇文章讲述了一个35岁程序员连续被两家公司裁掉的故事,他在遭遇中年危机后成功入职事业单位,并分享了入职后的福利。文章探讨了程序员在互联网行业中的竞争力下降的原因。 ... [详细]
  • 本文介绍了OC学习笔记中的@property和@synthesize,包括属性的定义和合成的使用方法。通过示例代码详细讲解了@property和@synthesize的作用和用法。 ... [详细]
  • C语言注释工具及快捷键,删除C语言注释工具的实现思路
    本文介绍了C语言中注释的两种方式以及注释的作用,提供了删除C语言注释的工具实现思路,并分享了C语言中注释的快捷键操作方法。 ... [详细]
  • 如何用UE4制作2D游戏文档——计算篇
    篇首语:本文由编程笔记#小编为大家整理,主要介绍了如何用UE4制作2D游戏文档——计算篇相关的知识,希望对你有一定的参考价值。 ... [详细]
  • 本文介绍了Python版Protobuf的安装和使用方法,包括版本选择、编译配置、示例代码等内容。通过学习本教程,您将了解如何在Python中使用Protobuf进行数据序列化和反序列化操作,以及相关的注意事项和技巧。 ... [详细]
  • sklearn数据集库中的常用数据集类型介绍
    本文介绍了sklearn数据集库中常用的数据集类型,包括玩具数据集和样本生成器。其中详细介绍了波士顿房价数据集,包含了波士顿506处房屋的13种不同特征以及房屋价格,适用于回归任务。 ... [详细]
  • 本文介绍了2019年上半年内蒙古计算机软考考试的报名通知和考试时间。考试报名时间为3月1日至3月23日,考试时间为2019年5月25日。考试分为高级、中级和初级三个级别,涵盖了多个专业资格。报名采取网上报名和网上缴费的方式进行,报考人员可登录内蒙古人事考试信息网进行报名。详细内容请点击查看。 ... [详细]
  • 拥抱Android Design Support Library新变化(导航视图、悬浮ActionBar)
    转载请注明明桑AndroidAndroid5.0Loollipop作为Android最重要的版本之一,为我们带来了全新的界面风格和设计语言。看起来很受欢迎࿰ ... [详细]
  • 从零学Java(10)之方法详解,喷打野你真的没我6!
    本文介绍了从零学Java系列中的第10篇文章,详解了Java中的方法。同时讨论了打野过程中喷打野的影响,以及金色打野刀对经济的增加和线上队友经济的影响。指出喷打野会导致线上经济的消减和影响队伍的团结。 ... [详细]
  • 闭包一直是Java社区中争论不断的话题,很多语言都支持闭包这个语言特性,闭包定义了一个依赖于外部环境的自由变量的函数,这个函数能够访问外部环境的变量。本文以JavaScript的一个闭包为例,介绍了闭包的定义和特性。 ... [详细]
  • Android源码深入理解JNI技术的概述和应用
    本文介绍了Android源码中的JNI技术,包括概述和应用。JNI是Java Native Interface的缩写,是一种技术,可以实现Java程序调用Native语言写的函数,以及Native程序调用Java层的函数。在Android平台上,JNI充当了连接Java世界和Native世界的桥梁。本文通过分析Android源码中的相关文件和位置,深入探讨了JNI技术在Android开发中的重要性和应用场景。 ... [详细]
  • Go GUIlxn/walk 学习3.菜单栏和工具栏的具体实现
    本文介绍了使用Go语言的GUI库lxn/walk实现菜单栏和工具栏的具体方法,包括消息窗口的产生、文件放置动作响应和提示框的应用。部分代码来自上一篇博客和lxn/walk官方示例。文章提供了学习GUI开发的实际案例和代码示例。 ... [详细]
  • 本文介绍了程序员最美的情人节礼物,即使用JS渲染的3D玫瑰,通过在QQ空间和人人网上分享这个特殊的礼物,可以给情人带来惊喜和喜悦。 ... [详细]
  • 海马s5近光灯能否直接更换为H7?
    本文主要介绍了海马s5车型的近光灯是否可以直接更换为H7灯泡,并提供了完整的教程下载地址。此外,还详细讲解了DSP功能函数中的数据拷贝、数据填充和浮点数转换为定点数的相关内容。 ... [详细]
author-avatar
大Joob
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有