Javahashmapvshashset性能

作者：Devil灬旋律 | 来源：互联网 | 2023-02-10 13:16

如何解决《Javahashmapvshashset性能》经验，有好办法吗？

我有一个760万行的文件。每行的形式为：A，B，C，D，其中B，C，D是用于计算A的重要性级别的值，A是每行唯一的字符串标识符。我的方法：

private void read(String filename) throws Throwable {
        BufferedReader br  = new BufferedReader(new FileReader(filename));

        Map mmap = new HashMap<>(10000000,0.8f);
        String line;
        long t0 = System.currentTimeMillis();
        while ((line = br.readLine()) != null) {
            split(line);
            mmap.put(splitted[0], 0.0);
        }
        long t1 = System.currentTimeMillis();
        br.close();
        System.out.println("Completed in " + (t1 - t0)/1000.0 + " seconds");
}

private void split(String line) {
    int idxComma, idxToken = 0, fromIndex = 0;
    while ((idxComma = line.indexOf(delimiter, fromIndex)) != -1) {
        splitted[idxToken++] = line.substring(fromIndex, idxComma);
        fromIndex = idxComma + 1;
    }
    splitted[idxToken] = line.substring(fromIndex);
}

其中插入了虚拟值0.0以进行“概要分析”，并拆分了为该类定义的简单String数组。我最初使用String的split（）方法，但发现上述方法更快。

当我运行上面的代码时，花12秒钟来解析文件，这比我认为的要多。例如，如果我用字符串向量替换HashMap并仅从每一行中获取第一个条目（即，我没有在其中添加关联的值，因为它应该摊销常量），所以整个文件的读取时间少于3秒

这向我表明（i）HashMap中存在很多冲突（我已尝试通过预先分配大小并相应地设置负载因子来最大程度地减少调整大小的次数），或（ii）hashCode（）函数某种程度上很慢。我对此表示怀疑（ii），因为如果我使用HashSet，则可以在4秒内读取文件。

我的问题是：HashMap执行如此缓慢的原因可能是什么？hashCode（）是否不足以容纳这种大小的地图，或者从根本上讲我忽略了某些东西？

推荐阅读

io
将字符串数字拆分成单个数字_【LeetCode】842. 将数组拆分成斐波那契序列

【LeetCode】842.SplitArrayintoFibonacciSequence将数组拆分成斐波那契序列(Medium)(JAVA)题目描述：Givenas ... [详细]

蜡笔小新 2023-10-15 16:27:02
io
Java常用类之一：String类的使用方法和注意事项

Java常用类：String类目录Java常用类：String类StringString类常用方法案例演示String字符串是常量，创建之后不可改变字符串字面值存储在字符串池中，可 ... [详细]

蜡笔小新 2023-10-14 11:01:20
io
使用JSONObiect和Gson相关方法实现json数据与kotlin对象的相互转换

本文介绍了如何使用JSONObiect和Gson相关方法实现json数据与kotlin对象的相互转换。首先解释了JSON的概念和数据格式，然后详细介绍了相关API，包括JSONObject和Gson的使用方法。接着讲解了如何将json格式的字符串转换为kotlin对象或List，以及如何将kotlin对象转换为json字符串。最后提到了使用Map封装json对象的特殊情况。文章还对JSON和XML进行了比较，指出了JSON的优势和缺点。 ... [详细]

蜡笔小新 2023-12-11 16:20:50
io
Android实战——jsoup实现网络爬虫，糗事百科项目的起步

本文介绍了Android实战中使用jsoup实现网络爬虫的方法，以糗事百科项目为例。对于初学者来说，数据源的缺乏是做项目的最大烦恼之一。本文讲述了如何使用网络爬虫获取数据，并以糗事百科作为练手项目。同时，提到了使用jsoup需要结合前端基础知识，以及如果学过JS的话可以更轻松地使用该框架。 ... [详细]

蜡笔小新 2023-12-11 09:19:45
regex
splitjava的简单介绍

本文目录一览：1、Javasplit方法2、 ... [详细]

蜡笔小新 2023-10-16 15:51:58
io
华为OJ平台——DNA序列

题目描述：一个DNA序列由ACGT四个字母的排列组合组成。G和C的比例（定义为GC-Ratio）是序列中G和C两个字母的总的出现次数除以总的字母数目（也就是序列长度）。在基因工程中，这个 ... [详细]

蜡笔小新 2023-10-16 11:45:20
io
高程8.2location对象 8.3navigator对象

8.2location对象location对象既是window对象的属性,也是document对象的属性.window.location和document.location引用的是同一个对象. ... [详细]

蜡笔小新 2023-10-15 22:46:02
io
分治算法之两个N位数相乘 Java描述

两个N位数a和b相乘，手算的话一般是a的末位分别乘以b的末位到首位，然后a的倒数第二位分别乘以b的末位到首位，直到a的首位分别乘以b的末位到首位，最后按位数相加。这个过程的时间复杂度是O(n2)的。 ... [详细]

蜡笔小新 2023-10-14 16:35:06
io
@用法做回复

实现时主要问题在于怎么将所有对象给找出来，替换成user.name的形式。Overridepublicvoidsave(Comme ... [详细]

蜡笔小新 2023-10-14 12:08:51
io
Hadoop中的MapReduce框架原理、自定义Partitioner步骤、在Job驱动中，设置自定义Partitioner、Partition 分区案例

文章目录13.MapReduce框架原理13.3Shuffle机制13.3.2Partition分区13.3.2.3自定义Partitioner步骤13.3.2.3.1自定义类继承 ... [详细]

蜡笔小新 2023-10-14 11:44:52
io
初识ADT抽象数据类型

主人Github主页ADT（抽象数据类型）1.认识接口（interface）接口是java程序设计中的一种抽象的数据类 ... [详细]

蜡笔小新 2023-10-13 12:27:26
io
黑马程序员_HashCode与equals

-------------------------------------------------android培训、java培训期待与您交流！--------------------------- ... [详细]

蜡笔小新 2023-06-10 15:49:23
instance
java 散列与散列码探讨 ,简单HashMap实现散列映射表执行各种操作示列

java散列与散列码探讨,简单HashMap实现散列映射表执行各种操作示列packageorg.rui.collection2.maps;***散列与散列码*将土拔鼠对象与预报对象联系 ... [详细]

蜡笔小新 2023-06-09 16:36:51
instance
Java HashMap实现原理0——从hashCode,equals说起

Java集合类中常见的hashSet,hashMap,hashTable(现已很少用，几乎都采用hashMap替代)的实现都离不开散列表，而散列表的优势在于O(1)级别的查找，而has ... [详细]

蜡笔小新 2023-06-08 12:50:11
instance
如何正确的实现Java中的hashCode方法

你知道一个对象的唯一标志不能仅仅通过写一个漂亮的equals来实现太棒了，不过现在你也必须实现hashCode方法。让我们看看为什么和怎么做才是正确的。相等和哈希码相等是从一般的方面 ... [详细]

蜡笔小新 2023-06-07 17:40:08

Devil灬旋律

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章