一个Java对象占用多大_一个Java对象占用多大内存

作者：用户ll08sq9y2x | 来源：互联网 | 2023-06-01 23:03

这个问题一般会出现在稍微高端一点的Java面试环节。要求面试者不仅对Java基础知识熟悉，更重要的是要了解内存模型。Java对象模型#HotSpotJVM使用名为oo

这个问题一般会出现在稍微高端一点的 Java 面试环节。要求面试者不仅对 Java 基础知识熟悉&＃xff0c;更重要的是要了解内存模型。

Java 对象模型#

HotSpot JVM 使用名为 oops (Ordinary Object Pointers) 的数据结构来表示对象。这些 oops 等同于本地 C 指针。 instanceOops 是一种特殊的 oop&＃xff0c;表示 Java 中的对象实例。

在 Hotspot VM 中&＃xff0c;对象在内存中的存储布局分为 3 块区域&＃xff1a;

对象头(Header)

实例数据(Instance Data)

对齐填充(Padding)

对象头又包括三部分&＃xff1a;MarkWord、元数据指针、数组长度。

MarkWord&＃xff1a;用于存储对象运行时的数据&＃xff0c;好比 HashCode、锁状态标志、GC分代年龄等。这部分在 64 位操作系统下占 8 字节&＃xff0c;32 位操作系统下占 4 字节。

指针&＃xff1a;对象指向它的类元数据的指针&＃xff0c;虚拟机通过这个指针来确定这个对象是哪一个类的实例。

这部分就涉及到指针压缩的概念&＃xff0c;在开启指针压缩的状况下占 4 字节&＃xff0c;未开启状况下占 8 字节。

数组长度&＃xff1a;这部分只有是数组对象才有&＃xff0c;若是是非数组对象就没这部分。这部分占 4 字节。

实例数据就不用说了&＃xff0c;用于存储对象中的各类类型的字段信息(包括从父类继承来的)。

关于对齐填充&＃xff0c;Java 对象的大小默认是按照 8 字节对齐&＃xff0c;也就是说 Java 对象的大小必须是 8 字节的倍数。若是算到最后不够 8 字节的话&＃xff0c;那么就会进行对齐填充。

那么为何非要进行 8 字节对齐呢&＃xff1f;这样岂不是浪费了空间资源&＃xff1f;

其实不然&＃xff0c;由于 CPU 进行内存访问时&＃xff0c;一次寻址的指针大小是 8 字节&＃xff0c;正好也是 L1 缓存行的大小。如果不进行内存对齐&＃xff0c;则可能出现跨缓存行的情况&＃xff0c;这叫做缓存行污染。

由于当 obj1 对象的字段被修改后&＃xff0c;那么 CPU 在访问 obj2 对象时&＃xff0c;必须将其重新加载到缓存行&＃xff0c;因此影响了程序执行效率。

也就说&＃xff0c;8字节对齐&＃xff0c;是为了效率的提高&＃xff0c;以空间换时间的一种方案。固然你还能够 16 字节对齐&＃xff0c;可是 8 字节是最优选择。

正如我们之前看到的&＃xff0c;JVM 为对象进行填充&＃xff0c;使其大小变为 8 个字节的倍数。使用这些填充后&＃xff0c;oops 中的最后三位始终为零。这是因为在二进制中 8 的倍数的数字总是以 000 结尾。

由于 JVM 已经知道最后三位始终为零&＃xff0c;因此在堆中存储那些零是没有意义的。相反假设它们存在并存储 3 个其他更重要的位&＃xff0c;以此来模拟 35 位的内存地址。现在我们有一个带有 3 个右移零的 32 位地址&＃xff0c;所以我们将 35 位指针压缩成 32 位指针。这意味着我们可以在不使用 64 位引用的情况下使用最多 32 GB &＃xff1a;

(2(32&＃43;3)&＃61;235&＃61;32 GB) 的堆空间。

当 JVM 需要在内存中找到一个对象时&＃xff0c;它将指针向左移动 3 位。另一方面当堆加载指针时&＃xff0c;JVM 将指针向右移动 3 位以丢弃先前添加的零。虽然这个操作需要 JVM 执行更多的计算以节省一些空间&＃xff0c;不过对于大多数CPU来说&＃xff0c;位移是一个非常简单的操作。

要启用 oop 压缩&＃xff0c;我们可以使用标志 -XX&＃xff1a;&＃43;UseCompressedOops 进行调整&＃xff0c;只要最大堆大小小于 32 GB。当最大堆大小超过32 GB时&＃xff0c;JVM将自动关闭 oop 压缩。

当 Java 堆大小大于 32GB 时也可以使用压缩指针。虽然默认对象对齐是 8 个字节&＃xff0c;但可以使用 -XX&＃xff1a;ObjectAlignmentInBytes 配置字节值。指定的值应为 2 的幂&＃xff0c;并且必须在 8 和 256 的范围内。

我们可以使用压缩指针计算最大可能的堆大小&＃xff0c;如下所示&＃xff1a;

Copy

4 GB * ObjectAlignmentInBytes

例如&＃xff0c;当对象对齐为 16 个字节时&＃xff0c;通过压缩指针最多可以使用 64 GB 的堆空间。

基本类型占用存储空间和指针压缩#

基础对象占用存储空间

Java 基础对象在内存中占用的空间如下&＃xff1a;

类型占用空间(byte)

boolean

byte

short

char

int

float

long

double

另外&＃xff0c;引用类型在 32 位系统上每个引用对象占用 4 byte&＃xff0c;在 64 位系统上每个引用对象占用 8 byte。

对于 32 位系统&＃xff0c;内存地址的宽度就是32位&＃xff0c;这就意味着我们最大能获取的内存空间是 2^32(4 G)字节。在 64 位的机器中&＃xff0c;理论上我们能获取到的内存容量是 2^64 字节。

当然这只是一个理论值&＃xff0c;现实中因为有一堆有关硬件和软件的因素限制&＃xff0c;我们能得到的内存要少得多。比如说&＃xff0c;Windows 7 Home Basic 64 位最大仅支持 8GB 内存、Home Premium 为 192GB&＃xff0c;此外高端的Enterprise、Ultimate 等则支持支持 192GB 的最大内存。

因为系统架构限制&＃xff0c;Windows 32位系统能够识别的内存最大在 3.235GB 左右&＃xff0c;也就是说 4GB 的内存条有 0.5GB 左右用不了。2GB 内存条或者 2GB&＃43;1GB 内存条用 32 位系统丝毫没有影响。

现在一般都是使用 64 位的系统&＃xff0c;虽然能支持更大的内存空间&＃xff0c;但是也会有另一些问题。

像引用类型在 64 位系统上占用 8 个字节&＃xff0c;那么引用对象将会占用更多的堆空间。从而加快了 GC 的发生。其次会降低CPU缓存的命中率&＃xff0c;缓存大小是固定的&＃xff0c;对象越大能缓存的对象个数就越少。

Java 中基础数据类型是在栈上分配还是在堆上分配&＃xff1f;

我们继续深究一下&＃xff0c;基本数据类占用内存大小是固定的&＃xff0c;那具体是在哪分配的呢&＃xff0c;是在堆还是栈还是方法区&＃xff1f;大家不妨想想看&＃xff01; 要解答这个问题&＃xff0c;首先要看这个数据类型在哪里定义的&＃xff0c;有以下三种情况。

如果在方法体内定义的&＃xff0c;这时候就是在栈上分配的

如果是类的成员变量&＃xff0c;这时候就是在堆上分配的

如果是类的静态成员变量&＃xff0c;在方法区上分配的

指针压缩

引用类型在 64 位系统上占用 8 个字节&＃xff0c;虽然一个并不大&＃xff0c;但是耐不住多。

所以为了解决这个问题&＃xff0c;JDK 1.6 开始 64 bit JVM 正式支持了 -XX:&＃43;UseCompressedOops (需要jdk1.6.0_14) &＃xff0c;这个参数可以压缩指针。

启用 CompressOops 后&＃xff0c;会压缩的对象包括&＃xff1a;

对象的全局静态变量(即类属性)&＃xff1b;

对象头信息&＃xff1a;64 位系统下&＃xff0c;原生对象头大小为 16 字节&＃xff0c;压缩后为 12 字节&＃xff1b;

对象的引用类型&＃xff1a;64 位系统下&＃xff0c;引用类型本身大小为 8 字节&＃xff0c;压缩后为 4 字节&＃xff1b;

对象数组类型&＃xff1a;64 位平台下&＃xff0c;数组类型本身大小为 24 字节&＃xff0c;压缩后 16 字节。

当然压缩也不是万能的&＃xff0c;针对一些特殊类型的指针 JVM是不会优化的。比如&＃xff1a;

指向非 Heap 的对象指针

局部变量、传参、返回值、NULL指针。

CompressedOops 工作原理

32 位内最多可以表示 4GB&＃xff0c;64 位地址为堆的基地址 &＃43; 偏移量&＃xff0c;当堆内存 <32GB 时候&＃xff0c;在压缩过程中&＃xff0c;把偏移量 / 8 后保存到 32 位地址。在解压再把 32 位地址放大 8 倍&＃xff0c;所以启用 CompressedOops 的条件是堆内存要在 4GB * 8&＃61;32GB 以内。

JVM 的实现方式是&＃xff0c;不再保存所有引用&＃xff0c;而是每隔 8 个字节保存一个引用。例如&＃xff0c;原来保存每个引用 0、1、2...&＃xff0c;现在只保存 0、8、16...。因此&＃xff0c;指针压缩后&＃xff0c;并不是所有引用都保存在堆中&＃xff0c;而是以 8 个字节为间隔保存引用。

在实现上&＃xff0c;堆中的引用其实还是按照 0x0、0x1、0x2... 进行存储。只不过当引用被存入 64 位的寄存器时&＃xff0c;JVM 将其左移 3 位(相当于末尾添加 3 个0)&＃xff0c;例如 0x0、0x1、0x2... 分别被转换为 0x0、0x8、0x10。而当从寄存器读出时&＃xff0c;JVM 又可以右移 3 位&＃xff0c;丢弃末尾的 0。(oop 在堆中是 32 位&＃xff0c;在寄存器中是 35 位&＃xff0c;2的 35 次方 &＃61; 32G。也就是说使用 32 位&＃xff0c;来达到 35 位 oop 所能引用的堆内存空间)。

Java 对象到底占用多大内存#

前面我们分析了 Java 对象到底都包含哪些东西&＃xff0c;所以现在我们可以开始剖析一个 Java 对象到底占用多大内存。

由于现在基本都是 64 位的虚拟机&＃xff0c;所以后面的讨论都是基于 64 位虚拟机。首先记住公式&＃xff0c;对象由对象头 &＃43; 实例数据 &＃43; padding 填充字节组成&＃xff0c;虚拟机规范要求对象所占内存必须是 8 的倍数&＃xff0c;padding 就是干这个的。

上面说过对象头由 Markword &＃43; 类指针kclass(该指针指向该类型在方法区的元类型) 组成。

Markword

Hotspot 虚拟机文档 “oops/oop.hp” 有对 Markword 字段的定义&＃xff1a;

64 bits:

--------

unused:25 hash:31 -->| unused:1 age:4 biased_lock:1 lock:2 (normal object)

JavaThread:54 epoch:2 unused:1 age:4 biased_lock:1 lock:2 (biased object)

PromotedObject:61 --------------------->| promo_bits:3 ----->| (CMS promoted object)

size:64 ----------------------------------------------------->| (CMS free block)

这里简单解释下这几种 object&＃xff1a;

normal object&＃xff0c;初始 new 出来的对象都是这种状态

biased object&＃xff0c;当某个对象被作为同步锁对象时&＃xff0c;会有一个偏向锁&＃xff0c;其实就是存储了持有该同步锁的线程 id&＃xff0c;关于偏向锁的知识这里就不再赘述了&＃xff0c;大家可以自行查阅相关资料。

CMS promoted object 和 CMS free block 我也不清楚到底是啥&＃xff0c;但是看名字似乎跟CMS 垃圾回收器有关&＃xff0c;这里我们也可以暂时忽略它们

我们主要关注 normal object&＃xff0c; 这种类型的 Object 的 Markword 一共是 8 个字节(64位)&＃xff0c;其中 25 位暂时没有使用&＃xff0c;31 位存储对象的 hash 值(注意这里存储的 hash 值对根据对象地址算出来的 hash 值&＃xff0c;不是重写 hashcode 方法里面的返回值)&＃xff0c;中间有 1 位没有使用&＃xff0c;还有 4 位存储对象的 age(分代回收中对象的年龄&＃xff0c;超过 15 晋升入老年代)&＃xff0c;最后三位表示偏向锁标识和锁标识&＃xff0c;主要就是用来区分对象的锁状态(未锁定&＃xff0c;偏向锁&＃xff0c;轻量级锁&＃xff0c;重量级锁)

biased object 的对象头 Markword 前 54 位来存储持有该锁的线程 id&＃xff0c;这样就没有空间存储 hashcode了&＃xff0c;所以对于没有重写 hashcode 的对象&＃xff0c;如果 hashcode 被计算过并存储在对象头中&＃xff0c;则该对象作为同步锁时&＃xff0c;不会进入偏向锁状态&＃xff0c;因为已经没地方存偏向 thread id 了&＃xff0c;所以我们在选择同步锁对象时&＃xff0c;最好重写该对象的 hashcode 方法&＃xff0c;使偏向锁能够生效。

我们来 new 一个空对象&＃xff1a;

Copy

class ObjA {

}

理论上一个空对象占用内存大小只有对象头信息&＃xff0c;对象头占 12 个字节。那么 ObjA.class 应该占用的存储空间就是 12 字节&＃xff0c;考虑到 8 字节的对齐填充&＃xff0c;那么会补上 4 字节填充到 8 的 2倍&＃xff0c;总共就是 16字节。怎么验证我们的结论呢&＃xff1f;JDK 提供了一个工具&＃xff0c;JOL 全称为 Java Object Layout&＃xff0c;是分析 JVM 中对象布局的工具&＃xff0c;该工具大量使用了 Unsafe、JVMTI 来解码布局情况。下面我们就使用这个工具来获取一个 Java 对象的大小。

首先引入 Maven 依赖&＃xff1a;

Copy

org.openjdk.jol

jol-core

0.14

我们来看使用&＃xff1a;

Copy

package com.trace.agent;

import org.openjdk.jol.info.ClassLayout;

import java.util.List;

/**

* &＃64;author rickiyang

* &＃64;date 2020-12-27

* &＃64;Desc TODO

public class ObjSiZeTest {

public static void main(String[] args) {

ClassLayout classLayout &＃61; ClassLayout.parseInstance(new ObjA());

System.out.println(classLayout.toPrintable());

}

class ObjA {

}

输出&＃xff1a;

Copy

com.trace.agent.ObjA object internals:

OFFSET SIZE TYPE DESCRIPTION VALUE

0 4 (object header) 01 00 00 00 (00000001 00000000 00000000 00000000) (1)

4 4 (object header) 00 00 00 00 (00000000 00000000 00000000 00000000) (0)

8 4 (object header) 43 c1 00 f8 (01000011 11000001 00000000 11111000) (-134168253)

12 4 (loss due to the next object alignment)

Instance size: 16 bytes

Space losses: 0 bytes internal &＃43; 4 bytes external &＃61; 4 bytes total

从上面的结果能看到对象头是 12 个字节&＃xff0c;还有 4 个字节的 padding&＃xff0c;一共 16 个字节。我们的推测结果没有错。

接着看另一个案例&＃xff1a;

Copy

package com.trace.agent;

import org.openjdk.jol.info.ClassLayout;

/**

* &＃64;author rickiyang

* &＃64;date 2020-12-27

* &＃64;Desc TODO

public class ObjSiZeTest {

public static void main(String[] args) {

ClassLayout classLayout &＃61; ClassLayout.parseInstance(new ObjA());

System.out.println(classLayout.toPrintable());

}

class ObjA {

private int i;

private double d;

private Integer io;

}

一共三个属性&＃xff1a;

int 类型占 4 个字节 &＃xff0c;double 类型占 8 个字节&＃xff0c;Integer 是引用类型&＃xff0c;64 位系统占 4 个字节。一共 16 个字节。

加上对象头 12 字节&＃xff0c;显然不够 8 的倍数&＃xff0c;所以还得 4 字节的填充&＃xff0c;加起来就是 32 字节

接着使用 JOL 来分析一下&＃xff1a;

Copy

com.trace.agent.ObjA object internals:

OFFSET SIZE TYPE DESCRIPTION VALUE

0 4 (object header) 01 00 00 00 (00000001 00000000 00000000 00000000) (1)

4 4 (object header) 00 00 00 00 (00000000 00000000 00000000 00000000) (0)

8 4 (object header) 43 c1 00 f8 (01000011 11000001 00000000 11111000) (-134168253)

12 4 int ObjA.i 0

16 8 double ObjA.d 0.0

24 4 java.lang.Integer ObjA.io null

28 4 (loss due to the next object alignment)

Instance size: 32 bytes

Space losses: 0 bytes internal &＃43; 4 bytes external &＃61; 4 bytes total

一共 32 字节。

推荐阅读

main
[大整数乘法] java代码实现

本文介绍了使用java代码实现大整数乘法的过程，同时也涉及到大整数加法和大整数减法的计算方法。通过分治算法来提高计算效率，并对算法的时间复杂度进行了研究。详细代码实现请参考文章链接。 ... [详细]

蜡笔小新 2023-12-13 11:21:32
main
Java中包装类的设计原因以及操作方法

本文主要介绍了Java中设计包装类的原因以及操作方法。在Java中，除了对象类型，还有八大基本类型，为了将基本类型转换成对象，Java引入了包装类。文章通过介绍包装类的定义和实现，解答了为什么需要包装类的问题，并提供了简单易用的操作方法。通过本文的学习，读者可以更好地理解和应用Java中的包装类。 ... [详细]

蜡笔小新 2023-12-12 15:48:10
main
java boolean 大小_java boolean 大小

先看官方文档TheJavaTutorialshavebeenwrittenforJDK8.Examplesandpracticesdescribedinthispagedontta ... [详细]

蜡笔小新 2023-12-12 13:36:56
copy
文件压缩解压的哈夫曼树实现

本文介绍了使用哈夫曼树实现文件压缩和解压的方法。首先对数据结构课程设计中的代码进行了分析，包括使用时间调用、常量定义和统计文件中各个字符时相关的结构体。然后讨论了哈夫曼树的实现原理和算法。最后介绍了文件压缩和解压的具体步骤，包括字符统计、构建哈夫曼树、生成编码表、编码和解码过程。通过实例演示了文件压缩和解压的效果。本文的内容对于理解哈夫曼树的实现原理和应用具有一定的参考价值。 ... [详细]

蜡笔小新 2023-12-11 14:13:46
main
如何在有序字符序列中插入新字符并保持有序

本文介绍了如何在给定的有序字符序列中插入新字符，并保持序列的有序性。通过示例代码演示了插入过程，以及插入后的字符序列。 ... [详细]

蜡笔小新 2023-12-14 11:16:33
main
Java中vector的使用详解

本文详细介绍了Java中vector的使用方法和相关知识，包括vector类的功能、构造方法和使用注意事项。通过使用vector类，可以方便地实现动态数组的功能，并且可以随意插入不同类型的对象，进行查找、插入和删除操作。这篇文章对于需要频繁进行查找、插入和删除操作的情况下，使用vector类是一个很好的选择。 ... [详细]

蜡笔小新 2023-12-13 14:14:39
runtime
C++字符字符串处理及字符集编码方案

本文介绍了C++中字符字符串处理的问题，并详细解释了字符集编码方案，包括UNICODE、Windows apps采用的UTF-16编码、ASCII、SBCS和DBCS编码方案。同时说明了ANSI C标准和Windows中的字符/字符串数据类型实现。文章还提到了在编译时需要定义UNICODE宏以支持unicode编码，否则将使用windows code page编译。最后，给出了相关的头文件和数据类型定义。 ... [详细]

蜡笔小新 2023-12-13 04:59:58
byte
Redis底层数据结构之压缩列表的介绍及实现原理

本文介绍了Redis底层数据结构之压缩列表的概念、实现原理以及使用场景。压缩列表是Redis为了节约内存而开发的一种顺序数据结构，由特殊编码的连续内存块组成。文章详细解释了压缩列表的构成和各个属性的含义，以及如何通过指针来计算表尾节点的地址。压缩列表适用于列表键和哈希键中只包含少量小整数值和短字符串的情况。通过使用压缩列表，可以有效减少内存占用，提升Redis的性能。 ... [详细]

蜡笔小新 2023-12-12 16:06:05
byte
JDK源码学习之HashTable(附带面试题)的学习笔记

本文介绍了JDK源码学习之HashTable(附带面试题)的学习笔记，包括HashTable的定义、数据类型、与HashMap的关系和区别。文章提供了干货，并附带了其他相关主题的学习笔记。 ... [详细]

蜡笔小新 2023-12-12 13:05:17
text
Python自动提取文本中的时间（包含中文日期）及特殊时间识别方法

本文介绍了在处理不规则数据时如何使用Python自动提取文本中的时间日期，包括使用dateutil.parser模块统一日期字符串格式和使用datefinder模块提取日期。同时，还介绍了一段使用正则表达式的代码，可以支持中文日期和一些特殊的时间识别，例如'2012年12月12日'、'3小时前'、'在2012/12/13哈哈'等。 ... [详细]

蜡笔小新 2023-12-12 12:09:33
text
模板引擎StringTemplate的使用方法和特点

本文介绍了模板引擎StringTemplate的使用方法和特点，包括强制Model和View的分离、Lazy-Evaluation、Recursive enable等。同时，还介绍了StringTemplate语法中的属性和普通字符的使用方法，并提供了向模板填充属性的示例代码。 ... [详细]

蜡笔小新 2023-12-11 21:45:03
uri
to_a和to_ary有什么区别？ - What's the difference between to_a and to_ary?

Whatsthedifferencebetweento_aandto_ary?to_a和to_ary有什么区别？ ... [详细]

蜡笔小新 2023-12-11 19:30:04
copy
Oracle 11g物理Active Data Guard实时查询（Realtime query）特性

在Oracle11g以前版本中的的DataGuard物理备用数据库，可以以只读的方式打开数据库，但此时MediaRecovery利用日志进行数据同步的过 ... [详细]

蜡笔小新 2023-12-11 15:49:10
main
在虚拟服务器上安装oracle 10g客户端的问题及解决方法

本文讨论了在VMWARE5.1的虚拟服务器Windows Server 2008R2上安装oracle 10g客户端时出现的问题，并提供了解决方法。错误日志显示了异常访问违例，通过分析日志中的问题帧，找到了解决问题的线索。文章详细介绍了解决方法，帮助读者顺利安装oracle 10g客户端。 ... [详细]

蜡笔小新 2023-12-11 13:08:10
main
微软的STL容器类实现是否线程安全？

本文讨论了微软的STL容器类是否线程安全。根据MSDN的回答，STL容器类包括vector、deque、list、queue、stack、priority_queue、valarray、map、hash_map、multimap、hash_multimap、set、hash_set、multiset、hash_multiset、basic_string和bitset。对于单个对象来说，多个线程同时读取是安全的。但如果一个线程正在写入一个对象，那么所有的读写操作都需要进行同步。 ... [详细]

蜡笔小新 2023-12-11 11:53:23

用户ll08sq9y2x

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章