JVM的艺术—JAVA内存模型 - HelloWorld开发者社区

*喜欢文章，动动手指点个赞 *

引言

亲爱读者你们好，关于jvm篇章的连载，前面三章讲了类加载器，本篇文章将进入jvm领域的另一个知识点，java内存模型。彻底的了解java内存模型，是有必要的。只要掌握了java的内存模型，内存空间分为哪些区域，才能更好地理解，java是如何创建对象以及如何分配对象的空间。对后续的jvm调优打下坚实的基础。而对于现在的互联网行业来说，高并发，高可用已经必不可少，而学好jvm调优，不仅能在企业工作当中针对高并发场景下的系统进行优化，在日常对系统的错误排查、系统的优化也起着至关重要的作用。希望这篇文章能让各位读者学到真正的本领。同时也感谢大家的持续关注和认可。

一：JDK体系结构

JVM的艺术—JAVA内存模型

JDK、JRE、JVM之间的关系

JDK：Java Development Kit（java开发工具包），包含JRE和开发工具包，例如javac、javah（生成实现本地方法所需的 C 头文件和源文件）。
JRE：Java Runtime Environment（java运行环境），包含JVM和类库。
JVM：Java Virtual Machine（Java虚拟机），负责执行符合规范的Class文件。

Java语言的跨平台特性

JVM的艺术—JAVA内存模型

JVM所处的位置

JVM的艺术—JAVA内存模型

(1)通常工作中所接触的基本是Java库和应用以及Java核心类库，知道如何使用就可以了，但是归根结底代码都是要编译成class文件由Java虚拟机装载执行，所产生的结果或者现象都可以通过Java虚拟机的运行机制来解释。一些相同的代码会由于虚拟机的实现不同而产生不同结果。

(2)在Java平台的结构中,可以看出，Java虚拟机(JVM)处在核心的位置，是程序与底层操作系统和硬件无关的关键。它的下方是移植接口，移植接口由两部分组成：适配器和Java操作系统,其中依赖于平台的部分称为适配器；JVM通过移植接口在具体的平台和操作系统上实现；在JVM的上方是Java的基本类库和扩展类库以及它们的API，利用Java API编写的应用程序(application)和小程序(Java applet)可以在任何Java平台上运行而无需考虑底层平台,就是因为有Java虚拟机(JVM)实现了程序与操作系统的分离，从而实现了Java的平台无关性。

(3)对JVM规范的的抽象说明是一些概念的集合，它们已经在书《The Java Virtual Machine Specification》（《Java虚拟机规范》）中被详细地描述了；对JVM的具体实现要么是软件，要么是软件和硬件的组合，它已经被许多生产厂商所实现，并存在于多种平台之上；运行Java程序的任务由JVM的运行期实例单个承担。

(4)JVM可以由不同的厂商来实现。由于厂商的不同必然导致JVM在实现上的一些不同，像国内就有著名的TaobaoVM；然而JVM还是可以实现跨平台的特性，这就要归功于设计JVM时的体系结构了。

(5)JVM在它的生存周期中有一个明确的任务，那就是装载字节码文件，一旦字节码进入虚拟机，它就会被解释器解释执行，或者是被即时代码发生器有选择的转换成机器码执行，即Java程序被执行。因此当Java程序启动的时候，就产生JVM的一个实例；当程序运行结束的时候，该实例也跟着消失了。

Class字节码

编译后被Java虚拟机所执行的代码使用了一种平台中立（不依赖于特定硬件及操作系统的）的二进制格式来表示，并且经常（但并非绝对）以文件的形式存储，因此这种格式被称为Class文件格式。Class文件格式中精确地定义了类与接口的表示形式，包括在平台相关的目标文件格式中一些细节上的惯例，
正如概念所说，Java为了能够实现平台无关性，制定了一套自己的二进制格式，并经常以文件的方式存储，称为Class文件。这样在不同平台上，只要都安装了Java虚拟机，具备Java运行环境[JRE]，那么都可以运行相同的Class文件。

JVM的艺术—JAVA内存模型

上图描述了Java程序运行的一个全过程，也可以看出Java平台由Java虚拟机和Java应用程序接口搭建，Java语言则是进入这个平台的通道，用Java语言编写并编译的程序可以运行在这个平台上。
由Java源文件编译生成字节码文件，这个过程非常复杂，学过《编译原理》的朋友都知道必须经过词法分析、语法分析、语义分析、中间代码生成、代码优化等；同样的，Java源文件到字节码的生成也想要经历这些步骤。Javac编译器的最后任务就是调用con.sun.tools.javac.jvm.Gen类将这课语法树编译为Java字节码文件。
其实，所谓的编译字节码，无非就是将符合Java语法规范的Java代码转化为符合JVM规范的字节码文件。JVM的架构模型是基于栈的，大部分都需要通过栈来完成。
字节码结构比较特殊，其内部不包含任何的分隔符，无法人工区分段落（字节码文件本身就是给机器读的），所以无论是字节顺序、数量都是有严格规定的，所有16位、32位、64位长度的数据都将构造成2个、4个、8个-----8位字节单位来表示，多字节数据项总是按照Big-endian顺序（高位字节在地址的最低位，地位字节在地址的最高位）来进行存储。
参考《Java虚拟机规范 Java SE7版》的描述，每一个字节码其实都对应着全局唯一的一个类或者接口的定义信息。字节码文件才用的是一种类似于C语言结构体的伪结构来描述字节码文件格式。字节码文件中对应的“基本类型”u1，u2，u4，u8分别表示无符号1、2、4、8个字节。

Class文件----总体格式
JVM的艺术—JAVA内存模型

值得一提的是，一个有效的class字节码文件的前4个字节为0xCAFEBABE,都是固定的，被称为“魔术”，即magic。它就是JVM用于校验所读取的目标文件是否是一个有效且合法的字节码文件。由此可见，JVM并不是通过判断文件后缀名的方式来校验，以防止人为手动修改。

JVM底层架构图

JVM的艺术—JAVA内存模型

上面这张图，是本人花了很多心思总结出来的，基本涵盖了java内存模型的结构。今天奉上。这篇文章会把上面这张图讲清楚。

运行时数据区：

1，堆

Java堆在虚拟机启动的时候被创建，Java堆主要用来为类实例对象和数组分配内存。Java虚拟机规范并没有规定对象在堆中的形式。
在Java中，堆被划分成两个不同的区域：新生代( Young )、老年代( Old )；这也就是JVM采用的“分代收集算法”，简单说，就是针对不同特征的java对象采用不同的策略实施存放和回收，自然所用分配机制和回收算法就不一样。新生代( Young ) 又被划分为三个区域：Eden、From Survivor、To Survivor。

分代收集算法：采用不同算法处理[存放和回收]Java瞬时对象和长久对象。大部分Java对象都是瞬时对象，朝生夕灭，存活很短暂，通常存放在Young新生代，采用复制算法对新生代进行垃圾回收。老年代对象的生命周期一般都比较长，极端情况下会和JVM生命周期保持一致；通常采用标记-压缩算法对老年代进行垃圾回收。
这样划分的目的是为了使JVM能够更好的管理堆内存中的对象，包括内存的分配以及回收。
　 Java堆可能发生如下异常情况：如果实际所需的堆超过了自动内存管理系统能提供的最大容量，那Java虚拟机将会抛出一个OutOfMemoryError异常。简称（OOM）。

堆大小 = 新生代 + 老年代。堆的大小可通过参数–Xms（堆的初始容量）、-Xmx（堆的最大容量）来指定。

其中，新生代 ( Young ) 被细分为 Eden 和两个 Survivor 区域，这两个 Survivor 区域分别被命名为 from 和 to，以示区分。默认的，Edem : from : to = 8 : 1 : 1 。(可以通过参数 –XX:SurvivorRatio 来设定。

即： Eden = 8/10 的新生代空间大小，from = to = 1/10 的新生代空间大小。

JVM 每次只会使用 Eden 和其中的一块 Survivor 区域来为对象服务，所以无论什么时候，总是有一块 Survivor 区域是空闲着的。

新生代实际可用的内存空间为 9/10 ( 即90% )的新生代空间。

java堆是GC垃圾回收的主要区域。 GC分为两种： Minor GC、Full GC（也叫做Major GC）

Minor GC(简称GC)
Minor GC是发生在新生代中的垃圾收集动作，所采用的是复制算法。
GC一般为堆空间某个区发生了垃圾回收，
新生代（Young）几乎是所有java对象出生的地方。即java对象申请的内存以及存放都是在这个地方。java中的大部分对象通常不会长久的存活，具有朝生夕死的特点。
当一个对象被判定为“死亡”的时候， GC就有责任来回收掉这部分对象的内存空间。
新生代是收集垃圾的频繁区域。

2，方法区（元空间）

方法区在虚拟机启动的时候被创建，它存储了每一个类的结构信息，例如运行时常量池、字段和方法数据、构造函数和普通方法的字节码内容、还包括在类、实例、接口初始化时用到的特殊方法。
方法区可能发生如下异常情况：如果方法区的内存空间不能满足内存分配请求，那Java虚拟机将抛出一个OutOfMemoryError异常.

3，JVM栈空间

每个Java虚拟机线程都有自己的Java虚拟机栈。Java虚拟机栈用来存放栈帧，而栈帧主要包括了：局部变量表、操作数栈、动态链接。Java虚拟机栈允许被实现为固定大小或者可动态扩展的内存大小。
Java虚拟机使用局部变量表来完成方法调用时的参数传递。局部变量表的长度在编译期已经决定了并存储于类和接口的二进制表示中，一个局部变量可以保存一个类型为boolean、byte、char、short、float、reference和returnAddress的数据，两个局部变量可以保存一个类型为long和double的数据。
　　Java虚拟机提供一些字节码指令来从局部变量表或者对象实例的字段中复制常量或变量值到操作数栈中，也提供了一些指令用于从操作数栈取走数据、操作数据和把操作结果重新入栈。在方法调用的时候，操作数栈也用来准备调用方法的参数以及接收方法返回结果。
　　每个栈帧中都包含一个指向运行时常量区的引用支持当前方法的动态链接。在Class文件中，方法调用和访问成员变量都是通过符号引用来表示的，动态链接的作用就是将符号引用转化为实际方法的直接引用或者访问变量的运行是内存位置的正确偏移量。
总的来说，Java虚拟机栈是用来存放局部变量和过程结果的地方。
Java虚拟机栈可能发生如下异常情况：如果Java虚拟机栈被实现为固定大小内存，线程请求分配的栈容量超过Java虚拟机栈允许的最大容量时，Java虚拟机将会抛出一个StackOverflowError异常。
如果Java虚拟机栈被实现为动态扩展内存大小，并且扩展的动作已经尝试过，但是目前无法申请到足够的内存去完成扩展，或者在建立新的线程时没有足够的内存去创建对应的虚拟机栈，那Java虚拟机将会抛出一个OutOfMemoryError异常。

1.符号引用（Symbolic References）：

　　符号引用以一组符号来描述所引用的目标，符号可以是任何形式的字面量，只要使用时能够无歧义的定位到目标即可。例如，在Class文件中它以CONSTANT_Class_info、CONSTANT_Fieldref_info、CONSTANT_Methodref_info等类型的常量出现。符号引用与虚拟机的内存布局无关，引用的目标并不一定加载到内存中。在Java中，一个java类将会编译成一个class文件。在编译时，java类并不知道所引用的类的实际地址，因此只能使用符号引用来代替。比如org.simple.People类引用了org.simple.Language类，在编译时People类并不知道Language类的实际内存地址，因此只能使用符号org.simple.Language（假设是这个，当然实际中是由类似于CONSTANT_Class_info的常量来表示的）来表示Language类的地址。各种虚拟机实现的内存布局可能有所不同，但是它们能接受的符号引用都是一致的，因为符号引用的字面量形式明确定义在Java虚拟机规范的Class文件格式中。