JVM 对象分配过程

对象分配过程

1）依据逃逸分析，判断是否能栈上分配？
- 如果可以，使用标量替换方式，把对象分配到VM Stack中。如果线程销毁或方法调用结束后，自动销毁，不需要 GC 回收器介入。
- 否则，继续下一步。
2）判断是否大对象？
- 如果是，直接分配到堆上 Old Generation 老年代上。如果对象变为垃圾后，由老年代GC 收集器（比如 Parallel Old, CMS, G1）回收。
- 否则，继续下一步。
3）判断是否可以在 TLAB中分配？
- 如果是，在 TLAB中分配堆上Eden区。
- 否则，在 TLAB外堆上的Eden区分配。

栈上分配

本质上是JVM提供的一个优化技术。

基本思想：将线程私有的对象打散分配在栈 VM Stack上
优点：
- 可以在函数调用结束后自行销毁对象，不需要垃圾回收器的介入，有效避免垃圾回收带来的负面影响
- 栈上分配速度快，提高系统性能
局限性：
- 栈空间小，对于大对象无法实现栈上分配
技术基础： 逃逸分析、标量替换

什么是逃逸分析？

关于 Java 逃逸分析的定义：

逃逸分析（Escape Analysis）简单来讲就是，Java Hotspot 虚拟机可以分析新创建对象的使用范围，并决定是否在 Java 堆上分配内存的一项技术。

逃逸分析的 JVM 参数如下：

开启逃逸分析：-XX:+DoEscapeAnalysis
关闭逃逸分析：-XX:-DoEscapeAnalysis
显示分析结果：-XX:+PrintEscapeAnalysis

逃逸分析技术在 Java SE 6u23+ 开始支持，并默认设置为启用状态，可以不用额外加这个参数。

逃逸分析优化

针对上面第三点，当一个对象没有逃逸时，可以得到以下几个虚拟机的优化。

1) 锁消除

我们知道线程同步锁是非常牺牲性能的，当编译器确定当前对象只有当前线程使用，那么就会移除该对象的同步锁。

例如，StringBuffer 和 Vector 都是用 synchronized 修饰线程安全的，但大部分情况下，它们都只是在当前线程中用到，这样编译器就会优化移除掉这些锁操作。

锁消除的 JVM 参数如下：

开启锁消除：-XX:+EliminateLocks
关闭锁消除：-XX:-EliminateLocks

锁消除在 JDK8 中都是默认开启的，并且锁消除都要建立在逃逸分析的基础上。

2) 标量替换

首先要明白标量和聚合量，基础类型和对象的引用可以理解为标量，它们不能被进一步分解。而能被进一步分解的量就是聚合量，比如：对象。

对象是聚合量，它又可以被进一步分解成标量，将其成员变量分解为分散的变量，这就叫做标量替换。

这样，如果一个对象没有发生逃逸，那压根就不用创建它，只会在栈或者寄存器上创建它用到的成员标量，节省了内存空间，也提升了应用程序性能。

标量替换的 JVM 参数如下：

开启标量替换：-XX:+EliminateAllocations
关闭标量替换：-XX:-EliminateAllocations
显示标量替换详情：-XX:+PrintEliminateAllocations

标量替换同样在 JDK8 中都是默认开启的，并且都要建立在逃逸分析的基础上。

3) 栈上分配

当对象没有发生逃逸时，该对象就可以通过标量替换分解成成员标量分配在栈内存中，和方法的生命周期一致，随着栈帧出栈时销毁，减少了 GC 压力，提高了应用程序性能。

示例代码

import java.time.Instant;
/**
 * 栈上分配，依赖于逃逸分析和标量替换
 *
 * @author Sven Augustus
 */
public class TestTLAB {
  // private static User u;
  /**
   * 一个User对象的大小：markdown 8 + class pointer 4 + int 4 + string (oops) 4 + padding 4 = 24B <br> 如果分配 100_000_000 个，则需要
   * 2400_000_000 字节， 约 2.24 GB。
   */
  static class User {
    private int id;
    private String name;

    public User(int id, String name) {
      this.id = id;
      this.name = name;
    }
  }

  private static void alloc() {
    User u = new User(1, "SvenAugustus");
    // u = new User(1, "SvenAugustus");
  }
  public static void main(String[] args) throws InterruptedException {
    long start = Instant.now().toEpochMilli();
    for (int i = 0; i < 100_000_000; i++) {
      alloc();
    }
    System.out.println(Instant.now().toEpochMilli() - start);
  }
}

上述代码调用了1亿次alloc()，如果是分配到堆上，大概需要 2.2 GB的堆空间，如果堆空间小于该值，必然会触发GC。

使用如下VM参数运行，发现不会触发GC：

-server -Xmx15m -Xms15m -XX:+DoEscapeAnalysis -XX:+PrintGC -XX:-UseTLAB -XX:+EliminateAllocations

JVM 对象分配过程

使用如下参数（任意一行）运行，会发现触大量 GC：

//不使用逃逸分析
-server -Xmx15m -Xms15m -XX:+PrintGCDetails -XX:-UseTLAB -XX:-DoEscapeAnalysis -XX:+EliminateAllocations
//不使用标量替换
-server -Xmx15m -Xms15m -XX:+PrintGCDetails -XX:-UseTLAB -XX:+DoEscapeAnalysis -XX:-EliminateAllocations

JVM 对象分配过程

TLAB 分配

TLAB，全称Thread Local Allocation Buffer, 即：线程本地分配缓存。这是一块线程专用的内存分配区域。

TLAB占用的是eden区的空间。

在TLAB启用的情况下（默认开启），JVM会为每一个线程分配一块TLAB区域。

为什么需要TLAB？

这是为了加速对象的分配。

由于对象一般分配在堆上，而堆是线程共用的，因此可能会有多个线程在堆上申请空间，而每一次的对象分配都必须线程同步，会使分配的效率下降。

考虑到对象分配几乎是Java中最常用的操作，因此JVM使用了TLAB这样的线程专有区域来避免多线程冲突，提高对象分配的效率。

局限性： TLAB空间一般不会太大（占用eden区），所以大对象无法进行TLAB分配，只能直接分配到堆 Heap上。

大对象

大对象的 JVM 参数如下：

大对象到底多大：-XX:PreTenureSizeThreshold=n （仅适用于 DefNew / ParNew新生代垃圾回收器） https://bugs.openjdk.java.net/browse/JDK-8050209
G1回收器的大对象判断，则依据Region的大小（-XX:G1HeapRegionSize）来判断，如果对象大于Region50%以上，就判断为大对象Humongous Object。

by Sven Augustus https://my.oschina.net/langxSpirit