引子
这是由一个“无聊”的问题引发的故事:方法ipp和ppi分别会打印什么结果?
public class Opcode {
public static void main(String[] args) {
System.out.println("hello wang ni ma");
}
public void ipp(){
int i = 0;
i = i++;
System.out.println(i);
}
public void ppi(){
int i = 0;
i = ++i;
System.out.println(i);
}
}
当然了,把两个方法放在一起,凭借些许的逻辑思维分析,可以很快给出答案: 0 1
那JVM为什么会执行出这样的结果呢,本文将结合 字节码 和 虚拟机栈 做出解释。
番外
javap 反汇编器
javap是JDK自带的反汇编器,可以查看java编译器为我们生成的字节码。通过它,我们可以对照源代码和字节码,从而了解很多编译器内部的工作。
java字节码指令集
Java 程序编译之后就变成了一条条字节码指令,其形式类似汇编,但和汇编有不同之处:
- 汇编指令的操作数存放在数据段和寄存器中,可通过存储器或寄存器寻址找到需要的操作数;
- Java 字节码指令的操作数存放在操作数栈中(可以理解为JVM内部虚拟寄存器),当执行某条带 n 个操作数的指令时,就从栈顶取 n 个操作数,然后把指令的计算结果(如果有的话)入栈。
由于操作数栈是内存空间,所以字节码指令不必担心不同机器上寄存器以及机器指令的差别,从而做到了平台无关。
Java虚拟机的指令由一个字节长度的、代表着某种特定操作含义的操作码(Opcode)以及跟随其后的零至多个代表此操作所需参数的操作数(Operands)所构成。
列举本文用到的基本指令:
- 加载和存储指令
将一个局部变量加载到操作栈:iload_
将一个数值从操作数栈存储到局部变量表:istore_
将一个常量加载到操作数栈:iconst_
- 运算指令 (运算之后的结果会自动入栈)
局部变量自增指令:iinc
对于大部分与数据类型相关的字节码指令,他们的操作码助记符中都有特殊的字符来表明专门为哪种数据类型服务:
- i -- int
- l -- long
- s -- short
- b -- byte
- c -- char
- f -- float
- d -- double
- a -- reference
正题
我们用javac编译上面的Opcode.java,然后“javap -c”查看字节码:
javap命令加入“-v”可以看到更详细的信息(常量池) :
虚拟机栈图解
在看图之前我们先了解几个概念:
- Java虚拟机(JVM)是基于栈结构的,其中的“栈”指的就是操作数栈。
- 在代码的实际运行中,每个线程都会创建一个JVM栈存储栈帧(frame)。每当有方法调用时,frame就会被创建;当这个方法返回时,frame出栈。
- 一个frame由三部分组成:操作数栈(Oprand Stack)、局部变量表(Local Variable Table)、当前方法所在类的运行常量池的引用(The Reference of Constant Pool)。
- 局部变量表,存储的是方法的参数和局部变量的值。存储参数的索引从0开始,如果是构造方法或者实例化方法的frame,那么局部变量数组的“0”处存储的是“this”引用,然后再从“1”开始存储形参和局部变量;如果是静态方法的frame,局部变量表不会存储“this”引用,而是从“0”开始存储形参和局部变量。
- 操作数栈,临时存储参与运算的数值,然后进行相关操作。和局部变量表一样,操作数栈也是一个以字长为单位的数组。但是和前者不同的是,它不是通过索引来访问,而是通过标准的栈操作压栈/出栈来访问的。
- 常量池,存储在JVM内存线程共享区的“方法区”,在类初始化的时候,会为给出的常量分配一个常量池,并且为每一个常量给出引用。
ipp()
把常量“0”加载到操作数栈,指令“iconst_0”中的“0”代表int常量“0”
操作数栈:[0]
局部变量表:[this]
“i = i++;”进行了四次操作:
1 “istore_1”将操作数栈中栈顶的int压入局部变量表“1”的位置
操作数栈:[]
局部变量表:[this, 0]
2 “iload_1”将局部变量表“1”处的int加载到操作数栈
操作数栈:[0]
局部变量表:[this, 0]
3 “iinc 1, 1”将局部变量表“1”处的int做自增运算,结果自动入栈
操作数栈:[0]
局部变量表:[this, 1]
4 “istore_1”将操作数栈“1”处的int压入局部变量表
操作数栈:[]
局部变量表:[this, 0]
“System.out.println(i);”进行了三次操作:
1 “getstatic #2”指向常量池中的第2个位置,载入“System.out”域
2 “iload_1”将局部变量表“1”处的int加载到操作数栈
操作数栈:[0]
局部变量表:[this, 0]
3 “invokevirtul #5”指向常量池中的第5个位置,”调用实例方法“println”打印操作数栈的数值“0”
至此,ipp()方法的分析完成了,理解之后,反观ppi()方法的字节码信息,有一处不同:
相当于“i = i++”操作是先加载了局部变量表中的“0”到操作数栈,然后在局部变量表中做自增运算;而“i = ++i”是先在局部变量表中做自增运算,此时的值已经变成“1”,然后再把局部变量表中的“1”加载到操作数栈。这也就印证了坊间流传的“i++是先赋值后运算,++i是先运算后赋值”这一说法。
引申
思考下面这段代码会输出什么:
int i = 0;
System.out.println(i+++i);
总结
以上内容是本人对JVM阶段性学习的总结,过程是以“《深入理解Java虚拟机:JVM高级特性与最佳实践(第2版)》——方志明著”为主导,网络诸多老师的文章为辅助。希望可以做到见微知著,同时本文内容如有错误或引起歧义,欢迎读者留言予以斧正。
优 雅 必 胜