Java字节码入门

Wesley13
• 阅读 805

字节码入门

Hello world

public class Helloworld {

    public static void main(String[] args) {
        System.out.println("hello,world");

    }

}

如果用javap查看此类结构

javap -c Helloworld.class

输出是

public class com.beetl.myos.ch1.Helloworld {
  public com.beetl.myos.ch1.Helloworld();
    Code:
       0: aload_0
       1: invokespecial #8                  // Method java/lang/Object."<init>":()V
       4: return

  public static void main(java.lang.String[]);
    Code:
       0: getstatic     #16                 // Field java/lang/System.out:Ljava/io/PrintStream;
       3: ldc           #22                 // String hello,world
       5: invokevirtual #24                 // Method java/io/PrintStream.println:(Ljava/lang/String;)V
       8: return
}

注意

javap 是java内置的反编译工具,属于jdk 一部分,确保JAVA_HOME 被正确设置,以及JAVA_HOME\bin 被设置成Path。

从javap输出了俩部分,首先是构造函数,用了三个直接码指令。如果熟悉java编程的,就知道,尽管没有为Helloworld提供构造函数,但Java会提供一个默认的构造函数,我们通过反编译类就能看到,有个叫的构造函数,这是程序在编译成class的时候创建的。这三个指令依次是aload_0 invokespecial return

  1. aload_0 此指令告诉虚拟机,将局部变量this放入操作栈里。对于每一个方法(构造函数从字节码角度来讲,也是一个方法,并无区别),方法的参数,以及方法中申明的变量都是在编译期间确定好的,按照出现顺序存放在方法栈(method stack)的局部变量表里,位置0 总是默认留给this,其后的位置留给方法的申明参数列表,再之后是留给方法内部用到的局部变量,我们将在下一节会详细介绍指令的数据结构基础。在这,我们只需要清楚 aload_0 是变量表里第一个对象this放到操作栈里

  2. invokespecial #8 此指令,告诉虚拟机,调用常亮池里(constant pool)的方法,也即是如javap输出的Method java/lang/Object."":()V. invokespecial 指令要求操作栈(Operand Stack)有一个对象引用,也就是 也就是刚通过aload_0压入的this,invokespecial 其后的参数指向常量池的init方法。正如invokespecial 名字所暗示的那样,此指令只用于一些特殊方法调用,如实例的初始化方法,私有方法,父类方法

操作栈

索引

内容

0

this

  1. return 不带值的返回,如果需要返回一个对象,则用aretrun,返回一个整形,用ireturn ,这些指令都要求操作栈里都有响应的值。 4.

对于第二部分,javap输出了4个指令

  1. getstatic #16 将静态字段压入操作栈,#16指向了常量池里的System.out 对象

  2. ldc,因为我们知道,System.out.println 还需要一个参数,因此ldc #22 指令会压入#22所代表的字符串的引用入操作栈。

  3. invokevirtual 是调用方法常用的指令,其后 #24 是常量池里java/io/PrintStream.println:(Ljava/lang/String;)V 方法,invokevirtual 指令会调用操作栈第一个对象上的。此时操作栈应该是这个样子

操作栈

索引

内容

0

System.out的引用

1

hello world 字符串的引用

  1. return 返回

操作栈

如果学习过计算机原理,或者了解寄存器工作方式的,应该能看不出,操作栈其实很像cpu操作,将值放入寄存器后,cpu指令会取出寄存器值进行运算,虚拟机字节码也有类似这个原理,比如,前面我们看到的aload_0, 从变量表里取出第一个值放入到操作栈里,通常这是this(但对于静态方是例外),让我们看一个更典型的的一段java代码

public class Ch1Simple {

    public int add(int a,int b){
        int c = a+b;
        return c;
    }
}

在命令行运行

javap -c Ch1Simple

输出如下,这里为了节省篇幅,省略了构造函数字节码

  public int add(int, int);
   Code:
      0: iload_1
      1: iload_2
      2: iadd
      3: istore_3
      4: iload_3
      5: ireturn
  • 0:iload_1 指令将变量表第二个元素放入操作栈中,第二个元素实际上就是int a,再次强调,第一个元素是this,第三个元素是int b,第四个元素是int c.这是在编译的时候就确定好的

add方法的方法栈(method stack)的变量表此时应该是这个样子

变量表

索引

内容

压入操作栈

0

this

iload_0

1

a

iload_1

2

b

iload_2

3

c

iload_3

  • iload_2 此指令将变量第三个元素放入到操作栈中

  • iadd 将操作栈俩个变量想加,i表示操作栈俩个变量是int类型

  • istore_3 操作栈结构存回到变量表里,位置索引是3,也就是变量c

  • iload_3 因为方法要求返回值,return指令 仍然需要调用操作栈,所以又将变量3压入操作栈里

  • ireturn 方法执行结束,弹出操作栈里的值。

栈帧(stack frame)

java运行的时候,会为每一个线程分配一个线程栈,线程执行每个方法,会为其创建一个栈帧(stack frame),执行结束后销毁栈帧。栈帧包含了变量表和操作栈,其长度是在编译期间就能确定的,如下方法

public class Ch1Simple {

    public int add(int a,int b){
        int c = a+b;
        return c;
    }
}

因为有4个变量,分别是this,a,b,c 。 this 是对象指针,占用俩个字节, 变量 a,b,c 存放的int类型,因此也各占用俩个字节,所以变量表占用8个字节。

add方法里,指令iadd,操作俩个数,需要4个字节,而ireturn 需要操作栈有2个字节,因此操作栈只需要4个字节就能满足需求了(这个结论还有点唐突,需要细化)

因此,总的来说,add方法的栈帧应该是如下样子

变量表

索引

内容

压入操作栈

0

this

iload_0

1

a

iload_1

2

b

iload_2

3

c

iload_3

栈帧

索引

内容

0

 

1

 

除了变量表和操作栈外,栈帧还包括动态链接

点赞
收藏
评论区
推荐文章
blmius blmius
3年前
MySQL:[Err] 1292 - Incorrect datetime value: ‘0000-00-00 00:00:00‘ for column ‘CREATE_TIME‘ at row 1
文章目录问题用navicat导入数据时,报错:原因这是因为当前的MySQL不支持datetime为0的情况。解决修改sql\mode:sql\mode:SQLMode定义了MySQL应支持的SQL语法、数据校验等,这样可以更容易地在不同的环境中使用MySQL。全局s
待兔 待兔
4个月前
手写Java HashMap源码
HashMap的使用教程HashMap的使用教程HashMap的使用教程HashMap的使用教程HashMap的使用教程22
Jacquelyn38 Jacquelyn38
3年前
2020年前端实用代码段,为你的工作保驾护航
有空的时候,自己总结了几个代码段,在开发中也经常使用,谢谢。1、使用解构获取json数据let jsonData  id: 1,status: "OK",data: 'a', 'b';let  id, status, data: number   jsonData;console.log(id, status, number )
Stella981 Stella981
3年前
Python Challenge Level 18
初学Python,挑战一下流行的PythonChallenge,很不幸,卡在了18关~~被字符字节码之间的转换搞得焦头烂额,不过终于搞定了还是很happy的~~~主要的问题就是16进制形式的字符如何转成字节码(注意:不是encoding)如:\'89','50','4e','47','0d','0a','1a','0a','00
Stella981 Stella981
3年前
KVM调整cpu和内存
一.修改kvm虚拟机的配置1、virsheditcentos7找到“memory”和“vcpu”标签,将<namecentos7</name<uuid2220a6d1a36a4fbb8523e078b3dfe795</uuid
Easter79 Easter79
3年前
Twitter的分布式自增ID算法snowflake (Java版)
概述分布式系统中,有一些需要使用全局唯一ID的场景,这种时候为了防止ID冲突可以使用36位的UUID,但是UUID有一些缺点,首先他相对比较长,另外UUID一般是无序的。有些时候我们希望能使用一种简单一些的ID,并且希望ID能够按照时间有序生成。而twitter的snowflake解决了这种需求,最初Twitter把存储系统从MySQL迁移
Stella981 Stella981
3年前
Github标星5300+,专门为程序员开发文档开源管理系统,我粉了
!(https://oscimg.oschina.net/oscnet/a11909a041dac65b1a36b2ae8b9bcc5c432.jpg)码农那点事儿关注我们,一起学习进步!(https://oscimg.oschina.net/oscnet/f4cce1b7389cb00baaab228e455da78d0
Wesley13 Wesley13
3年前
00:Java简单了解
浅谈Java之概述Java是SUN(StanfordUniversityNetwork),斯坦福大学网络公司)1995年推出的一门高级编程语言。Java是一种面向Internet的编程语言。随着Java技术在web方面的不断成熟,已经成为Web应用程序的首选开发语言。Java是简单易学,完全面向对象,安全可靠,与平台无关的编程语言。
Wesley13 Wesley13
3年前
MySQL部分从库上面因为大量的临时表tmp_table造成慢查询
背景描述Time:20190124T00:08:14.70572408:00User@Host:@Id:Schema:sentrymetaLast_errno:0Killed:0Query_time:0.315758Lock_
Python进阶者 Python进阶者
10个月前
Excel中这日期老是出来00:00:00,怎么用Pandas把这个去除
大家好,我是皮皮。一、前言前几天在Python白银交流群【上海新年人】问了一个Pandas数据筛选的问题。问题如下:这日期老是出来00:00:00,怎么把这个去除。二、实现过程后来【论草莓如何成为冻干莓】给了一个思路和代码如下:pd.toexcel之前把这