java语言与jvm虚拟机简介 - HelloWorld开发者社区

一、java语言

1.1 支持面向对象编程oop

强调支持，因为java同样可以面向过程编程，但java是为oop而生的。

oop的三大特性是：封装、继承、多态。

封装主要针对成员变量而言，oop的思想要求成员变量均为私有，不应该对外能够访问，一个符合oop思想的类应该只有公共方法对外能够访问；

继承，主要理解继承体系，private、protected、public在继承中的使用场景。理解java是单继承多实现的（与C++的区别）；

多态主要指一个类的实例是运行时决定的，而不是声明时决定的。父类 a = new 子类();是可以的。这种作用在于可以面向抽象编程、面向接口编程，对象不必必须和声明的类一致，只要是它的子类、孙子类等即可；

1.2 jdk版本对java语言的改进

1996年发布jdk1.0，java语言具备基础的oop语法；

1997年发布jdk1.1，引入内部类；

2004年发布jdk1.5，引入语法糖，自动拆装箱、泛型、动态注解、枚举、可变长参数、遍历循环(foreach)；

2014年发布jdk8，引入Lambda表达式；

二、jvm虚拟机(本文特指官方默认的HotSpot虚拟机)

2.1 发展

由一家小公司Longview Technologies开发出来，1997年被sun公司收购，jdk1.3之后正式成为官方默认虚拟机；

HotSpot得名于其热点代码探测技术，可以有效的把热点代码探测出来，并利用JIT编译器将热点代码进一步优化并编译成机器代码，提高运行效率；

2.2 jvm虚拟机的内存区域组成

程序计数器，线程私有，指向字节码指令；

java虚拟机栈，线程私有，主要就是描述java方法的，配合程序计数器一起一步一步往下执行方法（理解为什么是栈）；

本地方法栈，线程私有，跟java虚拟机栈类似，区别是它用来执行非java方法；

java堆，线程共享，这是最大的一块虚拟机内存区域，主要就是我们new的对象都会分配在这里，这里分为新生代（Eden、Survivor1、Survivor2）和老年代；

方法区，线程共享，在HotSpot里叫永久代（Permanent Generation），存放加载的类信息、常量、静态变量等，static代码块、static变量、static方法都会存放在这里有一个副本。为什么叫永久代，主要是对这部分的对象实例回收的效率不高，这部分对象实例存活率较高；

运行时常量池，是方法区的一部分；

直接内存，不是虚拟机内存的一部分，指申请虚拟机内存外的内存。

2.3 垃圾收集算法

怎么样判断对象可以回收？有引用计数算法和可达性分析算法。引用计数算法很简单，给每个对象一个引用计数器，每当有一个地方引用了它，那么就给它计数器+1，当这个引用失效之后计数器-1，这样做非常高效，但有一个缺陷是互相引用的对象，无法被回收，造成内存泄露。HotSpot使用可达性分析算法，可达性分析算法从GC Roots对象出发是否可达来判断对象是否可以回收，GC Roots对象包括虚拟机栈引用的对象、方法区类静态属性引用的对象、方法区常量引用的对象、本地方法栈中引用的对象；

IBM研究指出98%的对象都是朝生夕死，故新生代中回收频率要较高，每次可以回收大量内存，老年代中经过两次以上的回收仍存活，说明回收的效率不高，回收频率可以低一点。另外，大对象不在新生代中分配，而是直接进入老年代。

①标记-清除算法。算法的思想是首先把需要回收的对象标注出来，然后统一清除回收。实现起来很简单，但标记和清除的效率不高，还会产生大量不连续的内存空间，影响后续为新对象分配内存，尤其是大对象。

②复制算法。针对标记-清除算法的问题，复制算法的思想是把内存区域均等的分成两块，比如10M的内存均等分为两块5M，每个时刻只能使用一块，第一次将新对象分配给第一块内存，第一次GC时，先从第一块标记仍存活对象的对象，然后统一复制到第二块内存中，并按内存空间顺序排好，第一块内存则全部回收。第二次回收时就先从第二块开始，循环往复。这样做效率很高，并且内存空间可以连续分配。但造成一个问题是本来10M的内存只能用一半，造成内存的浪费。

HotSpot在实际实现复制算法时，将内存空间划分为Eden和两个Survivor，且默认Eden和Survivor的比例是8:1:1，新对象分配在Eden中，第一次回收后存活对象被复制到Survivor 1中，Eden全部清除，第二次新对象仍分配在Eden中，第二次回收时Eden和Survivor 1中存活对象被复制到Survivor 2中，Eden和Survivor 1全部清除。

这里有一个问题：如果存活对象超过内存的10%，Survivor放不下怎么办？这时候就需要从老年代中进行分配担保（Handle Promotion）。

③标记-整理算法。和新生代不同，在老年代中GC回收的效率不会太高，使用复制算法Survivor空间很可能是不够的，如果将Survivor调大又浪费内存空间，这时就提出了标记-整理算法应对老年代的实际情况。标记-整理算法内存回收时先将所有存活对象标记出来，但不进行清除，而是将存活对象都往内存的一端移动，那么内存末端都是可回收的对象，当这些可回收对象被“挤出”内存边界的时候，则被清除了。

由于HotSpot中把java堆中分为新生代、老年代，他们存活的几率不一样，所以按新生代和老年代采取不同的算法，这就叫分代收集算法，在新生代中采取复制算法，在老年代中使用标记-清除或标记-整理算法。

2.4 垃圾收集器

上面分析了新生代、老年代应该采取怎样的算法，HotSpot中针对实际应用场景，实现了不同的垃圾收集器：

①Serial收集器，复制算法，单线程，Client模式下默认新生代收集器。会有Stop The World问题；

②ParNew收集器，复制算法，多线程，新生代收集器；

③Parallel Scavenge收集器，复制算法，多线程，新生代收集器，与ParNew的区别在于它针对吞吐量设计的；

④Serial Old收集器，标记-整理算法，单线程，Client模式下默认老年代收集器；

⑤CMS收集器，标记-清除算法，多线程，老年代收集器，以降低停顿时间为目标，只在初始标记、重新标记的时候需要Stop The World，采取并发标记和并发清除降低停顿时间；

⑥G1收集器，标记-整理算法+复制算法，多线程，新生代+老年代收集器，是JDK1.7最新的研究成果，以CMS收集器的基础上，加上复制算法的理念，将内存区域划分为多个大小相等的Region，每个Region再分为新生代和老年代。每次GC时根据Region回收价值优先进行回收，避免以前收集器需要进行全区域垃圾收集和回收；

三、编译与运行

3.1 javac编译器编译

第一次编译，将.java文件编译成中间语言，输出.Class文件，这期间主要完成语法分析和词法分析（编译原理）、注解处理、语义分析（解语法糖等）、生成字节码Class文件；

3.2 解释器

类加载进解释器运行，类加载的过程有：加载、验证、准备、解析、初始化；

3.3 JIT即时编译器

解释器监控热点代码为JIT编译器进一步编译提供监控数据，触发JIT编译器将热点代码编译成机器代码；

本人知识水平有限，文章难免有纰漏之处，请不吝纠正勘误。