JVM速成=。=

JVM跨平台原理

跨平台：一次编译，到处运行
本质：不同操作系统上运行的JVM不一样，只需要把java程序编译成一份字节码文件，JVM执行不同的字节码文件。

Java是高级语言，提前编译一下（变成字节码文件），再执行起来就会快一点

很多高级语言，都可以编译成字节码格式。字节码可以到不同平台上运行，这也体现的字节码的跨平台效果。

JVM整体结构

在这里插入图片描述

解释器：执行方法区中存储的字节码指令
垃圾回收器：回收垃圾对象
JIT编译器：处理一些热点的字节码指令。【字节码里可能存在一些热点指令，这些热点指令翻译过一次，就把他们缓存起来，下一次再执行热点指令，就去缓存中取。从而提高执行效率】
方法区：类加载子系统把字节码加载到方法区中
堆：执行过程中产生的对象
Java方法栈：当前线程执行到某个java里的方法，就会放入这里
本地方法栈：当前线程执行native方法，就会放入这里（用Java语言以外的语言编写的方法）
程序计数器：记录下一条指令的地址

类加载子系统

在这里插入图片描述

加载：把字节码文件，加载到方法区的内存空间中。
链接：(static int i = 10)

验证：检查字节码文件的格式
准备：先给i变量赋值为0（先赋值0）
解析：将符号引用解析为直接引用

符号引用可以理解为类的名字（一般由包名 + 类名确定一个类）
直接引用可以理解为这个类在方法区中对应的地址
符号引用解析为直接引用：类的名字解析为这个类在方法区对应的地址

初始化：给类里边的static属性赋值（后赋值为10）

类加载器的分类

在这里插入图片描述

引导类加载器（BootStrapClassLoader）（用c++写的）
自定义类加载器（继承自ExtClassLoader 或 AppClassLoader）

ExtClassLoader 和 AppClassLoader都继承自ClassLoader类
BootStrapClassLoader：加载jre/lib目录下的类
ExtClassLoader：jre/lib/ext目录下的类
AppClassLoader：classpath（自己指定的）类加载的路径
WebAppClassLoader：Tomcat自定义的类加载器

双亲委派

作用：避免类的重复加载，防止核心API被篡改
在这里插入图片描述

当加载一个类的时候，先从应用加载器加载，这个时候应用加载器会在已加载过的库里面查看是否加载过该类，如果没有就往上调，使用父加载器，也就是扩展类加载器来加载。

先判断当前类是否被加载过
被加载过，直接返回
没有被加载过，
查看AppClassLoader对象的parent属性是否为空，
如果不为空，直接用parent属性加载（AppClassLoader对象的parent属性就是ExtClassLoader的对象）
如果为空，则利用BootStrapClassLoader加载
BootStrapClassLoader如果加载到，就直接结束
如果加载不到，返回ExtClassLoader，如果还是加载不到，就退回AppClassLoader，由它自己去加载当前类。

为什么Tomcat要自定义类加载器？

为了进行类的隔离，如果tomcat直接使用AppClassLoader类加载器，那么会出现以下情况：

应用A中有个com.xiaolin.Hello.class
应用B中也有个com.xiaolin.Hello.class
虽然都叫Hello.class，但是这两个类的方法、属性可能不一样
如果AppClassLoader先加载了应用A中的Hello.class文件，那么应用B就不能被加载了，因为这两个类的名字一样
所以就需要针对应用A、B设置单独的类加载器，也就是WebAppClassLoader，这样两个应用中的Hello.class都会被各自的类加载器加载到，不会产生冲突。

JVM中判断一个类是否被加载到的逻辑：类名 + 对应的类加载器实例

运行时数据区

在这里插入图片描述

方法区、堆区：多个线程共享
Java方法栈、本地方法栈、程序计数器：每个线程都有一个

程序计数器PC

是物理寄存器的抽象实现的，用来记录待执行的下一条指令的地址，是程序控制流的指示器（for、if else…都依赖它完成）。
解释器工作时，就是通过程序计数器获取下一条需要执行新的字节码指令，是JVM规范中没有规定任何OutOfMemoryError情况的区域。

虚拟机栈（Java栈、本地方法栈）

虚拟机栈是线程私有的，一个方法开始执行栈帧入栈，方法执行完后，对应的栈帧就出栈，因此不需要进行垃圾回收。

虚拟机栈存在OutOfMemoryError（内存不够）、StackOverflowError（栈溢出）

线程太多了，就可能会出现OutOfMemoryError，线程创建时没有足够的空间去创建虚拟机栈了。
方法调用的层数太多，就可能会出现StackOverflowError

栈帧：
- 操作数栈：执行字节码指令过程中用来辅助计算的
- 局部变量表：记录方法里的每个变量的值

堆区

在这里插入图片描述
所有的对象和数组都应该存放在堆区，在执行字节码指令的时候，会把创建的对象存入堆区，对象对应的引用地址放入虚拟机栈的栈帧中。

方法执行完之后，创建的对象不会立马被回收，而是等JVM后台执行GC后，对象才会被回收。

Eden：新对象都会先放入Eden区（除非对象的大小都超过Eden区，那么就放入老年代）
S0：也叫做from区
S1：也叫做to区
S0、S1都是用来存放MinorGC（YGC）后存在的对象
如果一个对象经过15次垃圾回收（YGC）后都没有被回收掉，那么就会被放入老年代里

默认：
新生代 : 老年代 = 1 : 2
Eden : S0区 : S1区 = 8 : 1 : 1

在这里插入图片描述
Yong GC / Minor GC：负责堆新生代进行垃圾回收
Old GC / Major GC：负责堆老年代进行垃圾回收（目前只有CMS垃圾回收器会单独对老年代进行垃圾收集，其他垃圾收集器基本都是整堆回收的时候堆老年代进行垃圾收集）
Full GC：整堆回收，也会对方法区进行垃圾收集

垃圾回收过程

为什么要进行垃圾回收？

垃圾是指在JVM中没有任何指向它的对象，如果不清理这些垃圾，他们就会一直占用内存，而不能给其他对象，最终垃圾对象会越来越多从而出现内存溢出。

如何标记垃圾对象？

引用计数器：每个对象都保存一个引用计数器属性，用户记录对象被引用的次数。
- 优点：实现简单，计数为0表示是垃圾对象
- 缺点：需要额外的空间来存储引用计数，需要额外的时间来维护引用计数，无法处理循环引用的问题
可达性分析法：以GC Root作为起始点，然后一层一层找到所引用的对象，被找到的对象就是存活对象，其他不可达的对象就是垃圾对象。（找到可达对象）

GC Root是一组引用，包括：

线程中虚拟机栈 / 本地方法栈中正在执行的方法中的方法参数、局部变量所对应的对象引用
方法区中保存的类的信息中的静态 / 常量属性所对应的对象引用

怎么回收垃圾对象？

标记 - 清除算法：如果可用内存不够，就会暂停用户线程的执行，然后执行算法进行垃圾回收
- 标记阶段：从GC Roots开始遍历，找到可达对象，并在对象头中进行标记
- 清除阶段：堆内存空间进行线性遍历，如果发现对象头中没有记录是可达，就回收他

缺点：效率不高，会产生内存碎片
优点：易实现

复制算法：将内存空间分为两块，每次使用一块，进行垃圾回收时，将可达对象复制到另一块没有使用的内存中，然后再清除当前内存块中的所有对象，后续一直重复上边操作，交换着来。

只遍历一次，如果可达就直接转移。比较适合垃圾对象比较多的场景（复制成本低、例如：新生代）
优点：没有标记和清除阶段，不会出现内存碎片
缺点：

需要更多的内存，始终有一半内存空闲；
对象复制后，对象存放的内存地址发生了变化，需要额外时间修改栈帧中记录的引用地址
可达对象比较多，垃圾对象比较少，复制算法的效率低

标记 - 整理阶段
- 标记阶段：标记可达对象
- 移动阶段：将所有存活的对象移动到内存的一端
- 整理阶段：清除边界外所有空间

总结：
在这里插入图片描述
新生代中的对象存活时间比较短，可以利用复制算法（适合垃圾对象比较多的情况）

老年代中的对象存货时间比较长，可以用标记 - 清除 或 标记 - 整理算法，比如：

CMS垃圾收集器采用的就是标记 - 清除算法
Serial Old垃圾收集器采用的就是标记 - 整理算法

常见的垃圾收集器

在这里插入图片描述

Serial GC（新生代）和 Serial Old GC（老年代）：工作线程暂停，只有一个线程进行垃圾回收
Parallel GC（新生代）和 Parallel Old GC（老年代）：工作线程暂停，开启多个线程进行垃圾回收
CMS GC（老年代）：整个收集的过程更长，暂停的时间变短，而且在垃圾收集过程中大部分用户线程也还在执行，所以用户体验更好，但是吞吐量更低（单位时间内执行的用户时间更少了）

初始标记：暂停所有工作线程，标记处所有GC Roots能直接可达的对象，标记完后恢复工作线程。（初始标记只找到直接可达对象，不需要找到所有可达对象，只找了一层）
并发标记：垃圾回收线程和用户线程一起工作，垃圾回收线程也会去剩余的可达对象（初始标记中没有找到的可达对象，但是也会存在误差）
重新标记：并发标记阶段可能会产生一些误差，需要进行修正
并发清理：垃圾回收线程和用户线程一起工作，删除垃圾对象（可能新生成的垃圾对象没有被清除掉）
并发重置：重置一下，方便下一次垃圾回收

初始标记、并发标记、重新标记，这三个阶段都是在找垃圾对象，其实最费时的是并发标记阶段，因为这个阶段需要找出大量的垃圾对象，但是在最费时的阶段里，用户线程也在工作。