【Java虚拟机】JVM垃圾回收机制和常见回收算法原理
【摘要】 JVM垃圾回收机制和常见回收算法原理
1.垃圾回收机制
(1)什么是垃圾回收机制(Garbage Collection, 简称GC)
- 指自动管理动态分配的内存空间的机制,自动回收不再使用的内存,以避免内存泄漏和内存溢出的问题
- 最早是在1960年代提出的,程序员需要手动管理内存的分配和释放
- 这往往会导致内存泄漏和内存溢出等问题,同时也增加了程序员的工作量,特别是C++/C语言开发的时候
- Java语言是最早实现垃圾回收机制的语言之一,其他编程语言,如C#、Python和Ruby等,也都提供了垃圾回收机制
(2)JVM自动垃圾回收机制
指Java虚拟机在运行Java程序时,自动回收不再使用的对象所占用的内存空间的过程
Java程序中的对象,一旦不再被引用会被标记为垃圾对象,JVM会在适当的时候自动回收这些垃圾对象所占用的内存空间
优点
- 减少了程序员的工作量,不需要手动管理内存
- 动态地管理内存,根据应用程序的需要进行分配和回收,提高了内存利用率
- 避免内存泄漏和野指针等问题,增加程序的稳定性和可靠
缺点
- 垃圾回收会占用一定的系统资源,可能会影响程序的性能
- 垃圾回收过程中会停止程序的执行,可能会导致程序出现卡顿等问题
- 不一定能够完全解决内存泄漏等问题,需要在编写代码时注意内存管理和编码规范
(3)引用计数法
- 基本思想,跟踪每个对象被引用的次数,当引用次数为0时,就可以将该对象回收
- 在JVM中,每个对象都有一个引用计数器,当对象被引用时,引用计数器+1
- 当对象被取消引用时,引用计数器-1
- 当引用计数器为0时,该对象就可以被回收
- 优点
- 实现简单,回收垃圾的效率高
- 缺点
- 循环引用无法回收。如果两个对象互相引用,它们的引用计数器永远不会为0,因此无法被回收
- 引用计数器开销大,每个对象都需要一个引用计数器,如果对象很多,开销就会很大
public class Main {
public static void main(String[] args) {
A a = new A();
B b = new B();
a.setB(b);
b.setA(a);
a = null;
b = null;
System.gc();
}
}
class A {
private B b;
public void setB(B b) {
this.b = b;
}
}
class B {
private A a;
public void setA(A a) {
this.a = a;
}
}
- 类A和类B相互引用,每个对象都持有对方的引用,形成了一个循环引用的环,当Main方法执行完毕后,a和b对象都置为null
- 由于它们相互引用,它们的引用计数器都不为0,无法被垃圾回收器回收,导致内存泄漏
- 但是上面代码却不会发生内存泄漏,因为多数jvm没有采用这个引用计数器方案,而是采用可达性分析算法
(4)可达性分析算法
- 可达性分析算法的基本思想是通过一系列的“GC Roots”对象作为起点进行搜索。
- 如果“GC Roots”和一个对象之间没有可达路径,则称该对象是不可达的,不过要注意的是被判定为不可达的对象不一定就会成为可回收对象。
- 被判定为不可达的对象要成为回收对象,要至少经历两次标记过程。
- 如果在这两次标记过程中仍然没有逃脱成为可回收对象的可能性,则基本上就真的成为可回收对象了。
通过一系列称为“GC Roots”的对象作为起始点,从这些节点开始向下搜索,搜索走过的路径称为“引用链”,当一个对象到 GC Roots 没有任何的引用链相连时(从 GC Roots 到这个对象不可达)时,证明此对象不可用。
(5)什么是GC Root
- 指一些被JVM认为是存活的对象,它们是垃圾回收算法的起点
- 可以理解为由堆外指向堆内的引用, 本身是没有存储位置,都是字节码加载运行过程中加入 JVM 中的一些普通引用
- 通俗的例子可以是一个树形结构,树的根节点就是GC Roots
- 是垃圾回收器的起点,如果一个节点没有任何子节点与根节点相连,那这个节点就被认为是不可达的,可以被回收器回收
(6)JVM中的GCRoots对象有哪几种
虚拟机栈(栈帧中的本地变量表)中引用的对象。
方法区中类静态属性引用的对象
- JDK 1.7 开始静态变量的存储从方法区移动到堆中
- 比如你定义了一个static 的集合对象,那里面添加的对象就是可以被GC Root可达的
方法区中常量引用的对象
- 字符串常量池从 JDK 1.7 开始由方法区移动到堆中
本地方法栈中JNI(即一般说的Native方法)引用的对象。
(7)对象可回收,就一定会被回收吗?
- 不一定会回收,对象的finalize方法给了对象一次最后一次的机会。
- 当对象不可达(可回收)并发生 GC 时,会先判断对象是否执行了 finalize 方法,如果未执行则会先执行 finalize 方法
- 将当前对象与 GC Roots 关联,执行 finalize 方法之后,GC 会再次判断对象是否可达
- 如果不可达,则会被回收,如果可达,则不回收!
- 需要注意的是 finalize 方法只会被执行一次,如果第一次执行 finalize 方法,对象变成了可达,则不会回收
- 但如果对象再次被 GC,则会忽略 finalize 方法,对象会被直接回收掉!
2.垃圾回收算法
(1)垃圾回收算法之标记-清除算法
- 是一种常见的垃圾回收算法,它的基本思路是分为两个阶段:标记阶段和清除阶段
- 标记阶段
- 垃圾回收器会从一些GC Roots对象开始,遍历整个对象图,标记所有被引用的对象
- 被标记的对象会被打上标记,表示这些对象是“活”的对象,需要保留下来,未被标记的对象就是垃圾对象,可以被回收
- 清除阶段
- 垃圾回收器会对所有未被标记的对象进行回收
- 优点
- 能够回收不连续的内存空间
- 缺点
- 标记和清除两个步骤,都需要垃圾回收器遍历整个对象图,耗费时间较长
- 会产生内存碎片,当频繁进行垃圾回收时,内存碎片会越来越多导致可用内存空间不足,从而影响程序的性能和稳定性
- 应用场景
- 在实际应用中,标记清除法一般用于不需要频繁进行垃圾回收的场景,比如在Java堆中大对象的分配和回收
- 后续的收集算法大多都是以标记-清除算法为基础,对其缺点进行改进
(2)垃圾回收算法之标记-复制算法
- 标记算法是一种常见的垃圾回收算法,它的基本思路是将Java堆分为两个区域:一个活动区域和一个空闲区域
- 在垃圾回收过程中,首先标记所有被引用的对象
- 然后将所有被标记的对象复制到空闲区域中,最后交换两个区域的角色,完成垃圾回收
- 标记复制算法的详细实现步骤
- 将Java堆分为两个区域:一个活动区域和一个空闲区域,初始时,所有对象都分配在活动区域中
- 从GC Roots对象开始,遍历整个对象图,标记所有被引用的对象
- 对所有被标记存活的对象进行遍历,将它们复制到空闲区域中,并更新所有指向它们的引用,使它们指向新的地址
- 对所有未被标记的对象进行回收,将它们所占用的内存空间释放
- 交换活动区域和空闲区域的角色,空闲区域变为新的活动区域,原来的活动区域变为空闲区域
- 当空闲区域的内存空间不足时,进行一次垃圾回收,重复以上步骤。
优点
- 如果内存中的垃圾对象较多,需要复制的对象就较少,则效率高
- 清理后,内存碎片少
缺点
- 标记复制算法的效率较高,但是预留一半的内存区域用来存放存活的对象,占用额外的内存空间
- 如果出现存活对象数量比较多的时候,需要复制较多的对象 效率低
- 假如是在老年代区域,99%的对象都是存活的,则性能底,所以老年代不适合这个算法
应用场景
标记复制算法一般用于新生代的垃圾回收,因此需要对新生代的对象进行分代管理
虚拟机多数采用这个算法,对新生代进行内存管理,因为多数这个新生代区域的存活对象数量少
国外有公司统计过多数业务,98%撑不过一次GC; 所以不用1:1比例分配新生代的空间
原因
- GC时, 将Eden和Survivor中存活对象一次性复制到另外一块Survivor空间上, 然后清理掉Eden和已用过的那块Survivor空间
- 每次新生代中可用内存空间为整个新生代容量的90% (Eden的80% + Survivor的 10%) ,
- 只有一个Survivor空间, 即10%的新生代是会被浪费而已
(3)垃圾回收算法之标记-整理算法
- 从根节点开始对所有可达对象做一次标记,但之后并不简单地清理未标记的对象,而是将所有的存活对象压缩到内存的一端
- 然后清理边界外的垃圾,避免了碎片的产生,也不需要两块相同的内存空间,因此性价比比较高
- 优点
- 解决了标记清除算法的碎片化的问题
- 对比标记-复制算法,不用浪费额外的空间
- 对比 标记-清除算法与标记-整理算法,前者是一种非移动式的回收算法, 而后者是移动式的回收,且没有了碎片化内存
- 缺点
- 效率相比于标记复制算法低一些
- 在整理存活对象时,因对象位置的变动,需要该调整虚拟机栈中的引用地址
- 应用场景
- 标记-压缩算法是一种老年代的回收算法,它在标记-清除算法的基础上做了一些优化。
(4)垃圾回收算法之分代收集算法
- 针对不同生命周期的对象采用不同的垃圾回收策略,以达到更好的垃圾回收效果
- 年轻代多数对象存活时间短,高频进行回收;老年代多数对象存活时间久,进行低频回收
- 分代算法是根据回收对象的特点进行选择,年轻代适合标记-复制算法,老年代适合标记清除或标记压缩算法
- 通过将内存划分为不同的代,可以使得Minor GC的频率更高,更早地回收垃圾对象,减少Full GC的发生频率,提高整体性能
- JVM将内存分为年轻代和老年代,其中年轻代又分为Eden区和两个Survivor区
- 年轻代
- 用于存放新生的对象,其中Eden区是新对象的分配区域
- 当Eden区满时,会触发Minor GC,将存活的对象移动到Survivor区,同时清空Eden区
- Survivor区则用于存放经过一次Minor GC后存活的对象
- 老年代
- 用于存放长时间存活的对象,当年轻代中的对象经过多次Minor GC后仍然存活,就会被移动到老年代
- 当老年代满时,会触发Full GC
- GC的分类和专业术语
- 部分收集(Partial GC)
- 新生代收集
- 对象从Young 区域消失的过程称为”minor GC / Young GC “
- Eden 的清理,S0\S1的清理都由于MinorGC
- YoungGen区内存不足,会触发minorGC
- 老年代收集
- 对象从老年代中消失的过程,清理整合OldGen的内存空间,称为**”Major GC/Old GC“**
- 有些垃圾收集器 针对老年代单独回收,所以比较少用
- 新生代收集
- 整堆收集(Full GC)
- 是清理整个堆空间,包括年轻代和老年代
- 理解为Major GC+Minor GC组合后进行的一整个过程,是清理JVM整个堆空间
- FullGC触发场景
- 手工调用System.gc( ), 建议执行Full GC,不一定会执行,可通过-XX:+ DisableExplicitGC 参数来禁止调用System.gc()
- 老年代空间不足 , 通过Minor GC后进入老年代的平均大小大于老年代的可用内存
- STW(Stop The World)
- 垃圾回收发生过程中,用户线程在运行至安全点(safe point)后,就自行挂起进入暂停状态,对外的表现就是卡顿
- 所以应尽量减少Full GC的次数,是Minor GC还是Major GC都会STW,区别只在于STW的时间长短
- 部分收集(Partial GC)
【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱:
cloudbbs@huaweicloud.com
- 点赞
- 收藏
- 关注作者
评论(0)