JVM 基础知识点储备
一、前言
应聘后端开发岗位面试过程中,有关JVM
的问题必不可少,此篇博文主要梳理有关JVM
工作原理、收集器有关内容。
二、java 内存与内存溢出
2.1 JVM 分区及作用
- 程序计数器(线程私有)
当前线程执行字节码的信号指示器。(每个线程都会在程序计数器中存储其指令,从而实现线程切换后恢复到正确的执行位置) - 虚拟机栈(栈,线程私有)
每个方法执行(开始到结束就是这个方法的生命周期)都会创建一个栈帧,栈帧存储局部变量表、操作数栈、动态链接、方法出口等信息。
- (栈内存)为虚拟机执行
java
方法服务:方法被调用时创建栈帧–>局部变量表–>局部变量–>对象引用 - 如果线程请求的栈深度超出了虚拟机所允许的深度,就会出现
StackOverFlowError. -Xss
规定了栈的最大空间; - 虚拟机栈可以动态扩展,如果扩展到无法申请到足够的内存,会出现
OOM
(OutOfMemoryError
)
而我们最常用的就是局部变量表,局部变量表包括如下内容:
- 基本数据类型:
boolean byte char short int float long double
注意基本类型的包装类型:Boolean、Byte、Character、Short、Integer、Float、Long、Double
- 对象引用类型:类、接口、数组 (不是对象本身,可能是一个指向对象起始地址的引用指针)
问题:包装类型是放在栈中么:String Interget
(看包装类型是怎么用的:若直接定义则内容在常量池中,若new一个对象则在堆中。)
本地方法栈 。与虚拟机实现的功能非常相似,不同之处在于虚拟机执行
java
方法(字节码)服务,而本地方法栈执行Native
方法服务(非java
方法写的)。java 堆。(线程共享) 虚拟机启动时创建,此内存区域的唯一目的就是存放对象实例,对象在失去引用,就会被
java
虚拟机回收。
- 被所有线程共享,在java虚拟机启动时创建,几乎所有的对象实例都存放到堆中;
GC
管理的主要区域;- 物理上不连续,逻辑上连续,并可以动态扩展,无法扩展时抛出
OutOfMemoryError
;
- 方法区(线程共享)(虚拟机把方法区叫做永久代)。
用于存储已被虚拟机加载的类信息、常量、静态变量、即编译器编译后的代码等数据。
- 注意⚠️:特别注意静态变量
static
修饰的变量在方法区。
- 直接内存(了解即可)
不是虚拟机运行时数据区的一部分。是native
函数直接分配的堆外内存,这样避免了java
堆和native
堆来回复制数据。
三、垃圾收集器与内存分配策略
3.1 jvm垃圾处理方法(标记清除、复制、标记整理)
- 标记—清除算法
- 标记阶段:先通过根节点,标记所有从根节点开始的对象,未被标记的视为垃圾对象;
- 清除阶段:清除所有未被标记的对象。
- 复制算法
将原有的内存空间分成两块,每次只使用其中一块,在垃圾回收时,将正在使用的内存中存活对象复制到未使用的内存块中,然后清除正在使用的内存块中所有对象。 - 标记—整理算法
若对象存活率比较高,就要进行多次复制,效率比较低。
- 标记阶段:先通过根节点,标记所有从根节点开始的可达对象,未被标记的视为垃圾对象。
- 整理阶段:将所有的存活对象压缩到内存的一端(或向一端移动),之后清理边界所有的空间。
- 分代收集算法
只是根据对象存活周期的不同将内存划分为几块。一般把java堆分为新生代和老年代。
- 新生代大量对象死亡,只有少数对象存活,采用复制算法;
- 老年代对象存活率高,没有额外空间对它进行分配,故采用标记-清除或标记-整理算法。
三种算法的比较:
- 效率:复制算法 > 标记-整理算法 > 标记-清除算法(此处的效率只是简单的对比时间复杂度)
- 内存整理度:复制算法 = 标记-整理算法 》标记-清除算法
- 内存利用率:标记-整理算法 = 标记-清除算法 》复制算法
3.2 JVM如何GC?新生代,老年代,持久代,都存储哪些东西,以及各个区的作用?
大多数新生的对象在Eden
区分配,当Eden
区没有足够空间进行分配时,虚拟机就会进行一次Minor GC
。(Survivor
是两个)
1. 新生代
在方法中new
一个对象,方法调用完毕后,对象就会被回收,这就是一个典型的新生代对象。(新生对象在eden
区经历过一次minorGC
并且被Survivor
容纳的话,对象年龄为1,每一次熬过MinorGc
年龄就会加1,直到15,就会晋升到老年。)
注意动态对象的判定:
Survivor
空间中相同年龄的对象大小总和大于Survivo
空间的一半,大于或等于该年龄的对象就可以直接进入老年代。
- 老年代
- 在新生代中经历了N次垃圾回收后仍然存活的对象,就会被放到老年代中,而且大对象(占用大量连续内存空间的
java
对象如很长的字符串及数组)直接进入老年代。- 当
survivor
空间不够用时,需要依赖老年代进行分配担保。
3.3 GC 引用可达性分析算法中 GCRoots 对象
java
虚拟机栈中的对象(引用对象);- 方法区中的静态成员;
- 方法区中的常量引用对象;
- 本地方法区中的
JNI
(Native
方法)引用对象 ;
3.4 MinorGC、FullGC时机
1. MinorGC
(新生代GC)
当Eden
区没有足够空间进行分配时,虚拟机就会进行一次Minor GC
。
- 新生代中的垃圾收集动作,采用的是复制算法;
- 对于较大的对象(很长的字符串、数据、集合),在
Minor GC
的时候可以直接进入老年代。
2. FullGC
(老年代GC)
Full GC
是发生在老年代的垃圾收集动作,采用的是标记-清除/整理算法;- 由于老年代的对象几乎都是在
survivor
区熬过来的,不会那么容易死掉,因此Full GC
发生的次数不会像MInor GC
那么频繁,Full GC
清理时间是Minor GC
的10倍。
3.5 各垃圾回收器工作原理
3.5.1 Serial 收集器
- 是一个单线程收集器,它“单线程”的意义并不仅仅说明它只会使用一个cpu或一条线程去完成垃圾回收工作。而是在收集垃圾时,暂停其他的工作线程。
- 新生代采用复制算法,
stop-the-world
(消除或者减少工作线程因内存回收而导致停顿)。 - 老年代采用标记–整理算法。
- 简单高效,
client
模式下默认的新生代收集器。
3.5.2 ParNew 收集器
- ParNew收集器是Serial收集器的多线程版本;
- 新生代采用复制算法,
stop-the-world
; - 老年代采用标记–整理算法;
- 它是运行在
server
模式下首选新生代收集器; - 除了serial收集器之外,只能它能和cms收集器配合工作。
3.5.3 ParNew Scanvenge 收集器
- 类似ParNew,但是更加关注吞吐量。目标是:达到一个可控制吞吐量的收集器;
- 停顿时间和吞吐量不可能同时调优。我们一方面希望停顿时间少,另一方面希望吞吐量高,其实这是矛盾的。
因为:在GC
的时候,垃圾回收的工作量是不变的,如果停顿时间减少,那频率就会提高;既然频率提高了,说明就会频繁的进行GC
,那吞吐量就会减少,性能就会降低。
3.5.4 G1 收集器(核心重点)
- 是当今收集器发展的最前沿成果之一,对垃圾回收进行划分优先级的操作,这种有优先级的区域回收方法保证了它的高效率;
- 最大的优点是结合了空间整合,不会产生大量的碎片,也降低了进行GC的频率;
- 让使用者明确指定停顿的时间。
3.5.5 CMS收集器:(Concurrent Mark Sweep
:并发标记-清除 老年代收集器)
- 一种以获得最短回收停顿时间为目标的收集器,适用于互联网网站或者B/S系统的服务器上;
- 初始化标记(
stop-the-world
):根可以直接关联到的对象; - 并发标记(和用户线程一起):主要标记过程,标记全部对象;
- 重新标记(
stop-the-world
):由于并发标记时,用户线程依然运行,因此在正式清理前,再做修正; - 并发清除(和用户线程一起):基于标记结果,直接清理对象。
注意:CMS
有三个致命的问题:
cpu
资源占用;- 浮动的垃圾无法清除;
- 内存碎片;
3.6 java 引用类型
Java
有四种引用类型:
- 强引用:通过
new
产生的对象都是强引用。 - 软引用:一些还有用但不是必须的对象可以使用软引用。比如创建一个软引用数组,这个数组存放了100多个学生对象的信息。内存比较空闲的时候这些对象和强引用没有区别,但内存紧张的时候就会被
GC
回收。(这就是GC的判定条件)
应用软引用的好处:java
在内存不足时,程序不会崩溃; - 弱引用:描述非必须对象的(比软引用更弱),当
GC
工作时,无论内存是否紧张都会回收掉;当某个对象是偶尔使用,并且在使用时随时能获取,又不想影响垃圾的回收,可以考虑应用这个。 - 虚引用:无法通过虚引用来获取对一个对象的真实引用。唯一的用处:能在对象被
GC
时收到系统通知,JAVA
中用PhantomReference
来实现虚引用。
- 点赞
- 收藏
- 关注作者
评论(0)