堆内存被划分为新生代和年老代两部分,新生代主要使用复制和标记-清除垃圾回收算法;老年代主要使用标记-整理垃圾回收算法,
因此 java 虚拟中针对新生代和年老代分别提供了多种不同的垃圾收集器,JDK1.6 中 Sun HotSpot 虚拟机的垃圾收集器如下:
1. Serial 垃圾收集器(单线程、复制算法)
Serial(英文连续)是最基本垃圾收集器,使用复制算法,曾经是JDK1.3.1 之前新生代唯一的垃圾收集器。
Serial 是一个单线程的收集器,它不但只会使用一个 CPU 或一条线程去完成垃圾收集工作,并且在进行垃圾收集的同时,必须暂停其他所有的工作线程,直到垃圾收集结束。
Serial 垃圾收集器虽然在收集垃圾过程中需要暂停所有其他的工作线程,但是它简单高效,对于限定单个 CPU 环境来说,没有线程交互的开销,可以获得最高的单线程垃圾收集效率,因此 Serial垃圾收集器依然是java 虚拟机运行在 Client 模式下默认的新生代垃圾收集器。
2. ParNew 垃圾收集器(Serial+多线程)
ParNew 垃圾收集器其实是 Serial 收集器的多线程版本,也使用复制算法,除了使用多线程进行垃圾收集之外,其余的行为和 Serial 收集器完全一样,ParNew 垃圾收集器在垃圾收集过程中同样也要暂停所有其他的工作线程。
ParNew 收集器默认开启和 CPU 数目相同的线程数,可以通过-XX:ParallelGCThreads 参数来限制垃圾收集器的线程数。【Parallel:平行的】
ParNew 虽然是除了多线程外和Serial 收集器几乎完全一样,但是ParNew垃圾收集器是很多java虚拟机运行在 Server 模式下新生代的默认垃圾收集器。
3. Parallel Scavenge 收集器(多线程复制算法、高效)
Parallel Scavenge 收集器也是一个新生代垃圾收集器,同样使用复制算法,也是一个多线程的垃圾收集器,它重点关注的是程序达到一个可控制的吞吐量(Thoughput,CPU 用于运行用户代码的时间/CPU 总消耗时间,即吞吐量=运行用户代码时间/(运行用户代码时间+垃圾收集时间)),高吞吐量可以最高效率地利用 CPU 时间,尽快地完成程序的运算任务,主要适用于在后台运算而不需要太多交互的任务。自适应调节策略也是 ParallelScavenge 收集器与 ParNew 收集器的一个重要区别。
4. Serial Old 收集器(单线程标记整理算法 )
Serial Old 是 Serial 垃圾收集器年老代版本,它同样是个单线程的收集器,使用标记-整理算法,这个收集器也主要是运行在 Client 默认的 java 虚拟机默认的年老代垃圾收集器。
在 Server 模式下,主要有两个用途:
- 在 JDK1.5 之前版本中与新生代的 Parallel Scavenge 收集器搭配使用。
- 作为年老代中使用 CMS 收集器的后备垃圾收集方案。
新生代 Serial 与老年代 Serial Old 搭配垃圾收集过程图:
新生代 Parallel Scavenge 收集器与 ParNew 收集器工作原理类似,都是多线程的收集器,都使用的是复制算法,在垃圾收集过程中都需要暂停所有的工作线程。
新生代 Parallel Scavenge/ParNew 与老年代 Serial Old 搭配垃圾收集过程图:
5. Parallel Old 收集器(多线程标记整理算法)
Parallel Old 收集器是Parallel Scavenge的年老代版本,使用多线程的标记-整理算法,在 JDK1.6才开始提供。
在 JDK1.6 之前,新生代使用 ParallelScavenge 收集器只能搭配年老代的 Serial Old 收集器,只能保证新生代的吞吐量优先,无法保证整体的吞吐量,Parallel Old 正是为了在年老代同样提供吞吐量优先的垃圾收集器,如果系统对吞吐量要求比较高,可以优先考虑新生代 Parallel Scavenge和年老代 Parallel Old 收集器的搭配策略。
新生代 Parallel Scavenge 和老年代 Parallel Old 收集器搭配运行过程图:
6. CMS 收集器(多线程标记清除算法)
Concurrent mark sweep(CMS)收集器是一种年老代垃圾收集器,其最主要目标是获取最短垃圾回收停顿时间,和其他年老代使用标记-整理算法不同,它使用多线程的标记-清除算法。
最短的垃圾收集停顿时间可以为交互比较高的程序提高用户体验。
CMS 工作机制相比其他的垃圾收集器来说更复杂,整个过程分为以下 4 个阶段:
a)初始标记
只是标记一下 GC Roots 能直接关联的对象,速度很快,仍然需要暂停所有的工作线程。
b)并发标记
进行 GC Roots 跟踪的过程,和用户线程一起工作,不需要暂停工作线程。
c)重新标记
为了修正在并发标记期间,因用户程序继续运行而导致标记产生变动的那一部分对象的标记记录,仍然需要暂停所有的工作线程。
d)并发清除
清除 GC Roots 不可达对象,和用户线程一起工作,不需要暂停工作线程。由于耗时最长的并发标记和并发清除过程中,垃圾收集线程可以和用户现在一起并发工作,所以总体上来看CMS 收集器的内存回收和用户线程是一起并发地执行。
CMS 收集器工作过程:
7. G1 收集器
Garbage first 垃圾收集器是目前垃圾收集器理论发展的最前沿成果,相比与 CMS 收集器,G1 收集器两个最突出的改进是:
- 1:基于标记-整理算法,不产生内存碎片。
- 2:可以非常精确控制停顿时间,在不牺牲吞吐量前提下,实现低停顿垃圾回收。
G1 收集器避免全区域垃圾收集,它把堆内存划分为大小固定的几个独立区域,并且跟踪这些区域的垃圾收集进度,同时在后台维护一个优先级列表,每次根据所允许的收集时间,优先回收垃圾最多的区域。
区域划分和优先级区域回收机制,确保 G1 收集器可以在有限时间获得最高的垃圾收集效率。
a)G1 收集器的工作原理
G1 的堆内存分为多个小块(Region)。与传统的 分代收集(Young, Old)不同,G1 将堆划分为多个 Region,这些区域是 动态大小 的,并根据堆的不同使用情况动态调整。
G1 的垃圾回收过程主要分为以下几个步骤:
1:分区(Region)
- 堆划分:G1 把堆分成多个大小相等的区域(Region),这些区域可以是 Eden 区域、Survivor 区域 或 Old 区域。
- Young 区:包括 Eden 区和两个 Survivor 区(S0 和 S1)。
- Old 区:用于存储长期存活的对象。
- 每个 Region 都有一个可用的内存空间,并且 G1 会根据对象的年龄(存活时间)来决定哪些对象应该存储在哪些区域。
b)垃圾回收过程
G1 的垃圾回收过程有以下几个阶段:
- Young 收集:G1 在进行 Young 垃圾回收时,首先会清理 Eden 区和一个 Survivor 区。存活的对象会被移动到另一个 Survivor 区,或者晋升到 Old 区。如果需要,G1 会在这个阶段触发 并行清理。
- Mixed 收集:在 Old 区域对象较多时,G1 会进行 Mixed 回收,处理 Young 区和 Old 区的垃圾回收。这是 G1 回收的一个关键特性,它在回收过程中会同时处理 Young 区和 Old 区的垃圾。
- Full GC(完全垃圾回收):这是 G1 最后的一种回收方式,通常发生在堆内存空间非常紧张时,或者长时间没有进行 Old 区的回收。G1 会尝试减少 Full GC 的发生频率和时间。
c)优先回收最脏的区域
G1 收集器的一个重要特性是它能够优先回收那些“最脏”的区域,即那些垃圾最多、回收成本高的区域。这是通过维护一个 “垃圾量估算模型” 来实现的,G1 会根据各个区域的垃圾量来决定哪些区域需要回收。G1 的目标是回收最多垃圾的区域,同时尽量避免老年代的长时间停顿。
d)预测停顿时间
G1 收集器支持通过配置 停顿时间目标,来控制每次垃圾回收的最大停顿时间。开发者可以通过设置 -XX:MaxGCPauseMillis 参数来指定 G1 回收过程中的最大停顿时间。例如,-XX:MaxGCPauseMillis=200 表示 G1 会尝试将每次垃圾回收的停顿时间控制在 200 毫秒以内。
e)G1 收集器的特点
- 分代与区域结合:G1 收集器将传统的 Young 和 Old 区分代机制与现代的 Region 分区方法结合起来,这使得 G1 可以更加灵活地处理不同对象的生命周期。
- 低延迟:通过预测停顿时间并尽可能分配回收工作,G1 在大部分时间里能够保持相对较低的垃圾回收停顿。
- 增量式工作:G1 进行垃圾回收时会逐渐收集堆内存中的垃圾,而不是一次性地进行完整回收,从而避免了 Full GC 导致的长时间停顿。
- 自动调节:G1 收集器根据应用的内存使用情况和垃圾回收历史,自动调整回收策略,使得回收工作变得更加高效。
f)G1 收集器的优缺点
优点:
- 较低的停顿时间:通过精确控制回收过程,G1 可以保持较低的垃圾回收停顿,尤其适用于对响应时间有较高要求的应用。
- 处理大堆内存的能力强:G1 适用于堆内存较大的应用,能够在处理大规模内存时仍然保持相对较好的性能。
- 优先回收最脏的区域:G1 通过计算每个区域的垃圾量来优先回收最需要回收的区域,避免长时间的停顿。
缺点:
- 比 Parallel GC 更复杂:G1 的实现比 Parallel GC 更复杂,调优也相对较困难,尤其是在大内存应用中,调优不当可能导致性能下降。
- 在某些场景下性能不如 Parallel GC:对于一些小堆内存或者对停顿时间不敏感的应用,G1 的开销可能高于 Parallel GC,因此并不总是最佳选择。
g)G1 收集器的调优
G1 的调优相对复杂,需要根据具体的应用场景进行多方面的调节。以下是一些常见的调优选项:
- -XX:+UseG1GC:启用 G1 垃圾回收器。
- -XX:MaxGCPauseMillis=
- -XX:G1HeapRegionSize=
:设置每个 Region 的大小(可以根据堆的大小来自动选择)。 - -XX:ParallelGCThreads=<nu。mber>:设置并行垃圾回收线程的数量。
- -XX:ConcGCThreads=
:设置并发垃圾回收线程的数量
h)G1 与其他垃圾回收器的比较
特性 | G1 GC | Parallel GC | CMS GC | ZGC |
---|---|---|---|---|
停顿时间控制 | 支持精确控制停顿时间,低停顿 | 停顿时间不可控,偏向吞吐量优化 | 支持停顿时间控制,但不如 G1 精确 | 支持极低停顿时间,适用于超大堆 |
吞吐量 | 在低停顿目标下,吞吐量较好 | 高吞吐量,适用于不关心停顿的场景 | 中等吞吐量,较高的吞吐量和较低的停顿 | 高吞吐量,适合大堆内存和低停顿需求 |
大内存支持 | 优秀,适合大堆内存 | 支持较好,但不如 G1 灵活 | 支持较好,但不如 G1 灵活 | 支持非常大堆内存,低停顿性能出色 |
垃圾回收算法 | 多阶段、分区域回收,支持 Young 和 Old 回收 | 主要通过并行回收实现 | 分代回收,通过并发标记清除来减少停顿 | 使用并行和并发标记清除,适合大堆内存 |