首页 > 其他分享 >JVM 垃圾回收机制:GC

JVM 垃圾回收机制:GC

时间:2024-09-04 17:23:16浏览次数:14  
标签:收集器 对象 标记 算法 GC 垃圾 JVM

目录

一、死亡对象的判断算法

1.1 引用计数算法

1.2 可达性分析算法

二、垃圾回收算法

2.1 标记-清除算法

2.2 复制算法

2.3 标记-整理算法

2.4 分代算法

三、垃圾收集器

3.1 CMS收集器(老年代收集器,并发GC)

3.2 G1收集器(唯一一款全区域的垃圾回收器)


JVM的垃圾回收机制:GC,是Java提供的对于内存自动回收的机制。

在 Java 中,所有的对象都是要存在内存中的(也可以说内存中存储的是一个个对象),因此将内存回收,也可以叫做死亡对象的回收。GC回收的是“堆上的内存”。

一、死亡对象的判断算法

1.1 引用计数算法

思想:

给对象增加一个引用计数器,每当有一个地方引用它时,计数器就+1;当引用失效时,计数器就-1; 任何时刻计数器为0的对象就是不能再被使用的,即对象已"死"。

引用计数法实现简单,判定效率也比较高,在大部分情况下都是一个不错的算法。比如Python语言就采用引用计数法进行内存管理。
在主流的JVM中没有选用引用计数法来管理内存,最主要的原因就是引用计数法无法解决对象的循环引用问题。

1.2 可达性分析算法

思想:

通过一系列称为"GC Roots"的对象作为起始点,从这些节点开始向下搜索,搜索走过的路径称之为"引用链",当一个对象到 GC Roots 没有任何的引用链相连时 (从GC Roots到这个对象不可达)时,证明此对象是不可用的。如下: 对象 Object5 - Object7 之间虽然彼此还有关联,但是它们到 GC Roots 是不可达的,因此他们会被判定为可回收对象。 在Java语言中,可作为 GC Roots 的对象包含下面几种:
  1. 虚拟机栈(栈帧中的本地变量表)中引用的对象;
  2. 方法区中类静态属性引用的对象;
  3. 方法区中常量引用的对象;
  4. 本地方法栈中 JNI(Native方法)引用的对象。
在 JDK1.2 时,Java 对引用的概念做了扩充,分为以下四种,这四种引用的强度依次递减:
  1. 强引用 : 强引用指的是在程序代码之中普遍存在的,类似于"Object obj = new Object()"这类的引用,只要强引用还存在,垃圾回收器永远不会回收掉被引用的对象实例。
  2. 软引用 : 软引用是用来描述一些还有用但是不是必须的对象。对于软引用关联着的对象,在系统将要发生内存溢出之前,会把这些对象列入回收范围之中进行第二次回收。如果这次回收还是没有足够的内存,才会抛出内存溢出异常。在JDK1.2之后,提供了SoftReference类来实现软引用。
  3. 弱引用 : 弱引用也是用来描述非必需对象的。但是它的强度要弱于软引用。被弱引用关联的对象只能生存到下一次垃圾回收发生之前。当垃圾回收器开始进行工作时,无论当前内容是否够用,都会回收掉只被弱引用关联的对象。在JDK1.2之后提供了WeakReference类来实现弱引用。
  4. 虚引用 : 虚引用也被称为幽灵引用或者幻影引用,它是最弱的一种引用关系。一个对象是否有虚引用的存在,完全不会对其生存时间构成影响,也无法通过虚引用来取得一个对象实例。为一个对象设置虚引用的唯一目的就是能在这个对象被收集器回收时收到一个系统通知。在JDK1.2之后,提供了PhantomReference类来实现虚引用。

二、垃圾回收算法

2.1 标记-清除算法

"标记-清除"算法是最基础的收集算法。算法分为"标记"和"清除"两个阶段 : 首先标记出所有需要回收的对象,在标记完成后统一回收所有被标记的对象。后续的收集算法都是基于这种思路并对其不足加以改进而已。 "标记-清除"算法的不足主要有两个 :
  • 效率问题 : 标记和清除这两个过程的效率都不高。
  • 空间问题 : 标记清除后会产生大量不连续的内存碎片,空间碎片太多可能会导致以后在程序运行中需要分配较大对象时,无法找到足够连续内存而不得不提前触发另一次垃圾收集。

2.2 复制算法

复制"算法是为了解决"标记-清理"的效率问题。
它将可用内存按容量划分为大小相等的两块,每次只使用其中的一块。当这块内存需要进行垃圾回收时,会将此区域还存活着的对象复制到另一块上面, 然后再把已经使用过的内存区域一次清理掉。这样做的好处是每次都是对整个半区进行内存回收,内存分配时也就不需要考虑内存碎片等复杂情况,只需要移动堆顶指针,按顺序分配即可。
此算法实现简单,运行高效。算法的执行流程如下图 :

2.3 标记-整理算法

复制收集算法在对象存活率较高时会进行比较多的复制操作,效率会变低。因此在老年代一般不能使用复制算法。 针对老年代的特点,提出了一种称之为"标记-整理算法"。标记过程仍与"标记-清除"过程⼀致,但后续步骤不是直接对可回收对象进行清理,而是让所有存活对象都向一端移动,然后直接清理掉端边界以外的内存。 流程图如下:

2.4 分代算法

分代算法和上面 3 种算法不同,分代算法是通过区域划分,实现不同区域和不同的垃圾回收策略,从而实现更好的垃圾回收。 当前 JVM 垃圾收集都采用的是" 分代收集(Generational Collection)" 算法,这个算法并没有新思想,只是根据对象存活周期的不同将内存划分为几块。 一般是把Java堆分为 新生代和老年代 。在新生代中,每次垃圾回收都有大批对象死去,只有少量存活,因此我们采用复制算法;而老年代中对象存活率高、没有额外空间对它进行分配担保,就必须采用"标记-清理"或者"标记-整理"算法。
哪些对象会进入新生代?哪些对象会进入老年代?
  • 新生代:一般创建的对象都会进入新生代;
  • 老年代:大对象和经历了 N 次(一般情况默认是 15 次)垃圾回收依然存活下来的对象会从新生代移动到老年代。
面试题 : 请问了解Minor GC和Full GC么,这两种GC有什么不一样吗?
  • Minor GC 又称为新生代GC : 指的是发生在新生代的垃圾收集。因为Java对象大多都具备朝生夕灭的特性,因此Minor GC(采用复制算法)非常频繁,一般回收速度也比较快。
  • Full GC 又称为老年代GC 或者 Major GC : 指发生在老年代的垃圾收集。出现了Major GC,经常会伴随至少一次的Minor GC (并非绝对,在Parallel Scavenge收集器中就有直接进行Full GC的策略选择过程)。Major GC的速度一般会比Minor GC慢10倍以上。

三、垃圾收集器

收集算法是内存回收的方法论,垃圾收集器是内存回收的具体实现。

垃圾收集器的作用:垃圾收集器是为了保证程序能够正常、持久运行的一种技术,它是将程序中不用的死亡对象也就是垃圾对象进行清除,从而保证了新对象能够正常申请到内存空间。 以下这些收集器是 HotSpot 虚拟机随着不同版本推出的重要的垃圾收集器:

上图展示了7种作用于不同分代的收集器,如果两个收集器之间存在连线,就说明他们之间可以搭配使用。所处的区域,表示它是属于新生代收集器还是老年代收集器。
  • 并行(Parallel) : 指多条垃圾收集线程并行工作,用户线程仍处于等待状态。
  • 并发(Concurrent) : 指用户线程与垃圾收集线程同时执行 (不一定并行,可能会交替执行),用户程序继续运行,而垃圾收集程序在另外一个CPU上。
  • 吞吐量:就是CPU用于运行用户代码的时间与CPU总消耗时间的比值。
  • 吞吐量 = 运行用户代码时间/(运行用户代码时间 + 垃圾收集时间)
例如:虚拟机总共运行了100分钟,其中垃圾收集花掉1分钟,那吞吐量就是99%。

3.1 CMS收集器(老年代收集器,并发GC)

特性:

CMS(Concurrent Mark Sweep)收集器是一种以获取最短回收停顿时间为目标的收集器。目前很大一部分的Java应用集中在互联网站或者B/S系统的服务端上,这类应用尤其重视服务的响应速度,希望系统停顿时间最短,以给用户带来较好的体验。CMS收集器就非常符合这类应用的需求。

CMS收集器是基于“标记—清除”算法实现的,它的整个过程分为4个步骤:

1. 初始标记(CMS initial mark):初始标记仅仅只是标记一下GC Roots能直接关联到的对象,速度很快,需要“Stop The World”。

2. 并发标记(CMS concurrent mark):并发标记阶段就是进行GC Roots Tracing的过程。

3. 重新标记(CMS remark):重新标记阶段是为了修正并发标记期间因用户程序继续运作而导致标记产生变动的那一部分对象的标记记录,这个阶段的停顿时间一般会比初始标记阶段稍长一些,但远比并发标记的时间短,仍然需要“Stop The World”。

4. 并发清除(CMS concurrent sweep):并发清除阶段会清除对象。 由于整个过程中耗时最长的并发标记和并发清除过程收集器线程都可以与用户线程一起工作,所以,从总体上来说,CMS收集器的内存回收过程是与用户线程一起并发执行的。

优点:

CMS是一款优秀的收集器,它的主要优点在名字上已经体现出来了:并发收集、低停顿。

缺点:

CMS收集器对CPU资源非常敏感;

CMS收集器无法处理浮动垃圾;

CMS收集器会产生大量空间碎片。

3.2 G1收集器(唯一一款全区域的垃圾回收器)

G1(Garbage First)垃圾回收器是用在heap memory很大的情况下,把heap划分为很多很多的 region块,然后并行的对其进行垃圾回收。

G1垃圾回收器在清除实例所占用的内存空间后,还会做内存压缩。

年轻代垃圾收集 :

在G1垃圾收集器中,年轻代的垃圾回收过程使用复制算法。把Eden区和Survivor区的对象复制到新的Survivor区域。 如下图:

老年代垃收集:

对于老年代上的垃圾收集,G1垃圾收集器也分为4个阶段,基本跟CMS垃圾收集器一样,但略有不同:

• 初始标记(Initial Mark)阶段:同CMS垃圾收集器的Initial Mark阶段一样,G1也需要暂停应用程序的执行,它会标记从根对象出发,在根对象的第一层孩子节点中标记所有可达的对象。但是G1的垃圾收集器的Initial Mark阶段是跟minor gc一同发生的。也就是说,在G1中,你不用像在CMS那样,单独暂停应用程序的执行来运行Initial Mark阶段,而是在G1触发minor gc的时候一并将年老代上的Initial Mark给做了。

• 并发标记(Concurrent Mark)阶段:在这个阶段G1做的事情跟CMS一样。但G1同时还多做了一件事情,就是如果在Concurrent Mark阶段中,发现哪些Tenured region中对象的存活率很小或者基本没有对象存活,那么G1就会在这个阶段将其回收掉,而不用等到后面的clean up阶段。这也是Garbage First名字的由来。同时,在该阶段,G1会计算每个 region的对象存活率,方便后面的clean up阶段使用 。

• 最终标记(CMS中的Remark阶段):在这个阶段G1做的事情跟CMS一样, 但是采用的算法不同,G1采用一种叫做SATB(snapshot-at-the-begining)的算法能够在Remark阶段更快的标记可达对象。

• 筛选回收(Clean up/Copy)阶段:在G1中,没有CMS中对应的Sweep阶段。相反,它有一个Clean up/Copy阶段,在这个阶段中,G1会挑选出那些对象存活率低的region进行回收,这个阶段也是和minor gc一同发生的,如下图所示:

标签:收集器,对象,标记,算法,GC,垃圾,JVM
From: https://blog.csdn.net/m0_60462557/article/details/141893938

相关文章

  • 开源网安引领AIGC+开发安全,智能防护铸就软件安全新高度
    近日,国内网络安全领域知名媒体数说安全正式发布了《2024年中国网络安全市场100强》和《2024年中国网络安全十大创新方向》。开源网安凭借在市场表现力、资源支持力以及产品在AI方向的创新力上的优秀表现成功入选百强榜单,并被评为“AIGC+开发安全”典型厂商。开源网安已对全线软件安......
  • 如何从 Mac 上清空的垃圾箱中恢复误删除的文件
    在Mac上删除的文件将被移至垃圾箱并保留30天,然后才会被永久删除。但是,许多Mac用户可能会意外清空垃圾箱而没有意识到其中包含了重要文件。本指南包含从清空的垃圾箱中恢复Mac上已删除文件的所有有效方法。当您意识到自己意外清空了Mac上的垃圾箱时,请迅速采取行动并......
  • AGC004 题解
    目录A-DivideaCuboidB-ColorfulSlimesA-DivideaCuboid显然长方体必须被平行于某个面切开,否则不满足要求。枚举被哪个面切开,设这个面是\(a\timesb\),不属于这个面的棱长为\(c\),如果可以从正中间切开,即\(c\bmod2=0\)时就从正中间切开,红蓝块个数差值为\(0\)......
  • 图穷匕见-所有反DDD模式都是垃圾
    本文书接上回《主观与客观,破除DDD凭经验魔咒》,关注公众号(老肖想当外语大佬)获取信息:最新文章更新;DDD框架源码(.NET、Java双平台);加群畅聊,建模分析、技术实现交流;视频和直播在B站。开个玩笑“我不是针对这一个问题,我是说所有的反DDD模式都是垃圾”,作为教练,在团队中我时常用这样的玩笑来......
  • 河道水面垃圾识别检测系统 YOLOv7
    河道水面垃圾识别检测系统采用计算机视觉技术,河道水面垃圾识别检测系统通过在河道上安装摄像头,对水面垃圾进行实时监测。河道水面垃圾识别检测系统通过计算机视觉算法自动识别并记录水面垃圾,及时通知环保部门进行处理。河道水面垃圾识别检测系统24小时不间断运行,能够实时监测河道水......
  • GCC代码编译
    目录安装目录程序名称系统类型安装目录--prefix=PREFIX:用来指定目标机器无关代码的安装目录,默认值为/usr/local--exec-prefix=EPREFIX:用来指定目标机器相关代码的安装目录,一般与--prefix选项指定的PREFIX值相同程序名称--program-prefix=PREFIX:设置安装程序名的前缀为PREF......
  • [AGC004D] Teleporter
    题意给定一张\(n\)个点的有向图,每个点都有一条出边。初始保证所有点都能走到\(1\)。你需要重新规划最少的出边,使得最终每个节点都存在一条长度为\(k\)的路径走到节点\(1\)。\(n\le10^6\)Sol显然给定的图为一棵基环树。对环与树分类讨论。首先注意到每个点都能走......
  • 利用LangChain构建MySQL数据库问答代理
    引言随着自然语言处理技术的飞速发展,尤其是大型语言模型(LLM)的应用日益广泛,人们对于如何更高效地与这些模型交互产生了浓厚的兴趣。LangChain是一个旨在简化与语言模型集成的开源框架,它使得开发者能够轻松地构建出强大的应用程序。本文将介绍如何使用LangChain结合MySQL数据......
  • 使用LangChain加载Project Gutenberg电子书:实用指南
    使用LangChain加载ProjectGutenberg电子书:实用指南引言ProjectGutenberg是一个提供免费电子书的在线图书馆,拥有超过60,000本电子书。对于自然语言处理(NLP)和文本分析项目来说,这是一个宝贵的资源。本文将介绍如何使用LangChain的GutenbergLoader来加载ProjectGutenberg的......
  • 使用LangChain与OctoAI集成:构建强大的AI应用
    使用LangChain与OctoAI集成:构建强大的AI应用引言在当今快速发展的AI领域,如何高效地利用大型语言模型(LLM)构建应用已成为开发者面临的重要挑战。本文将介绍如何使用LangChain框架与OctoAI服务相结合,轻松构建强大的AI应用。我们将深入探讨OctoAI的特性,以及如何通过Lang......