当前位置:首页 > 文章列表 > 文章 > java教程 > CMS垃圾回收器工作原理详解

CMS垃圾回收器工作原理详解

2025-09-23 21:19:52 0浏览 收藏

欢迎各位小伙伴来到golang学习网,相聚于此都是缘哈哈哈!今天我给大家带来《CMS(Concurrent Mark Sweep)垃圾收集器是Java虚拟机中一种以低延迟为目标的垃圾回收器,主要用于老年代(Old Generation)。它的设计目标是在应用程序运行过程中尽可能减少停顿时间,从而提高用户体验。以下是CMS垃圾收集器的工作过程:1. 初始标记(Initial Mark)阶段:这是CMS的第一个阶段,也称为“STW(Stop-The-World)”阶段。目的:标记所有从GC Roots直接可达的对象。特点:这一步需要暂停所有用户线程(STW),但时间非常短。只扫描根对象(如全局变量、栈上的引用等),不扫描整个堆。2. 并发标记(Concurrent Mark)阶段:在初始标记之后,CMS进入并发标记阶段。目的:从初始标记的存活对象出发,遍历整个老年代,标记出所有存活的对象。特点:此阶段是并发执行的,即在应用程序运行的同时进行。不会暂停用户线程,因此对应用性能影响较小。由于是并发执行,可能会出现对象引用发生变化的情况(即“浮动垃圾”)。3. 重新标记(Remark)阶段:这是CMS的第二个STW阶段。**目的》,这篇文章主要讲到等等知识,如果你对文章相关的知识非常感兴趣或者正在自学,都可以关注我,我会持续更新相关文章!当然,有什么建议也欢迎在评论留言提出!一起学习!

CMS通过并发标记清除减少停顿,但存在并发模式失败与浮动垃圾问题,因不整理内存导致碎片化,需依赖Full GC补救。

请详细谈谈CMS垃圾收集器的工作过程

CMS垃圾收集器,或者我们常说的Concurrent Mark Sweep,它存在的目的很直接:尽可能减少应用线程暂停(Stop-The-World, STW)的时间。它通过让大部分垃圾回收工作与应用线程并发执行来实现这一点,但代价是会消耗额外的CPU资源,并且可能产生内存碎片。

解决方案

CMS垃圾收集器的工作过程,从我的经验来看,可以大致分解为几个关键阶段,每个阶段都有其独特的作用和对应用的影响。

1. 初始标记(Initial Mark) 这个阶段是STW的。它很短,主要任务是标记所有直接被GC Roots引用的对象,以及年轻代中存活的对象所引用的老年代对象。你可以把它想象成给所有“根”对象打上一个快速的标签,为后续的并发标记提供起点。

2. 并发标记(Concurrent Mark) 这是CMS最核心,也是耗时最长的阶段。在这个阶段,GC线程和应用线程是并发运行的。GC线程会从初始标记阶段标记的对象开始,遍历整个老年代对象图,标记所有可达的对象。由于应用线程也在同时运行,对象引用关系可能会发生变化。CMS通过“增量更新”(Incremental Update)机制来处理这些变化,当一个对象引用发生改变时,会记录下来(通过卡片标记,Card Marking)。

3. 并发预清理(Concurrent Preclean) 这个阶段也是并发的。它主要是为了处理在并发标记阶段,由于应用线程活动而导致的对象引用变化。它会扫描在并发标记阶段被标记为“脏”的卡片,重新扫描这些区域,标记那些在并发标记阶段结束后新变得可达的对象。这个阶段的目的,就是尽量减少下一个STW阶段——重新标记的工作量。有时候,我甚至觉得这个阶段有点像在为接下来的大考做预习,把能做的提前做了。

4. 重新标记(Remark) 这是一个STW阶段,但通常比初始标记稍微长一些。它的任务是再次扫描堆,修正并发标记和并发预清理阶段中,由于应用线程活动而遗漏或标记错误的对象。它会处理剩余的“脏”卡片,并遍历年轻代,确保所有老年代中可达的对象都被正确标记。这个阶段虽然短暂,但对确保回收的准确性至关重要,它就像是最终的检查,确保没有遗漏。

5. 并发清理(Concurrent Sweep) 这个阶段同样是并发的。GC线程会遍历整个老年代,回收那些在标记阶段结束后仍然是不可达(即未被标记)的对象所占据的内存空间。值得注意的是,CMS在清理时并不会进行内存碎片整理,它只是将这些空间标记为可用,并通过一个空闲列表(free-list)来管理。这是CMS的一个特点,也是它后续会遇到一些麻烦的根源。

为什么CMS GC会引入“并发模式失败”?

“并发模式失败”(Concurrent Mode Failure)是CMS GC一个让人头疼的问题,在我看来,它直接暴露了CMS并发设计中的一个核心矛盾。简单来说,CMS GC的并发清理阶段,虽然不暂停应用,但它并不会整理内存碎片。这意味着,随着时间推移,老年代的空闲内存会变得越来越分散,形成很多小的、不连续的内存块。

当应用需要分配一个较大的对象,而老年代中又找不到足够大的连续空闲内存块时,CMS GC就会触发“并发模式失败”。此时,CMS会放弃当前的并发回收,转而执行一次Full GC。而这次Full GC通常是使用Stop-The-World的Serial Old收集器来完成的,它会彻底暂停所有应用线程,并且会进行内存整理。想象一下,你正在高速公路上开车,突然被告知要临时改道去走一段泥泞小路,而且所有车都得停下来等,那种感觉就是“并发模式失败”带来的体验。

这种失败的根本原因,在于应用分配速度过快,或者CMS GC启动得太晚,导致在并发清理完成之前,老年代就已经被填满,或者碎片化严重到无法满足新的分配需求。参数CMSInitiatingOccupancyFraction就是为了缓解这个问题而存在的,它允许我们提前启动CMS GC,给它更多时间去完成工作,避免这种尴尬的局面。但即便如此,也无法完全避免,因为碎片化始终是CMS的一个伴生问题。

CMS的“浮动垃圾”问题是怎样产生的,又意味着什么?

“浮动垃圾”(Floating Garbage)是CMS GC并发特性带来的另一个不可避免的副作用。它指的是那些在并发标记阶段已经开始,但在这个阶段中途变为不可达的对象。因为CMS的并发标记和清理是与应用线程同时进行的,当一个对象在并发标记阶段被判断为可达,但在并发清理阶段开始之前,它又被应用线程解除了所有引用,变成了垃圾。

问题就在于,CMS在并发清理时,只会回收那些在标记阶段结束后依然被标记为不可达的对象。对于这些在并发标记过程中“意外”变成垃圾的对象,CMS在当前周期内是无法识别并回收的。它们就像是漂浮在海面上的垃圾,虽然已经无用,但要等到下一个潮汐(下一次GC周期)才能被冲走。

这意味着什么呢?首先,它会导致内存的临时浪费。这些浮动垃圾会一直占据着内存空间,直到下一次CMS GC周期才会被回收。虽然通常量不大,但在内存吃紧的场景下,可能会稍微增加老年代的内存压力。其次,这表明CMS并不是一个“实时”的垃圾收集器,它对垃圾的回收存在一定的滞后性。这是为了换取低暂停时间所做的权衡,我们必须接受这一点。毕竟,没有完美的解决方案,只有最适合特定场景的权衡。

CMS垃圾收集器如何处理老年代内存碎片化?

这是一个非常直接的问题,答案也同样直接:CMS垃圾收集器在它的常规并发清理过程中,并不会进行内存碎片整理。它采取的是一种“标记-清除”算法,回收完垃圾后,空闲的内存块会以链表的形式被维护起来,等待新的对象分配。这直接导致了老年代内存碎片化的问题。

那么,CMS真的对碎片化束手无策吗?也不是完全没有办法,但这些办法都带有一定的妥协性。

一种处理方式是,当“并发模式失败”发生时,JVM会退回到Full GC,而Full GC(通常由Serial Old收集器执行)是会进行内存整理的。这意味着,碎片化问题会在系统被迫执行Full GC时得到缓解,但代价是长时间的STW。

另一种是我们可以通过JVM参数进行配置:UseCMSCompactAtFullCollection。当这个参数被启用时,CMS会在执行Full GC之后,额外进行一次内存碎片整理。这听起来不错,但请注意,它依然是在Full GC之后,这意味着它是在最糟糕的STW时刻进行的操作。同时,CMSFullGCsBeforeCompaction参数允许你设置在多少次Full GC之后才进行一次内存整理,这可以在一定程度上控制整理的频率,避免每次Full GC都耗费额外的时间去整理。

所以,与其说CMS“处理”碎片化,不如说它在避免不了碎片化的情况下,提供了一些“补救”措施,而且这些补救措施往往伴随着高昂的STW代价。这也是CMS后来逐渐被G1等新一代垃圾收集器取代的重要原因之一,因为G1在设计之初就考虑到了碎片化问题,并尝试在不引入长时间STW的前提下进行内存整理。

终于介绍完啦!小伙伴们,这篇关于《CMS垃圾回收器工作原理详解》的介绍应该让你收获多多了吧!欢迎大家收藏或分享给更多需要学习的朋友吧~golang学习网公众号也会发布文章相关知识,快来关注吧!

Win8远程桌面开启设置教程Win8远程桌面开启设置教程
上一篇
Win8远程桌面开启设置教程
Win10夜间模式开启教程
下一篇
Win10夜间模式开启教程
查看更多
最新文章
查看更多
课程推荐
  • 前端进阶之JavaScript设计模式
    前端进阶之JavaScript设计模式
    设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
    543次学习
  • GO语言核心编程课程
    GO语言核心编程课程
    本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
    516次学习
  • 简单聊聊mysql8与网络通信
    简单聊聊mysql8与网络通信
    如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
    500次学习
  • JavaScript正则表达式基础与实战
    JavaScript正则表达式基础与实战
    在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
    487次学习
  • 从零制作响应式网站—Grid布局
    从零制作响应式网站—Grid布局
    本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
    485次学习
查看更多
AI推荐
  • ChatExcel酷表:告别Excel难题,北大团队AI助手助您轻松处理数据
    ChatExcel酷表
    ChatExcel酷表是由北京大学团队打造的Excel聊天机器人,用自然语言操控表格,简化数据处理,告别繁琐操作,提升工作效率!适用于学生、上班族及政府人员。
    3192次使用
  • Any绘本:开源免费AI绘本创作工具深度解析
    Any绘本
    探索Any绘本(anypicturebook.com/zh),一款开源免费的AI绘本创作工具,基于Google Gemini与Flux AI模型,让您轻松创作个性化绘本。适用于家庭、教育、创作等多种场景,零门槛,高自由度,技术透明,本地可控。
    3404次使用
  • 可赞AI:AI驱动办公可视化智能工具,一键高效生成文档图表脑图
    可赞AI
    可赞AI,AI驱动的办公可视化智能工具,助您轻松实现文本与可视化元素高效转化。无论是智能文档生成、多格式文本解析,还是一键生成专业图表、脑图、知识卡片,可赞AI都能让信息处理更清晰高效。覆盖数据汇报、会议纪要、内容营销等全场景,大幅提升办公效率,降低专业门槛,是您提升工作效率的得力助手。
    3435次使用
  • 星月写作:AI网文创作神器,助力爆款小说速成
    星月写作
    星月写作是国内首款聚焦中文网络小说创作的AI辅助工具,解决网文作者从构思到变现的全流程痛点。AI扫榜、专属模板、全链路适配,助力新人快速上手,资深作者效率倍增。
    4542次使用
  • MagicLight.ai:叙事驱动AI动画视频创作平台 | 高效生成专业级故事动画
    MagicLight
    MagicLight.ai是全球首款叙事驱动型AI动画视频创作平台,专注于解决从故事想法到完整动画的全流程痛点。它通过自研AI模型,保障角色、风格、场景高度一致性,让零动画经验者也能高效产出专业级叙事内容。广泛适用于独立创作者、动画工作室、教育机构及企业营销,助您轻松实现创意落地与商业化。
    3813次使用
微信登录更方便
  • 密码登录
  • 注册账号
登录即同意 用户协议隐私政策
返回登录
  • 重置密码