高并發(fā)系統必看!G1如何讓億級JVM吞吐量提升300%?
在 Java 應用的運行中,垃圾回收(GC)是保障內存安全的核心機制,但傳統 GC 如 CMS 和 Parallel GC 常面臨兩大痛點:不可控的停頓時間和內存碎片問題。
例如,CMS 的“并發(fā)模式失敗”可能導致長達數秒的 Full GC 停頓,而大內存場景下頻繁的 Young GC 和 Mixed GC 可能拖累吞吐量。
G1(Garbage-First)垃圾回收器應運而生,它以“可控的停頓時間”為核心設計目標,通過分區(qū)(Region)模型和智能回收策略,實現了低延遲與高吞吐的平衡。
本文將從設計思想、核心機制到實戰(zhàn)調優(yōu),帶你深入理解 G1 如何解決傳統 GC 的難題。
G1 分區(qū)模型
Region 分區(qū)模型
G1 將堆內存劃分為多個等大小的 Region(默認 1MB-32MB),每個 Region 可以是 Eden、Survivor 或 Old 區(qū),默認是將堆內存按照 2048 份均分。
這種靈活的分區(qū)方式打破了傳統代際的物理隔離,允許動態(tài)調整各代內存占比。
Region 的角色(年輕代、老年代或大對象區(qū))是動態(tài)分配的。例如,一個 Region 可能初始作為 Eden 區(qū),回收后被標記為 Survivor 區(qū),后續(xù)可能轉為老年代區(qū)。
大對象(Humongous 對象):若對象大小超過 Region 的 50%,則分配到連續(xù)的 Humongous Region。此類對象回收需特殊處理,若空間不足可能觸發(fā) Full GC。
例如,當老年代占用過高時,G1 會優(yōu)先回收垃圾最多的 Region,而非全堆掃描。
跨代引用的智能追蹤
卡表(Card Table):記錄跨 Region 的引用關系。例如,老年代對象引用年輕代對象時,對應的卡表條目會被標記為“臟卡”。
記憶集(RSet):每個 Region 維護一個 RSet,存儲其他 Region 對其內部對象的引用。通過 RSet 快速定位跨 Region 引用,避免全堆掃描。
寫屏障(Write Barrier):在對象引用修改時觸發(fā),更新卡表和 RSet。例如,當老年代對象引用新生代對象時,寫屏障會記錄該引用。
混合回收(Mixed GC)
混合回收是 G1 的精髓:在一次回收中,同時處理年輕代和老年代的 Region。
通過計算回收收益(垃圾量/耗時),G1 選擇性價比最高的 Region 集合(Collection Set),在用戶設定的最大停頓時間內(如 200ms)完成回收。
在邏輯上,G1 分為年輕代和老年代,但它的年輕代和老年代比例,并不是那么“固定”,為了達到 MaxGCPauseMillis 所規(guī)定的效果,G1 會自動調整兩者之間的比例。
如果你強行使用 -Xmn 或者 -XX:NewRatio 去設定它們的比例的話,我們給 G1 設定的這個目標將會失效。
G1 的回收過程主要分為 3 類:
- G1“年輕代”的垃圾回收,同樣叫 Minor GC,這個過程和我們前面描述的類似,發(fā)生時機就是 Eden 區(qū)滿的時候。
- 老年代的垃圾收集,嚴格上來說其實不算是收集,它是一個“并發(fā)標記”的過程,順便清理了一點點對象。
- 真正的清理,發(fā)生在“混合模式”,它不止清理年輕代,還會將老年代的一部分區(qū)域進行清理。
年輕代回收(Young GC)
Chaya:年輕代回收觸發(fā)流程是什么?
Eden 區(qū)占滿時觸發(fā),僅回收年輕代 Region?;厥樟鞒倘缦滤荆?/p>
- 根掃描:標記 GC Roots 直接可達的對象(如棧幀局部變量、靜態(tài)變量)。
- RSet 處理:通過臟卡隊列更新 RSet,將老年代對年輕代的引用加入 GC Roots。
- 復制存活對象:將 Eden 和 Survivor 區(qū)的存活對象復制到新 Survivor 區(qū),年齡達閾值(默認 15)則晉升老年代。
- 這個過程通常是 Stop-The-World(STW)的,即在回收過程中,應用程序的其他線程會被暫停。
混合回收(Mixed GC)
Chaya:混合回收的觸發(fā)條件是什么?
多次回收之后,會出現很多 Old 老年代區(qū),此時總堆占有率達到閾值(默認 45%)時會觸發(fā)混合回收 MixedGC。混合回收會回收 整個年輕代 + 部分老年代。
回收過程如下:
- 初始標記(STW):標記 GC Roots 直接可達對象,耗時短。
- 并發(fā)標記:與應用線程并行,遍歷堆標記存活對象,使用三色標記法(黑、灰、白)避免漏標。
- 重新(最終)標記(STW):處理并發(fā)標記期間引用變化(通過 SATB 算法保證一致性),修正標記結果。
- 篩選回收:根據 Region 的回收價值(垃圾占比與回收時間)選擇 Region 集合(Collection Set),復制存活對象并清理。
注意:當混合回收無法快速釋放足夠空間時觸發(fā) Full GC(如大對象分配失敗),采用單線程標記-整理算法,導致長停頓。
初始標記
初始標記會暫停所有用戶線程,只標記從 GC Root 可直達的對象,所以停頓時間不會太長。
采用三色標記法進行標記,三色標記法在原有雙色標記(黑也就是 1 代表存活,白 0 代表可回收)增加了一種灰色。
三色標記法
- 黑色:對象及其引用均完成標記。
- 灰色:對象已標記,但引用未完全處理。
- 白色:未標記或待回收對象。
- 漏標問題解決:通過 SATB(Snapshot-At-The-Beginning)機制,記錄并發(fā)標記開始時的對象快照,確保標記一致性
并發(fā)標記
默認線程數為ParallelGCThreads的 1/4(通過-XX:ConcGCThreads調整),減少應用線程阻塞。
允許系統程序的運行,同時進行"GC Roots"追蹤,追蹤所有存活對象(間接引用的對象)。該階段很耗時,因為要追蹤全部的存活對象。但是是并發(fā)運行,對系統影響不大。
GC 開始前所有對象都是白色,GC 一開始所有根能夠直達的對象被壓到棧中,待搜索,此時顏色是灰色。
然后灰色對象依次從棧中取出搜索子對象,子對象也會被涂為灰色,入棧。
當其所有的子對象都涂為灰色之后該對象被涂為黑色。
當 GC 結束之后灰色對象將全部沒了,剩下黑色的為存活對象,白色的為垃圾。
需要注意的是:由于用戶線程可能同時在修改對象的引用關系,就會出現錯標的情況。
Chaya:那咋辦呢?
G1 為了解決這個問題,使用了SATB 技術(Snapshot At The Beginning, 初始快照)。
在并發(fā)標記開始時,G1 會創(chuàng)建一個堆內存的快照,記錄所有存活對象的初始狀態(tài)。
在最終標記階段,系統會處理并發(fā)期間新增的引用變化,通過寫前屏障(Write Barrier)記錄這些變化,確保新對象不被錯誤回收。
最終標記
觸發(fā)時機:在并發(fā)標記(Concurrent Marking)完成后,G1 需要暫停所有應用線程(STW),以處理并發(fā)標記期間遺漏的引用變化,確保標記結果的準確性。
核心目標:修正并發(fā)標記階段因應用線程并發(fā)執(zhí)行導致的對象引用變化(如新對象創(chuàng)建或引用更新),并生成最終的存活對象快照。
處理漏標對象:通過遍歷卡表(Card Table)中的“臟頁”(記錄引用修改的區(qū)域),重新掃描這些區(qū)域的對象,修正標記狀態(tài)
篩選回收
最終標記完成后,G1 根據停頓時間目標(MaxGCPauseMillis)和Region 回收價值,選擇最合適的區(qū)域進行回收。
優(yōu)先回收垃圾比例高(存活對象少)的 Region,以最小化回收時間并最大化內存釋放效率。
根據每個 Region 的存活對象數量和回收時間成本計算“回收價值”,優(yōu)先選擇存活率低、回收效率高的 Region 組成回收集(Collection Set, CSet)。
標記-復制算法:將存活對象從回收集的 Region 復制到空閑 Region,同時整理內存以減少碎片。
主要步驟如下所示:
構建回收集(CSet):
- 根據 Region 的存活對象比例和用戶設定的停頓時間目標(如-XX:MaxGCPauseMillis),動態(tài)選擇需要回收的 Region。
- 通常包括所有年輕代 Region(Eden/Survivor)和部分老年代 Region(混合收集模式)
并行遷移存活對象:
- 暫停應用線程(STW),啟動多個 GC 線程并行執(zhí)行。
- 將回收集內的存活對象復制到空閑 Region(如 Survivor 區(qū)或 Old 區(qū)的新 Region),并更新對象引用指針。
清理與釋放內存:
- 清空原 Region 的所有內容,將其標記為“空閑區(qū)域”。
- 更新Remembered Set(RSet)和卡表,記錄跨 Region 引用的變化。
調優(yōu)策略與參數
案例一:年輕代配置
案例:某線上服務因誤設-Xmn256m覆蓋 G1 的自動調節(jié),導致 Eden 區(qū)過?。▋H 256MB),頻繁觸發(fā) Young GC(600+次/壓測),響應時間激增。
解決方案:刪除-Xmn參數,由 G1 根據G1NewSizePercent(默認 5%)和G1MaxNewSizePercent(默認 60%)動態(tài)調整新生代大小,GC 時間從 25 秒降至 1 秒內。
案例二:老年代“擁堵治理”
動態(tài)年齡判定:若 Survivor 區(qū)使用超過 50%(TargetSurvivorRatio默認值),對象會直接晉升老年代。需通過增大 Survivor 區(qū)或降低晉升閾值(MaxTenuringThreshold),避免過早“占道”。
混合回收觸發(fā)閾值:默認InitiatingHeapOccupancyPercent=45%(老年代占比),高并發(fā)場景可適度調低以提前回收,避免 Full GC。
大對象“專車配送”
大對象(超過 Region 50%)直接進入老年代,類似超重訂單需特殊車輛處理。通過G1HeapRegionSize調整 Region 大小(如 32MB),或設置PretenureSizeThreshold控制大對象閾值,減少內存碎片。
Full GC 的應急處理
內存不足:堆內存過小或老年代晉升過快,需檢查-Xmx/-Xms是否一致(建議設為物理內存 75%-80%)。
并發(fā)失敗:若 Mixed GC 無法及時回收,觸發(fā) Full GC,需優(yōu)化MaxGCPauseMillis或降低InitiatingHeapOccupancyPercent。
啟用 GC 日志:-XX:+PrintGCDetails -Xloggc:/path/gc.log,關注Full GC關鍵字及耗時。
關鍵調優(yōu)參數
- -XX:MaxGCPauseMillis:設定最大停頓時間(默認 200ms),G1 根據此目標動態(tài)調整回收 Region 數量.
- -XX:G1HeapRegionSize:手動指定 Region 大?。ㄐ铻?2 的冪次方)。
- -XX:G1MixedGCCountTarget:控制混合回收次數(默認 8 次),分批次回收老年代 Region 以減少單次停頓。
- -XX:G1ReservePercent:預留堆內存(默認 10%)防止晉升失敗。
總結
G1 是一款非常優(yōu)秀的垃圾收集器,不僅適合堆內存大的應用,同時也簡化了調優(yōu)的工作。通過主要的參數初始和最大堆空間、以及最大容忍的 GC 暫停目標,就能得到不錯的性能;同時,我們也看到 G1 對內存空間的浪費較高,但通過首先收集盡可能多的垃圾(Garbage First)的設計原則,可以及時發(fā)現過期對象,從而讓內存占用處于合理的水平。
雖然 G1 也有類似 CMS 的收集動作:初始標記、并發(fā)標記、重新標記、清除、轉移回收,并且也以一個串行收集器做擔保機制,但單純地以類似前三種的過程描述顯得并不是很妥當。
- G1 的設計原則是"首先收集盡可能多的垃圾(Garbage First)"。因此,G1 并不會等內存耗盡(串行、并行)或者快耗盡(CMS)的時候開始垃圾收集,而是在內部采用了啟發(fā)式算法,在老年代找出具有高收集收益的分區(qū)進行收集。同時 G1 可以根據用戶設置的暫停時間目標自動調整年輕代和總堆大小,暫停目標越短年輕代空間越小、總空間就越大;
- G1 采用內存分區(qū)(Region)的思路,將內存劃分為一個個相等大小的內存分區(qū),回收時則以分區(qū)為單位進行回收,存活的對象復制到另一個空閑分區(qū)中。由于都是以相等大小的分區(qū)為單位進行操作,因此 G1 天然就是一種壓縮方案(局部壓縮);
- G1 雖然也是分代收集器,但整個內存分區(qū)不存在物理上的年輕代與老年代的區(qū)別,也不需要完全獨立的 survivor(to space)堆做復制準備。G1 只有邏輯上的分代概念,或者說每個分區(qū)都可能隨 G1 的運行在不同代之間前后切換;
- G1 的收集都是 STW 的,但年輕代和老年代的收集界限比較模糊,采用了混合(mixed)收集的方式。即每次收集既可能只收集年輕代分區(qū)(年輕代收集),也可能在收集年輕代的同時,包含部分老年代分區(qū)(混合收集),這樣即使堆內存很大時,也可以限制收集范圍,從而降低停頓。