深入Java核心 探秘Java垃圾回收機制
垃圾收集GC(Garbage Collection)是Java語言的核心技術之一,之前我們曾專門探討過Java 7新增的垃圾回收器G1的新特性,但在JVM的內(nèi)部運行機制上看,Java的垃圾回收原理與機制并未改變。垃圾收集的目的在于清除不再使用的對象。GC通過確定對象是否被活動對象引用來確定是否收集該對象。GC首先要判斷該對象是否是時候可以收集。兩種常用的方法是引用計數(shù)和對象引用遍歷。
引用計數(shù)收集器
引用計數(shù)是垃圾收集器中的早期策略。在這種方法中,堆中每個對象(不是引用)都有一個引用計數(shù)。當一個對象被創(chuàng)建時,且將該對象分配給一個變量,該變量計數(shù)設置為1。當任何其它變量被賦值為這個對象的引用時,計數(shù)加1(a = b,則b引用的對象+1),但當一個對象的某個引用超過了生命周期或者被設置為一個新值時,對象的引用計數(shù)減1。任何引用計數(shù)為0的對象可以被當作垃圾收集。當一個對象被垃圾收集時,它引用的任何對象計數(shù)減1。
優(yōu)點:引用計數(shù)收集器可以很快的執(zhí)行,交織在程序運行中。對程序不被長時間打斷的實時環(huán)境比較有利。
缺點: 無法檢測出循環(huán)引用。如父對象有一個對子對象的引用,子對象反過來引用父對象。這樣,他們的引用計數(shù)永遠不可能為0.
跟蹤收集器
早期的JVM使用引用計數(shù),現(xiàn)在大多數(shù)JVM采用對象引用遍歷。對象引用遍歷從一組對象開始,沿著整個對象圖上的每條鏈接,遞歸確定可到達(reachable)的對象。如果某對象不能從這些根對象的一個(至少一個)到達,則將它作為垃圾收集。在對象遍歷階段,GC必須記住哪些對象可以到達,以便刪除不可到達的對象,這稱為標記(marking)對象。
下一步,GC要刪除不可到達的對象。刪除時,有些GC只是簡單的掃描堆棧,刪除未標記的未標記的對象,并釋放它們的內(nèi)存以生成新的對象,這叫做清除(sweeping)。這種方法的問題在于內(nèi)存會分成好多小段,而它們不足以用于新的對象,但是組合起來卻很大。因此,許多GC可以重新組織內(nèi)存中的對象,并進行壓縮(compact),形成可利用的空間。
為此,GC需要停止其他的活動活動。這種方法意味著所有與應用程序相關的工作停止,只有GC運行。結果,在響應期間增減了許多混雜請求。另外,更復雜的 GC不斷增加或同時運行以減少或者清除應用程序的中斷。有的GC使用單線程完成這項工作,有的則采用多線程以增加效率。
一些常用的垃圾收集器
◆標記-清除收集器
這種收集器首先遍歷對象圖并標記可到達的對象,然后掃描堆棧以尋找未標記對象并釋放它們的內(nèi)存。這種收集器一般使用單線程工作并停止其他操作。并且,由于它只是清除了那些未標記的對象,而并沒有對標記對象進行壓縮,導致會產(chǎn)生大量內(nèi)存碎片,從而浪費內(nèi)存。
◆標記-壓縮收集器
有時也叫標記-清除-壓縮收集器,與標記-清除收集器有相同的標記階段。在第二階段,則把標記對象復制到堆棧的新域中以便壓縮堆棧。這種收集器也停止其他操作。
復制收集器
這種收集器將堆棧分為兩個域,常稱為半空間。每次僅使用一半的空間,JVM生成的新對象則放在另一半空間中。GC運行時,它把可到達對象復制到另一半空間,從而壓縮了堆棧。這種方法適用于短生存期的對象,持續(xù)復制長生存期的對象則導致效率降低。并且對于指定大小堆來說,需要兩倍大小的內(nèi)存,因為任何時候都只使用其中的一半。
增量收集器
增量收集器把堆棧分為多個域,每次僅從一個域收集垃圾,也可理解為把堆棧分成一小塊一小塊,每次僅對某一個塊進行垃圾收集。這會造成較小的應用程序中斷時間,使得用戶一般不能覺察到垃圾收集器正在工作。
分代收集器
復制收集器的缺點是:每次收集時,所有的標記對象都要被拷貝,從而導致一些生命周期很長的對象被來回拷貝多次,消耗大量的時間。而分代收集器則可解決這個問題,分代收集器把堆棧分為兩個或多個域,用以存放不同壽命的對象。JVM生成的新對象一般放在其中的某個域中。過一段時間,繼續(xù)存在的對象(非短命對象)將獲得使用期并轉(zhuǎn)入更長壽命的域中。分代收集器對不同的域使用不同的算法以優(yōu)化性能。
并行收集器
并行收集器使用某種傳統(tǒng)的算法并使用多線程并行的執(zhí)行它們的工作。在多CPU機器上使用多線程技術可以顯著的提高java應用程序的可擴展性。
***,貼出一個非常簡單的跟蹤收集器的例圖,以便大家加深對收集器的理解:
跟蹤收集器圖例
使用垃圾收集器要注意的地方
下面將提出一些有關垃圾收集器要注意的地方,垃圾收集器知識很多,下面只列出一部分必要的知識:
◆每個對象只能調(diào)用finalize( )方法一次。如果在finalize( )方法執(zhí)行時產(chǎn)生異常(exception),則該對象仍可以被垃圾收集器收集。
◆垃圾收集器跟蹤每一個對象,收集那些不可觸及的對象(即該對象不再被程序引用 了),回收其占有的內(nèi)存空間。但在進行垃圾收集的時候,垃圾收集器會調(diào)用該對象的finalize( )方法(如果有)。如果在finalize()方法中,又使得該對象被程序引用(俗稱復活了),則該對象就變成了可觸及的對象,暫時不會被垃圾收集了。但是由于每個對象只能調(diào)用一次finalize( )方法,所以每個對象也只可能 "復活 "一次。
◆Java語言允許程序員為任何方法添加finalize( )方法,該方法會在垃圾收集器交換回收對象之前被調(diào)用。但不要過分依賴該方法對系統(tǒng)資源進行回收和再利用,因為該方法調(diào)用后的執(zhí)行結果是不可預知的。
◆垃圾收集器不可以被強制執(zhí)行,但程序員可以通過調(diào)研System.gc方法來建議執(zhí)行垃圾收集。記住,只是建議。一般不建議自己寫System.gc,因為會加大垃圾收集工作量。
【編輯推薦】