掌握這3個(gè)技巧,你也可以秒懂JAVA性能調(diào)優(yōu)和jvm垃圾回收
前言
JVM 是一個(gè)虛擬化的操作系統(tǒng),類似于 Linux 和 Window,只是他被架構(gòu)在了操作系統(tǒng)上進(jìn)行接收 class 文件并把 class 翻譯成系統(tǒng)識(shí)別的機(jī)器碼進(jìn)行執(zhí)行,即 JVM 為我們屏蔽了不同操作系統(tǒng)在底層硬件和操作指令的不同。
因此,JVM 最重要的作用浮出水面,即跨平臺(tái)性。由于 JVM 為 java 程序屏蔽了操作系統(tǒng)底層的細(xì)節(jié),Java 只需要關(guān)心如何編譯,如何讓加載進(jìn) JVM 即可。
由于 JVM 接收的是 Class 文件,而不是接收特定的語(yǔ)言,因此只要某種語(yǔ)言可以編譯成 Class 文件,就可以在 JVM 上運(yùn)行,這些語(yǔ)言有 Groovy、Kotlin、Scala 等等。因此 JVM 的另一個(gè)重要特性就是語(yǔ)言無(wú)關(guān)性,即跨語(yǔ)言。
一、JVM內(nèi)存模型及垃圾收集算法
1.根據(jù)Java虛擬機(jī)規(guī)范,JVM將內(nèi)存劃分為:
New(年輕代)
Tenured(年老代)
永久代(Perm)
其中New和Tenured屬于堆內(nèi)存,堆內(nèi)存會(huì)從JVM啟動(dòng)參數(shù)(-Xmx:3G)指定的內(nèi)存中分配,Perm不屬于堆內(nèi)存,有虛擬機(jī)直接分配,但可以通過(guò) -XX:PermSize -XX:MaxPermSize 等參數(shù)調(diào)整其大小。
年輕代(New):年輕代用來(lái)存放JVM剛分配的Java對(duì)象
年老代(Tenured):年輕代中經(jīng)過(guò)垃圾回收沒(méi)有回收掉的對(duì)象將被Copy到年老代
永久代(Perm):永久代存放Class、Method元信息,其大小跟項(xiàng)目的規(guī)模、類、方法的量有關(guān),一般設(shè)置為128M就足夠,設(shè)置原則是預(yù)留30%的空間。
New又分為幾個(gè)部分:
Eden:Eden用來(lái)存放JVM剛分配的對(duì)象
Survivor1
Survivro2:兩個(gè)Survivor空間一樣大,當(dāng)Eden中的對(duì)象經(jīng)過(guò)垃圾回收沒(méi)有被回收掉時(shí),會(huì)在兩個(gè)Survivor之間來(lái)回Copy,當(dāng)滿足某個(gè)條件,比如Copy次數(shù),就會(huì)被Copy到Tenured。顯然,Survivor只是增加了對(duì)象在年輕代中的逗留時(shí)間,增加了被垃圾回收的可能性。
2.垃圾回收算法
垃圾回收算法可以分為三類,都基于標(biāo)記-清除(復(fù)制)算法:
Serial算法(單線程)
并行算法
并發(fā)算法
JVM會(huì)根據(jù)機(jī)器的硬件配置對(duì)每個(gè)內(nèi)存代選擇適合的回收算法,比如,如果機(jī)器多于1個(gè)核,會(huì)對(duì)年輕代選擇并行算法,關(guān)于選擇細(xì)節(jié)請(qǐng)參考JVM調(diào)優(yōu)文檔。
稍微解釋下的是,并行算法是用多線程進(jìn)行垃圾回收,回收期間會(huì)暫停程序的執(zhí)行,而并發(fā)算法,也是多線程回收,但期間不停止應(yīng)用執(zhí)行。所以,并發(fā)算法適用于交互性高的一些程序。經(jīng)過(guò)觀察,并發(fā)算法會(huì)減少年輕代的大小,其實(shí)就是使用了一個(gè)大的年老代,這反過(guò)來(lái)跟并行算法相比吞吐量相對(duì)較低。
垃圾回收動(dòng)作何時(shí)執(zhí)行?
還有一個(gè)問(wèn)題是,垃圾回收動(dòng)作何時(shí)執(zhí)行?
當(dāng)年輕代內(nèi)存滿時(shí),會(huì)引發(fā)一次普通GC,該GC僅回收年輕代。需要強(qiáng)調(diào)的時(shí),年輕代滿是指Eden代滿,Survivor滿不會(huì)引發(fā)GC
當(dāng)年老代滿時(shí)會(huì)引發(fā)Full GC,F(xiàn)ull GC將會(huì)同時(shí)回收年輕代、年老代
當(dāng)永久代滿時(shí)也會(huì)引發(fā)Full GC,會(huì)導(dǎo)致Class、Method元信息的卸載
另一個(gè)問(wèn)題是,何時(shí)會(huì)拋出OutOfMemoryException,并不是內(nèi)存被耗空的時(shí)候才拋出
JVM98%的時(shí)間都花費(fèi)在內(nèi)存回收
每次回收的內(nèi)存小于2%
滿足這兩個(gè)條件將觸發(fā)OutOfMemoryException,這將會(huì)留給系統(tǒng)一個(gè)微小的間隙以做一些Down之前的操作,比如手動(dòng)打印Heap Dump。
二、內(nèi)存泄漏及解決方法
1.系統(tǒng)崩潰前的一些現(xiàn)象:
每次垃圾回收的時(shí)間越來(lái)越長(zhǎng),由之前的10ms延長(zhǎng)到50ms左右,F(xiàn)ullGC的時(shí)間也有之前的0.5s延長(zhǎng)到4、5s
FullGC的次數(shù)越來(lái)越多,最頻繁時(shí)隔不到1分鐘就進(jìn)行一次FullGC
年老代的內(nèi)存越來(lái)越大并且每次FullGC后年老代沒(méi)有內(nèi)存被釋放
之后系統(tǒng)會(huì)無(wú)法響應(yīng)新的請(qǐng)求,逐漸到達(dá)OutOfMemoryError的臨界值。
2.生成堆的dump文件
通過(guò)JMX的MBean生成當(dāng)前的Heap信息,大小為一個(gè)3G(整個(gè)堆的大?。┑膆prof文件,如果沒(méi)有啟動(dòng)JMX可以通過(guò)Java的jmap命令來(lái)生成該文件。
3.分析dump文件
下面要考慮的是如何打開(kāi)這個(gè)3G的堆信息文件,顯然一般的Window系統(tǒng)沒(méi)有這么大的內(nèi)存,必須借助高配置的Linux。當(dāng)然我們可以借助X-Window把Linux上的圖形導(dǎo)入到Window。我們考慮用下面幾種工具打開(kāi)該文件:
Visual VM
IBM HeapAnalyzer
JDK 自帶的Hprof工具
使用這些工具時(shí)為了確保加載速度,建議設(shè)置最大內(nèi)存為6G。使用后發(fā)現(xiàn),這些工具都無(wú)法直觀地觀察到內(nèi)存泄漏,Visual VM雖能觀察到對(duì)象大小,但看不到調(diào)用堆棧;HeapAnalyzer雖然能看到調(diào)用堆棧,卻無(wú)法正確打開(kāi)一個(gè)3G的文件。因此,我們又選用了Eclipse專門的靜態(tài)內(nèi)存分析工具:Mat。
4.分析內(nèi)存泄漏
通過(guò)Mat我們能清楚地看到,哪些對(duì)象被懷疑為內(nèi)存泄漏,哪些對(duì)象占的空間最大及對(duì)象的調(diào)用關(guān)系。針對(duì)本案,在ThreadLocal中有很多的JbpmContext實(shí)例,經(jīng)過(guò)調(diào)查是JBPM的Context沒(méi)有關(guān)閉所致。
另,通過(guò)Mat或JMX我們還可以分析線程狀態(tài),可以觀察到線程被阻塞在哪個(gè)對(duì)象上,從而判斷系統(tǒng)的瓶頸。
5.回歸問(wèn)題
Q:為什么崩潰前垃圾回收的時(shí)間越來(lái)越長(zhǎng)?
A:根據(jù)內(nèi)存模型和垃圾回收算法,垃圾回收分兩部分:內(nèi)存標(biāo)記、清除(復(fù)制),標(biāo)記部分只要內(nèi)存大小固定時(shí)間是不變的,變的是復(fù)制部分,因?yàn)槊看卫厥斩加幸恍┗厥詹坏舻膬?nèi)存,所以增加了復(fù)制量,導(dǎo)致時(shí)間延長(zhǎng)。所以,垃圾回收的時(shí)間也可以作為判斷內(nèi)存泄漏的依據(jù)
Q:為什么Full GC的次數(shù)越來(lái)越多?
A:因此內(nèi)存的積累,逐漸耗盡了年老代的內(nèi)存,導(dǎo)致新對(duì)象分配沒(méi)有更多的空間,從而導(dǎo)致頻繁的垃圾回收
Q:為什么年老代占用的內(nèi)存越來(lái)越大?
A:因?yàn)槟贻p代的內(nèi)存無(wú)法被回收,越來(lái)越多地被Copy到年老代
三、性能調(diào)優(yōu)
除了上述內(nèi)存泄漏外,我們還發(fā)現(xiàn)CPU長(zhǎng)期不足3%,系統(tǒng)吞吐量不夠,針對(duì)8core×16G、64bit的Linux服務(wù)器來(lái)說(shuō),是嚴(yán)重的資源浪費(fèi)。
在CPU負(fù)載不足的同時(shí),偶爾會(huì)有用戶反映請(qǐng)求的時(shí)間過(guò)長(zhǎng),我們意識(shí)到必須對(duì)程序及JVM進(jìn)行調(diào)優(yōu)。從以下幾個(gè)方面進(jìn)行:
線程池:解決用戶響應(yīng)時(shí)間長(zhǎng)的問(wèn)題
連接池
JVM啟動(dòng)參數(shù):調(diào)整各代的內(nèi)存比例和垃圾回收算法,提高吞吐量
程序算法:改進(jìn)程序邏輯算法提高性能
1.Java線程池(java.util.concurrent.ThreadPoolExecutor)
大多數(shù)JVM6上的應(yīng)用采用的線程池都是JDK自帶的線程池,之所以把成熟的Java線程池進(jìn)行羅嗦說(shuō)明,是因?yàn)樵摼€程池的行為與我們想象的有點(diǎn)出入。Java線程池有幾個(gè)重要的配置參數(shù):
corePoolSize:核心線程數(shù)(最新線程數(shù))
maximumPoolSize:最大線程數(shù),超過(guò)這個(gè)數(shù)量的任務(wù)會(huì)被拒絕,用戶可以通過(guò)RejectedExecutionHandler接口自定義處理方式
keepAliveTime:線程保持活動(dòng)的時(shí)間
workQueue:工作隊(duì)列,存放執(zhí)行的任務(wù)
Java線程池需要傳入一個(gè)Queue參數(shù)(workQueue)用來(lái)存放執(zhí)行的任務(wù),而對(duì)Queue的不同選擇,線程池有完全不同的行為:
SynchronousQueue:一個(gè)無(wú)容量的等待隊(duì)列,一個(gè)線程的insert操作必須等待另一線程的remove操作,采用這個(gè)Queue線程池將會(huì)為每個(gè)任務(wù)分配一個(gè)新線程
LinkedBlockingQueue :無(wú)界隊(duì)列,采用該Queue,線程池將忽略maximumPoolSize參數(shù),僅用corePoolSize的線程處理所有的任務(wù),未處理的任務(wù)便在LinkedBlockingQueue中排隊(duì)
ArrayBlockingQueue: 有界隊(duì)列,在有界隊(duì)列和maximumPoolSize的作用下,程序?qū)⒑茈y被調(diào)優(yōu):更大的Queue和小的maximumPoolSize將導(dǎo)致CPU的低負(fù)載;小的Queue和大的池,Queue就沒(méi)起動(dòng)應(yīng)有的作用。
其實(shí)我們的要求很簡(jiǎn)單,希望線程池能跟連接池一樣,能設(shè)置最小線程數(shù)、最大線程數(shù),當(dāng)最小數(shù)<任務(wù)<最大數(shù)時(shí),應(yīng)該分配新的線程處理;當(dāng)任務(wù)>最大數(shù)時(shí),應(yīng)該等待有空閑線程再處理該任務(wù)。
線程池的設(shè)計(jì)思路
但線程池的設(shè)計(jì)思路是,任務(wù)應(yīng)該放到Queue中,當(dāng)Queue放不下時(shí)再考慮用新線程處理,如果Queue滿且無(wú)法派生新線程,就拒絕該任務(wù)。設(shè)計(jì)導(dǎo)致“先放等執(zhí)行”、“放不下再執(zhí)行”、“拒絕不等待”。所以,根據(jù)不同的Queue參數(shù),要提高吞吐量不能一味地增大maximumPoolSize。
當(dāng)然,要達(dá)到我們的目標(biāo),必須對(duì)線程池進(jìn)行一定的封裝,幸運(yùn)的是ThreadPoolExecutor中留了足夠的自定義接口以幫助我們達(dá)到目標(biāo)。我們封裝的方式是:
以SynchronousQueue作為參數(shù),使maximumPoolSize發(fā)揮作用,以防止線程被無(wú)限制的分配,同時(shí)可以通過(guò)提高maximumPoolSize來(lái)提高系統(tǒng)吞吐量
自定義一個(gè)RejectedExecutionHandler,當(dāng)線程數(shù)超過(guò)maximumPoolSize時(shí)進(jìn)行處理,處理方式為隔一段時(shí)間檢查線程池是否可以執(zhí)行新Task,如果可以把拒絕的Task重新放入到線程池,檢查的時(shí)間依賴keepAliveTime的大小。
2.連接池(org.apache.commons.dbcp.BasicDataSource)
在使用org.apache.commons.dbcp.BasicDataSource的時(shí)候,因?yàn)橹安捎昧四J(rèn)配置,所以當(dāng)訪問(wèn)量大時(shí),通過(guò)JMX觀察到很多Tomcat線程都阻塞在BasicDataSource使用的Apache ObjectPool的鎖上,直接原因當(dāng)時(shí)是因?yàn)锽asicDataSource連接池的最大連接數(shù)設(shè)置的太小,默認(rèn)的BasicDataSource配置,僅使用8個(gè)最大連接。
我還觀察到一個(gè)問(wèn)題,當(dāng)較長(zhǎng)的時(shí)間不訪問(wèn)系統(tǒng),比如2天,DB上的Mysql會(huì)斷掉所以的連接,導(dǎo)致連接池中緩存的連接不能用。為了解決這些問(wèn)題,我們充分研究了BasicDataSource,發(fā)現(xiàn)了一些優(yōu)化的點(diǎn):
Mysql默認(rèn)支持100個(gè)鏈接,所以每個(gè)連接池的配置要根據(jù)集群中的機(jī)器數(shù)進(jìn)行,如有2臺(tái)服務(wù)器,可每個(gè)設(shè)置為60
initialSize:參數(shù)是一直打開(kāi)的連接數(shù)
minEvictableIdleTimeMillis:該參數(shù)設(shè)置每個(gè)連接的空閑時(shí)間,超過(guò)這個(gè)時(shí)間連接將被關(guān)閉
timeBetweenEvictionRunsMillis:后臺(tái)線程的運(yùn)行周期,用來(lái)檢測(cè)過(guò)期連接
maxActive:最大能分配的連接數(shù)
maxIdle:最大空閑數(shù),當(dāng)連接使用完畢后發(fā)現(xiàn)連接數(shù)大于maxIdle,連接將被直接關(guān)閉。只有initialSize < x < maxIdle的連接將被定期檢測(cè)是否超期。這個(gè)參數(shù)主要用來(lái)在峰值訪問(wèn)時(shí)提高吞吐量。
initialSize是如何保持的?
initialSize是如何保持的?經(jīng)過(guò)研究代碼發(fā)現(xiàn),BasicDataSource會(huì)關(guān)閉所有超期的連接,然后再打開(kāi)initialSize數(shù)量的連接,這個(gè)特性與minEvictableIdleTimeMillis、timeBetweenEvictionRunsMillis一起保證了所有超期的initialSize連接都會(huì)被重新連接,從而避免了Mysql長(zhǎng)時(shí)間無(wú)動(dòng)作會(huì)斷掉連接的問(wèn)題。
3.JVM參數(shù)
在JVM啟動(dòng)參數(shù)中,可以設(shè)置跟內(nèi)存、垃圾回收相關(guān)的一些參數(shù)設(shè)置,默認(rèn)情況不做任何設(shè)置JVM會(huì)工作的很好,但對(duì)一些配置很好的Server和具體的應(yīng)用必須仔細(xì)調(diào)優(yōu)才能獲得最佳性能。通過(guò)設(shè)置我們希望達(dá)到一些目標(biāo):
GC的時(shí)間足夠的小
GC的次數(shù)足夠的少
發(fā)生Full GC的周期足夠的長(zhǎng)
前兩個(gè)目前是相悖的,要想GC時(shí)間小必須要一個(gè)更小的堆,要保證GC次數(shù)足夠少,必須保證一個(gè)更大的堆,我們只能取其平衡。
(1)針對(duì)JVM堆的設(shè)置一般,可以通過(guò)-Xms -Xmx限定其最小、最大值,為了防止垃圾收集器在最小、最大之間收縮堆而產(chǎn)生額外的時(shí)間,我們通常把最大、最小設(shè)置為相同的值
(2)年輕代和年老代將根據(jù)默認(rèn)的比例(1:2)分配堆內(nèi)存,可以通過(guò)調(diào)整二者之間的比率NewRadio來(lái)調(diào)整二者之間的大小,也可以針對(duì)回收代,比如年輕代,通過(guò) -XX:newSize -XX:MaxNewSize來(lái)設(shè)置其絕對(duì)大小。同樣,為了防止年輕代的堆收縮,我們通常會(huì)把-XX:newSize -XX:MaxNewSize設(shè)置為同樣大小
(3)年輕代和年老代設(shè)置多大才算合理?這個(gè)我問(wèn)題毫無(wú)疑問(wèn)是沒(méi)有答案的,否則也就不會(huì)有調(diào)優(yōu)。我們觀察一下二者大小變化有哪些影響
更大的年輕代必然導(dǎo)致更小的年老代,大的年輕代會(huì)延長(zhǎng)普通GC的周期,但會(huì)增加每次GC的時(shí)間;小的年老代會(huì)導(dǎo)致更頻繁的Full GC
更小的年輕代必然導(dǎo)致更大年老代,小的年輕代會(huì)導(dǎo)致普通GC很頻繁,但每次的GC時(shí)間會(huì)更短;大的年老代會(huì)減少Full GC的頻率
如何選擇應(yīng)該依賴應(yīng)用程序?qū)ο笊芷诘姆植记闆r:如果應(yīng)用存在大量的臨時(shí)對(duì)象,應(yīng)該選擇更大的年輕代;如果存在相對(duì)較多的持久對(duì)象,年老代應(yīng)該適當(dāng)增大。但很多應(yīng)用都沒(méi)有這樣明顯的特性,在抉擇時(shí)應(yīng)該根據(jù)以下兩點(diǎn):(A)本著Full GC盡量少的原則,讓年老代盡量緩存常用對(duì)象,JVM的默認(rèn)比例1:2也是這個(gè)道理 (B)通過(guò)觀察應(yīng)用一段時(shí)間,看其他在峰值時(shí)年老代會(huì)占多少內(nèi)存,在不影響Full GC的前提下,根據(jù)實(shí)際情況加大年輕代,比如可以把比例控制在1:1。但應(yīng)該給年老代至少預(yù)留1/3的增長(zhǎng)空間
(4)在配置較好的機(jī)器上(比如多核、大內(nèi)存),可以為年老代選擇并行收集算法: -
- XX:+UseParallelOldGC,默認(rèn)為Serial收集
- 復(fù)制代碼
(5)線程堆棧的設(shè)置:每個(gè)線程默認(rèn)會(huì)開(kāi)啟1M的堆棧,用于存放棧幀、調(diào)用參數(shù)、局部變量等,對(duì)大多數(shù)應(yīng)用而言這個(gè)默認(rèn)值太了,一般256K就足用。理論上,在內(nèi)存不變的情況下,減少每個(gè)線程的堆棧,可以產(chǎn)生更多的線程,但這實(shí)際上還受限于操作系統(tǒng)。
(4)可以通過(guò)下面的參數(shù)打Heap Dump信息
- -XX:HeapDumpPath-XX:+PrintGCDetails-XX:+PrintGCTimeStamps-Xloggc:/usr/aaa/dump/heap_trace.txt
- 復(fù)制代碼
通過(guò)下面參數(shù)可以控制OutOfMemoryError時(shí)打印堆的信息
- -XX:+HeapDumpOnOutOfMemoryError
- 復(fù)制代碼
請(qǐng)看一下一個(gè)時(shí)間的Java參數(shù)配置:(服務(wù)器:Linux 64Bit,8Core×16G)
- JAVA_OPTS="$JAVA_OPTS -server -Xms3G -Xmx3G -Xss256k -XX:PermSize=128m -XX:MaxPermSize=128m -XX:+UseParallelOldGC -XX:+HeapDumpOnOutOfMemoryError -XX:HeapDumpPath=/usr/aaa/dump -XX:+PrintGCDetails -XX:+PrintGCTimeStamps -Xloggc:/usr/aaa/dump/heap_trace.txt -XX:NewSize=1G -XX:MaxNewSize=1G"
- 復(fù)制代碼
經(jīng)過(guò)觀察該配置非常穩(wěn)定,每次普通GC的時(shí)間在10ms左右,F(xiàn)ull GC基本不發(fā)生,或隔很長(zhǎng)很長(zhǎng)的時(shí)間才發(fā)生一次