掌握這3個(gè)技巧，你也可以秒懂JAVA性能調(diào)優(yōu)和jvm垃圾回收

作者：佚名 2020-12-10 16:11:17

JVM 是一個(gè)虛擬化的操作系統(tǒng)，類似于 Linux 和 Window，只是他被架構(gòu)在了操作系統(tǒng)上進(jìn)行接收 class 文件并把 class 翻譯成系統(tǒng)識(shí)別的機(jī)器碼進(jìn)行執(zhí)行，即 JVM 為我們屏蔽了不同操作系統(tǒng)在底層硬件和操作指令的不同。

前言

因此，JVM 最重要的作用浮出水面，即跨平臺(tái)性。由于 JVM 為 java 程序屏蔽了操作系統(tǒng)底層的細(xì)節(jié)，Java 只需要關(guān)心如何編譯，如何讓加載進(jìn) JVM 即可。

由于 JVM 接收的是 Class 文件，而不是接收特定的語(yǔ)言，因此只要某種語(yǔ)言可以編譯成 Class 文件，就可以在 JVM 上運(yùn)行，這些語(yǔ)言有 Groovy、Kotlin、Scala 等等。因此 JVM 的另一個(gè)重要特性就是語(yǔ)言無(wú)關(guān)性，即跨語(yǔ)言。

一、JVM內(nèi)存模型及垃圾收集算法

1.根據(jù)Java虛擬機(jī)規(guī)范，JVM將內(nèi)存劃分為：

New（年輕代）

Tenured（年老代）

永久代（Perm）

其中New和Tenured屬于堆內(nèi)存，堆內(nèi)存會(huì)從JVM啟動(dòng)參數(shù)（-Xmx:3G）指定的內(nèi)存中分配，Perm不屬于堆內(nèi)存，有虛擬機(jī)直接分配，但可以通過(guò) -XX:PermSize -XX:MaxPermSize 等參數(shù)調(diào)整其大小。

年輕代（New）：年輕代用來(lái)存放JVM剛分配的Java對(duì)象

年老代（Tenured)：年輕代中經(jīng)過(guò)垃圾回收沒(méi)有回收掉的對(duì)象將被Copy到年老代

永久代（Perm）：永久代存放Class、Method元信息，其大小跟項(xiàng)目的規(guī)模、類、方法的量有關(guān)，一般設(shè)置為128M就足夠，設(shè)置原則是預(yù)留30%的空間。

New又分為幾個(gè)部分：

Eden：Eden用來(lái)存放JVM剛分配的對(duì)象

Survivor1

Survivro2：兩個(gè)Survivor空間一樣大，當(dāng)Eden中的對(duì)象經(jīng)過(guò)垃圾回收沒(méi)有被回收掉時(shí)，會(huì)在兩個(gè)Survivor之間來(lái)回Copy，當(dāng)滿足某個(gè)條件，比如Copy次數(shù)，就會(huì)被Copy到Tenured。顯然，Survivor只是增加了對(duì)象在年輕代中的逗留時(shí)間，增加了被垃圾回收的可能性。

2.垃圾回收算法

垃圾回收算法可以分為三類，都基于標(biāo)記-清除（復(fù)制）算法：

Serial算法（單線程）

并行算法

并發(fā)算法

JVM會(huì)根據(jù)機(jī)器的硬件配置對(duì)每個(gè)內(nèi)存代選擇適合的回收算法，比如，如果機(jī)器多于1個(gè)核，會(huì)對(duì)年輕代選擇并行算法，關(guān)于選擇細(xì)節(jié)請(qǐng)參考JVM調(diào)優(yōu)文檔。

稍微解釋下的是，并行算法是用多線程進(jìn)行垃圾回收，回收期間會(huì)暫停程序的執(zhí)行，而并發(fā)算法，也是多線程回收，但期間不停止應(yīng)用執(zhí)行。所以，并發(fā)算法適用于交互性高的一些程序。經(jīng)過(guò)觀察，并發(fā)算法會(huì)減少年輕代的大小，其實(shí)就是使用了一個(gè)大的年老代，這反過(guò)來(lái)跟并行算法相比吞吐量相對(duì)較低。

垃圾回收動(dòng)作何時(shí)執(zhí)行？

還有一個(gè)問(wèn)題是，垃圾回收動(dòng)作何時(shí)執(zhí)行？

當(dāng)年輕代內(nèi)存滿時(shí)，會(huì)引發(fā)一次普通GC，該GC僅回收年輕代。需要強(qiáng)調(diào)的時(shí)，年輕代滿是指Eden代滿，Survivor滿不會(huì)引發(fā)GC

當(dāng)年老代滿時(shí)會(huì)引發(fā)Full GC，F(xiàn)ull GC將會(huì)同時(shí)回收年輕代、年老代

當(dāng)永久代滿時(shí)也會(huì)引發(fā)Full GC，會(huì)導(dǎo)致Class、Method元信息的卸載

另一個(gè)問(wèn)題是，何時(shí)會(huì)拋出OutOfMemoryException，并不是內(nèi)存被耗空的時(shí)候才拋出

JVM98%的時(shí)間都花費(fèi)在內(nèi)存回收

每次回收的內(nèi)存小于2%

滿足這兩個(gè)條件將觸發(fā)OutOfMemoryException，這將會(huì)留給系統(tǒng)一個(gè)微小的間隙以做一些Down之前的操作，比如手動(dòng)打印Heap Dump。

二、內(nèi)存泄漏及解決方法

1.系統(tǒng)崩潰前的一些現(xiàn)象：

每次垃圾回收的時(shí)間越來(lái)越長(zhǎng)，由之前的10ms延長(zhǎng)到50ms左右，F(xiàn)ullGC的時(shí)間也有之前的0.5s延長(zhǎng)到4、5s

FullGC的次數(shù)越來(lái)越多，最頻繁時(shí)隔不到1分鐘就進(jìn)行一次FullGC

年老代的內(nèi)存越來(lái)越大并且每次FullGC后年老代沒(méi)有內(nèi)存被釋放

之后系統(tǒng)會(huì)無(wú)法響應(yīng)新的請(qǐng)求，逐漸到達(dá)OutOfMemoryError的臨界值。

2.生成堆的dump文件

通過(guò)JMX的MBean生成當(dāng)前的Heap信息，大小為一個(gè)3G（整個(gè)堆的大?。┑膆prof文件，如果沒(méi)有啟動(dòng)JMX可以通過(guò)Java的jmap命令來(lái)生成該文件。

3.分析dump文件

下面要考慮的是如何打開(kāi)這個(gè)3G的堆信息文件，顯然一般的Window系統(tǒng)沒(méi)有這么大的內(nèi)存，必須借助高配置的Linux。當(dāng)然我們可以借助X-Window把Linux上的圖形導(dǎo)入到Window。我們考慮用下面幾種工具打開(kāi)該文件：

Visual VM

IBM HeapAnalyzer

JDK 自帶的Hprof工具

使用這些工具時(shí)為了確保加載速度，建議設(shè)置最大內(nèi)存為6G。使用后發(fā)現(xiàn)，這些工具都無(wú)法直觀地觀察到內(nèi)存泄漏，Visual VM雖能觀察到對(duì)象大小，但看不到調(diào)用堆棧；HeapAnalyzer雖然能看到調(diào)用堆棧，卻無(wú)法正確打開(kāi)一個(gè)3G的文件。因此，我們又選用了Eclipse專門的靜態(tài)內(nèi)存分析工具：Mat。

4.分析內(nèi)存泄漏

通過(guò)Mat我們能清楚地看到，哪些對(duì)象被懷疑為內(nèi)存泄漏，哪些對(duì)象占的空間最大及對(duì)象的調(diào)用關(guān)系。針對(duì)本案，在ThreadLocal中有很多的JbpmContext實(shí)例，經(jīng)過(guò)調(diào)查是JBPM的Context沒(méi)有關(guān)閉所致。

另，通過(guò)Mat或JMX我們還可以分析線程狀態(tài)，可以觀察到線程被阻塞在哪個(gè)對(duì)象上，從而判斷系統(tǒng)的瓶頸。

5.回歸問(wèn)題

Q：為什么崩潰前垃圾回收的時(shí)間越來(lái)越長(zhǎng)？

A:根據(jù)內(nèi)存模型和垃圾回收算法，垃圾回收分兩部分：內(nèi)存標(biāo)記、清除（復(fù)制），標(biāo)記部分只要內(nèi)存大小固定時(shí)間是不變的，變的是復(fù)制部分，因?yàn)槊看卫厥斩加幸恍┗厥詹坏舻膬?nèi)存，所以增加了復(fù)制量，導(dǎo)致時(shí)間延長(zhǎng)。所以，垃圾回收的時(shí)間也可以作為判斷內(nèi)存泄漏的依據(jù)

Q：為什么Full GC的次數(shù)越來(lái)越多？

A：因此內(nèi)存的積累，逐漸耗盡了年老代的內(nèi)存，導(dǎo)致新對(duì)象分配沒(méi)有更多的空間，從而導(dǎo)致頻繁的垃圾回收

Q:為什么年老代占用的內(nèi)存越來(lái)越大？

A:因?yàn)槟贻p代的內(nèi)存無(wú)法被回收，越來(lái)越多地被Copy到年老代

三、性能調(diào)優(yōu)

除了上述內(nèi)存泄漏外，我們還發(fā)現(xiàn)CPU長(zhǎng)期不足3%，系統(tǒng)吞吐量不夠，針對(duì)8core×16G、64bit的Linux服務(wù)器來(lái)說(shuō)，是嚴(yán)重的資源浪費(fèi)。

在CPU負(fù)載不足的同時(shí)，偶爾會(huì)有用戶反映請(qǐng)求的時(shí)間過(guò)長(zhǎng)，我們意識(shí)到必須對(duì)程序及JVM進(jìn)行調(diào)優(yōu)。從以下幾個(gè)方面進(jìn)行：

線程池：解決用戶響應(yīng)時(shí)間長(zhǎng)的問(wèn)題

連接池

JVM啟動(dòng)參數(shù)：調(diào)整各代的內(nèi)存比例和垃圾回收算法，提高吞吐量

程序算法：改進(jìn)程序邏輯算法提高性能

1.Java線程池（java.util.concurrent.ThreadPoolExecutor）

大多數(shù)JVM6上的應(yīng)用采用的線程池都是JDK自帶的線程池，之所以把成熟的Java線程池進(jìn)行羅嗦說(shuō)明，是因?yàn)樵摼€程池的行為與我們想象的有點(diǎn)出入。Java線程池有幾個(gè)重要的配置參數(shù)：

corePoolSize：核心線程數(shù)（最新線程數(shù)）

maximumPoolSize：最大線程數(shù)，超過(guò)這個(gè)數(shù)量的任務(wù)會(huì)被拒絕，用戶可以通過(guò)RejectedExecutionHandler接口自定義處理方式

keepAliveTime：線程保持活動(dòng)的時(shí)間

workQueue：工作隊(duì)列，存放執(zhí)行的任務(wù)

Java線程池需要傳入一個(gè)Queue參數(shù)（workQueue）用來(lái)存放執(zhí)行的任務(wù)，而對(duì)Queue的不同選擇，線程池有完全不同的行為：

SynchronousQueue：一個(gè)無(wú)容量的等待隊(duì)列，一個(gè)線程的insert操作必須等待另一線程的remove操作，采用這個(gè)Queue線程池將會(huì)為每個(gè)任務(wù)分配一個(gè)新線程

LinkedBlockingQueue ：無(wú)界隊(duì)列，采用該Queue，線程池將忽略maximumPoolSize參數(shù)，僅用corePoolSize的線程處理所有的任務(wù)，未處理的任務(wù)便在LinkedBlockingQueue中排隊(duì)

ArrayBlockingQueue：有界隊(duì)列，在有界隊(duì)列和maximumPoolSize的作用下，程序?qū)⒑茈y被調(diào)優(yōu)：更大的Queue和小的maximumPoolSize將導(dǎo)致CPU的低負(fù)載；小的Queue和大的池，Queue就沒(méi)起動(dòng)應(yīng)有的作用。

其實(shí)我們的要求很簡(jiǎn)單，希望線程池能跟連接池一樣，能設(shè)置最小線程數(shù)、最大線程數(shù)，當(dāng)最小數(shù)<任務(wù)<最大數(shù)時(shí)，應(yīng)該分配新的線程處理；當(dāng)任務(wù)>最大數(shù)時(shí)，應(yīng)該等待有空閑線程再處理該任務(wù)。

線程池的設(shè)計(jì)思路

但線程池的設(shè)計(jì)思路是，任務(wù)應(yīng)該放到Queue中，當(dāng)Queue放不下時(shí)再考慮用新線程處理，如果Queue滿且無(wú)法派生新線程，就拒絕該任務(wù)。設(shè)計(jì)導(dǎo)致“先放等執(zhí)行”、“放不下再執(zhí)行”、“拒絕不等待”。所以，根據(jù)不同的Queue參數(shù)，要提高吞吐量不能一味地增大maximumPoolSize。

當(dāng)然，要達(dá)到我們的目標(biāo)，必須對(duì)線程池進(jìn)行一定的封裝，幸運(yùn)的是ThreadPoolExecutor中留了足夠的自定義接口以幫助我們達(dá)到目標(biāo)。我們封裝的方式是：

以SynchronousQueue作為參數(shù)，使maximumPoolSize發(fā)揮作用，以防止線程被無(wú)限制的分配，同時(shí)可以通過(guò)提高maximumPoolSize來(lái)提高系統(tǒng)吞吐量

自定義一個(gè)RejectedExecutionHandler，當(dāng)線程數(shù)超過(guò)maximumPoolSize時(shí)進(jìn)行處理，處理方式為隔一段時(shí)間檢查線程池是否可以執(zhí)行新Task，如果可以把拒絕的Task重新放入到線程池，檢查的時(shí)間依賴keepAliveTime的大小。

2.連接池（org.apache.commons.dbcp.BasicDataSource）

在使用org.apache.commons.dbcp.BasicDataSource的時(shí)候，因?yàn)橹安捎昧四J(rèn)配置，所以當(dāng)訪問(wèn)量大時(shí)，通過(guò)JMX觀察到很多Tomcat線程都阻塞在BasicDataSource使用的Apache ObjectPool的鎖上，直接原因當(dāng)時(shí)是因?yàn)锽asicDataSource連接池的最大連接數(shù)設(shè)置的太小，默認(rèn)的BasicDataSource配置，僅使用8個(gè)最大連接。

我還觀察到一個(gè)問(wèn)題，當(dāng)較長(zhǎng)的時(shí)間不訪問(wèn)系統(tǒng)，比如2天，DB上的Mysql會(huì)斷掉所以的連接，導(dǎo)致連接池中緩存的連接不能用。為了解決這些問(wèn)題，我們充分研究了BasicDataSource，發(fā)現(xiàn)了一些優(yōu)化的點(diǎn)：

Mysql默認(rèn)支持100個(gè)鏈接，所以每個(gè)連接池的配置要根據(jù)集群中的機(jī)器數(shù)進(jìn)行，如有2臺(tái)服務(wù)器，可每個(gè)設(shè)置為60

initialSize：參數(shù)是一直打開(kāi)的連接數(shù)

minEvictableIdleTimeMillis：該參數(shù)設(shè)置每個(gè)連接的空閑時(shí)間，超過(guò)這個(gè)時(shí)間連接將被關(guān)閉

timeBetweenEvictionRunsMillis：后臺(tái)線程的運(yùn)行周期，用來(lái)檢測(cè)過(guò)期連接

maxActive：最大能分配的連接數(shù)

maxIdle：最大空閑數(shù)，當(dāng)連接使用完畢后發(fā)現(xiàn)連接數(shù)大于maxIdle，連接將被直接關(guān)閉。只有initialSize < x < maxIdle的連接將被定期檢測(cè)是否超期。這個(gè)參數(shù)主要用來(lái)在峰值訪問(wèn)時(shí)提高吞吐量。

initialSize是如何保持的？

initialSize是如何保持的？經(jīng)過(guò)研究代碼發(fā)現(xiàn)，BasicDataSource會(huì)關(guān)閉所有超期的連接，然后再打開(kāi)initialSize數(shù)量的連接，這個(gè)特性與minEvictableIdleTimeMillis、timeBetweenEvictionRunsMillis一起保證了所有超期的initialSize連接都會(huì)被重新連接，從而避免了Mysql長(zhǎng)時(shí)間無(wú)動(dòng)作會(huì)斷掉連接的問(wèn)題。

3.JVM參數(shù)

在JVM啟動(dòng)參數(shù)中，可以設(shè)置跟內(nèi)存、垃圾回收相關(guān)的一些參數(shù)設(shè)置，默認(rèn)情況不做任何設(shè)置JVM會(huì)工作的很好，但對(duì)一些配置很好的Server和具體的應(yīng)用必須仔細(xì)調(diào)優(yōu)才能獲得最佳性能。通過(guò)設(shè)置我們希望達(dá)到一些目標(biāo)：

GC的時(shí)間足夠的小

GC的次數(shù)足夠的少

發(fā)生Full GC的周期足夠的長(zhǎng)

前兩個(gè)目前是相悖的，要想GC時(shí)間小必須要一個(gè)更小的堆，要保證GC次數(shù)足夠少，必須保證一個(gè)更大的堆，我們只能取其平衡。

（1）針對(duì)JVM堆的設(shè)置一般，可以通過(guò)-Xms -Xmx限定其最小、最大值，為了防止垃圾收集器在最小、最大之間收縮堆而產(chǎn)生額外的時(shí)間，我們通常把最大、最小設(shè)置為相同的值

（2）年輕代和年老代將根據(jù)默認(rèn)的比例（1：2）分配堆內(nèi)存，可以通過(guò)調(diào)整二者之間的比率NewRadio來(lái)調(diào)整二者之間的大小，也可以針對(duì)回收代，比如年輕代，通過(guò) -XX:newSize -XX:MaxNewSize來(lái)設(shè)置其絕對(duì)大小。同樣，為了防止年輕代的堆收縮，我們通常會(huì)把-XX:newSize -XX:MaxNewSize設(shè)置為同樣大小

（3）年輕代和年老代設(shè)置多大才算合理？這個(gè)我問(wèn)題毫無(wú)疑問(wèn)是沒(méi)有答案的，否則也就不會(huì)有調(diào)優(yōu)。我們觀察一下二者大小變化有哪些影響

更大的年輕代必然導(dǎo)致更小的年老代，大的年輕代會(huì)延長(zhǎng)普通GC的周期，但會(huì)增加每次GC的時(shí)間；小的年老代會(huì)導(dǎo)致更頻繁的Full GC

更小的年輕代必然導(dǎo)致更大年老代，小的年輕代會(huì)導(dǎo)致普通GC很頻繁，但每次的GC時(shí)間會(huì)更短；大的年老代會(huì)減少Full GC的頻率

如何選擇應(yīng)該依賴應(yīng)用程序?qū)ο笊芷诘姆植记闆r：如果應(yīng)用存在大量的臨時(shí)對(duì)象，應(yīng)該選擇更大的年輕代；如果存在相對(duì)較多的持久對(duì)象，年老代應(yīng)該適當(dāng)增大。但很多應(yīng)用都沒(méi)有這樣明顯的特性，在抉擇時(shí)應(yīng)該根據(jù)以下兩點(diǎn)：（A）本著Full GC盡量少的原則，讓年老代盡量緩存常用對(duì)象，JVM的默認(rèn)比例1：2也是這個(gè)道理（B）通過(guò)觀察應(yīng)用一段時(shí)間，看其他在峰值時(shí)年老代會(huì)占多少內(nèi)存，在不影響Full GC的前提下，根據(jù)實(shí)際情況加大年輕代，比如可以把比例控制在1：1。但應(yīng)該給年老代至少預(yù)留1/3的增長(zhǎng)空間

（4）在配置較好的機(jī)器上（比如多核、大內(nèi)存），可以為年老代選擇并行收集算法： -

XX:+UseParallelOldGC，默認(rèn)為Serial收集 
復(fù)制代碼

（5）線程堆棧的設(shè)置：每個(gè)線程默認(rèn)會(huì)開(kāi)啟1M的堆棧，用于存放棧幀、調(diào)用參數(shù)、局部變量等，對(duì)大多數(shù)應(yīng)用而言這個(gè)默認(rèn)值太了，一般256K就足用。理論上，在內(nèi)存不變的情況下，減少每個(gè)線程的堆棧，可以產(chǎn)生更多的線程，但這實(shí)際上還受限于操作系統(tǒng)。

（4）可以通過(guò)下面的參數(shù)打Heap Dump信息

-XX:HeapDumpPath-XX:+PrintGCDetails-XX:+PrintGCTimeStamps-Xloggc:/usr/aaa/dump/heap_trace.txt 
復(fù)制代碼

通過(guò)下面參數(shù)可以控制OutOfMemoryError時(shí)打印堆的信息

-XX:+HeapDumpOnOutOfMemoryError 
復(fù)制代碼

請(qǐng)看一下一個(gè)時(shí)間的Java參數(shù)配置：（服務(wù)器：Linux 64Bit，8Core×16G）

JAVA_OPTS="$JAVA_OPTS -server -Xms3G -Xmx3G -Xss256k -XX:PermSize=128m -XX:MaxPermSize=128m -XX:+UseParallelOldGC -XX:+HeapDumpOnOutOfMemoryError -XX:HeapDumpPath=/usr/aaa/dump -XX:+PrintGCDetails -XX:+PrintGCTimeStamps -Xloggc:/usr/aaa/dump/heap_trace.txt -XX:NewSize=1G -XX:MaxNewSize=1G" 
復(fù)制代碼

經(jīng)過(guò)觀察該配置非常穩(wěn)定，每次普通GC的時(shí)間在10ms左右，F(xiàn)ull GC基本不發(fā)生，或隔很長(zhǎng)很長(zhǎng)的時(shí)間才發(fā)生一次

責(zé)任編輯：張燕妮來(lái)源： segmentfault.com