Java垃圾回收調優(yōu)實戰(zhàn)
Java 垃圾回收調優(yōu)不同于任何其它性能優(yōu)化活動。
首先你要確保自己足夠了解整個應用的情況以及調優(yōu)預期的結果,而不是單單滿足于應用的某一部分調優(yōu)。一般情況下,遵循以下過程比較容易:
-
明確自己的性能目標。
-
測試。
-
測量調優(yōu)結果。
-
與目標進行比較。
-
改變方法并再次測試。
性能調優(yōu)目標要是可確定且可測量的,這非常重要。這些目標包括延遲、吞吐量和容量,想要了解更多,我推薦看看垃圾回收手冊(Garbage Collection Handbook)中相應的章節(jié)。讓我們看看在實踐中如何設定并達到這樣的調優(yōu)目標。為了這個目的,讓我們來看一個示例代碼:
- //imports skipped for brevity
- public class Producer implements Runnable {
- private static ScheduledExecutorService executorService = Executors.newScheduledThreadPool(2);
- private Deque<byte[]> deque;
- private int objectSize;
- private int queueSize;
- public Producer(int objectSize, int ttl) {
- this.deque = new ArrayDeque<byte[]>();
- this.objectSize = objectSize;
- this.queueSize = ttl * 1000;
- }
- @Override
- public void run() {
- for (int i = 0; i < 100; i++) {
- deque.add(new byte[objectSize]);
- if (deque.size() > queueSize) {
- deque.poll();
- }
- }
- }
- public static void main(String[] args) throws InterruptedException {
- executorService.scheduleAtFixedRate(new Producer(200 * 1024 * 1024 / 1000, 5), 0, 100, TimeUnit.MILLISECONDS);
- executorService.scheduleAtFixedRate(new Producer(50 * 1024 * 1024 / 1000, 120), 0, 100, TimeUnit.MILLISECONDS);
- TimeUnit.MINUTES.sleep(10);
- executorService.shutdownNow();
- }
- }
代碼中提交了兩個作業(yè)(job),且每 100ms 運行一次。每個作業(yè)模擬特定對象的生命周期:先創(chuàng)建對象,讓它們“存活”一段時間,然后忘記它們,讓 GC 回收內(nèi)存。 運行這個示例時,開啟 GC 日志并使用以下參數(shù):
-XX:+PrintGCDetails -XX:+PrintGCDateStamps -XX:+PrintGCTimeStamps
我們立即在日志文件中看到 GC 的影響和下面這些相似:
- 2015-06-04T13:34:16.119-0200: 1.723: [GC (Allocation Failure) [PSYoungGen: 114016K->73191K(234496K)] 421540K->421269K(745984K), 0.0858176 secs] [Times: user=0.04 sys=0.06, real=0.09 secs]
- 2015-06-04T13:34:16.738-0200: 2.342: [GC (Allocation Failure) [PSYoungGen: 234462K->93677K(254976K)] 582540K->593275K(766464K), 0.2357086 secs] [Times: user=0.11 sys=0.14, real=0.24 secs]
- 2015-06-04T13:34:16.974-0200: 2.578: [Full GC (Ergonomics) [PSYoungGen: 93677K->70109K(254976K)] [ParOldGen: 499597K->511230K(761856K)] 593275K->581339K(1016832K), [Metaspace: 2936K->2936K(1056768K)], 0.0713174 secs] [Times: user=0.21 sys=0.02, real=0.07 secs]
基于日志中的信息,我們可以開始改善性能。并請牢記三個不同的目標:
-
確保 GC pause(垃圾回收暫停)的最壞情況不要超過預期的臨界值。
-
確保應用程序線程停滯時間不超過預先確定的閥值。
-
降低基礎架構成本,同時確保我們?nèi)钥梢詫崿F(xiàn)合理的延遲和吞吐量目標。
為此,以三個不同的配置各運行了10分鐘,在下表中總結了三個差距較大的結果:
堆 |
GC算法 |
有效工作 |
長暫停 |
---|---|---|---|
-Xmx12g |
-XX:+UseConcMarkSweepGC |
89.8% |
560 ms |
-Xmx12g |
-XX:+UseParallelGC |
91.5% |
1,104 ms |
-Xmx8g |
-XX:+UseConcMarkSweepGC |
66.3% |
1,610 ms |
實驗中,設置不同的 GC 算法和不同的堆大小,運行相同的代碼,然后測量垃圾回收暫停的持續(xù)時間和吞吐量。實驗細節(jié)和結果的解釋都在我們的垃圾回收手冊中。看看手冊中的一些例子,修改一些簡單的配置造成延遲、吞吐量等各方面的性能完全不同。
注意:為了保持示例盡可能簡單,只有數(shù)量有限的輸入?yún)?shù)被改變,例如沒有對不同數(shù)量的核心(CPU core)或不同堆布局進行測試。