Java七武器系列霸王槍 -- 線(xiàn)程狀態(tài)分析 jstack
在應(yīng)用運(yùn)行過(guò)程中,除了遇到 Bug,執(zhí)行結(jié)果不符合我們的預(yù)期之外,還有些時(shí)候是應(yīng)用的響應(yīng)問(wèn)題。
比如同樣對(duì)于頁(yè)面的請(qǐng)求,正常情況下兩秒之內(nèi)就返回了結(jié)果,頁(yè)面已經(jīng)渲染完成展現(xiàn)出來(lái)了。
那不正常的時(shí)候,就會(huì)看到頁(yè)面請(qǐng)求在不斷的加載中,沒(méi)有拿到響應(yīng)。當(dāng)然這個(gè)時(shí)候可以分析的點(diǎn)有很多,可能操作系統(tǒng)的CPU、內(nèi)存等資源占用比較多,也有可能是應(yīng)用內(nèi)線(xiàn)程較多在等待,還有可能是涉及到讀數(shù)據(jù)庫(kù)等操作時(shí)遇到鎖之類(lèi)的問(wèn)題。
這次先不理會(huì)操作系統(tǒng)層面上的東西,只來(lái)分析應(yīng)用內(nèi)可能遇到的情況。
回到前面說(shuō)的問(wèn)題,正常情況兩秒鐘返回了,這次一分鐘還沒(méi)返回。這個(gè)時(shí)候,關(guān)注應(yīng)用內(nèi)的話(huà),就需要分析一下其線(xiàn)程執(zhí)行情況,來(lái)了解了定位具體問(wèn)題。
此時(shí),這次要提到的這個(gè)「武器」jstack 可以快速定位,直達(dá)患處。
是什么
jstck 是什么? 這個(gè)是 Oracle JDK 默認(rèn)包含的一個(gè)用于打印執(zhí)行 Java 進(jìn)程的當(dāng)前線(xiàn)程棧信息的工具。官方是這樣介紹的:
jstack prints Java stack traces of Java threads for a given Java process or core file or a remote debug server. For each Java frame, the full class name, method name, 'bci' (byte code index) and line number, if available, are printed.
注意其中幾個(gè)關(guān)鍵點(diǎn):每一個(gè) Java Frame 的全類(lèi)名,方法名,如果能拿到行號(hào)的話(huà)還會(huì)顯示行號(hào)??催^(guò)前面介紹調(diào)試技巧那篇文章(80%的程序員都不了解的調(diào)試技巧)的朋友可能還記得,其中有一個(gè)功能是Drop Frame, 來(lái)實(shí)現(xiàn)后退執(zhí)行。和這里的是一個(gè)地方,都對(duì)應(yīng)線(xiàn)程中的一級(jí)調(diào)用。
使用 jstack 打出來(lái)的信息,和一般應(yīng)用遇到異常時(shí)的printStackTrace 基本一樣,只是那只是一個(gè)線(xiàn)程調(diào)用鏈的,這里通過(guò)工具,可以把應(yīng)用內(nèi)所有線(xiàn)程都打出來(lái)。
用法
使用方式和一般的 Java 分析工具類(lèi)似,都是通過(guò)
- 命令名 <可選參數(shù)> + pid(進(jìn)程id)
這種格式使用。比如對(duì)于 jstack, 一般可以直接 jstack 應(yīng)用pid 即可。這里 pid 可以通過(guò)Java的 jps 工具獲取,也可以通過(guò) Linux 下的ps 工具和 Windows 下的任務(wù)管理器獲取。
輸出
我們以一個(gè)Tomcat進(jìn)程為例,輸出類(lèi)似這樣:
我們看上面的幾個(gè)框:
最上方左側(cè),是當(dāng)前線(xiàn)程的線(xiàn)程名稱(chēng),可以根據(jù)此來(lái)在應(yīng)用內(nèi)大量的線(xiàn)程中找到我們關(guān)心的線(xiàn)程正在執(zhí)行的操作。例如 Tomcat 一般 http-port -x 這種線(xiàn)程是請(qǐng)求的處理線(xiàn)程,頁(yè)面響應(yīng)慢的時(shí)候,可以直接找這一類(lèi)線(xiàn)程。
隨著請(qǐng)求的增多,線(xiàn)程數(shù)也會(huì)很多。所以一般多線(xiàn)程應(yīng)用開(kāi)發(fā),一個(gè)好的實(shí)戰(zhàn)建議是為創(chuàng)建的線(xiàn)程起一個(gè)有意義的名字,否則打出來(lái)的 stack 里大量的 thread -1, thread -2 這種,天曉得哪一個(gè)才是你的。
第二行的框內(nèi)內(nèi)容,表示當(dāng)前線(xiàn)程的執(zhí)行狀態(tài),是運(yùn)行狀態(tài)還是TIME_WAITING,還是等待鎖等,可以根據(jù)線(xiàn)程狀態(tài)來(lái)了解。
第三個(gè)大框中的內(nèi)容就和我們異常時(shí)輸出的 stackTrace 一樣,是當(dāng)前代碼的調(diào)用鏈。
第四個(gè)框中的內(nèi)容,是當(dāng)前線(xiàn)程掛的鎖的情況。
上面的截圖,是沒(méi)有鎖互相占用的情況下的輸出。如果一個(gè)多線(xiàn)程中有鎖等待時(shí),會(huì)有類(lèi)似這樣的輸出:
注意,此時(shí)線(xiàn)程狀態(tài)變成了 BLOCKED, 同時(shí),在線(xiàn)程的調(diào)用鏈中,有一個(gè)waiting to lock 的輸出, 同時(shí),在下方持胡鎖的線(xiàn)程中,會(huì)有一個(gè) lock xxx,這個(gè)是當(dāng)前鎖對(duì)象,通過(guò)這個(gè)就可以看出當(dāng)前還有哪些線(xiàn)程在等待同一個(gè)鎖。
所以回到前面的問(wèn)題,如果此時(shí)因?yàn)殒i占用導(dǎo)致的,可以從輸出中看到,同時(shí)如果是數(shù)據(jù)庫(kù)連接池滿(mǎn)了,線(xiàn)程就會(huì)停在數(shù)據(jù)庫(kù)連接的操作上,在 stackTrace 中一眼就能看的出來(lái),甚至網(wǎng)絡(luò) Socket 讀取之類(lèi)的在等待,都會(huì)在調(diào)用鏈中體現(xiàn)出來(lái),從而可以快速的定位問(wèn)題,解決問(wèn)題。
那對(duì)于應(yīng)用的觀(guān)察分析,還需要注意的是,可以間隔幾秒鐘時(shí)間執(zhí)行一下 jstack,分析一下輸出,然后對(duì)比一下幾次輸出的區(qū)別,看看這一段時(shí)間內(nèi)應(yīng)用有哪些地方在執(zhí)行,分析和解決問(wèn)題。
【本文為51CTO專(zhuān)欄作者“侯樹(shù)成”的原創(chuàng)稿件,轉(zhuǎn)載請(qǐng)通過(guò)作者微信公眾號(hào)『Tomcat那些事兒』獲取授權(quán)】