聊聊死鎖的四種排查工具 !
作者 | 王磊
來源 | Java中文社群(ID:javacn666)
轉(zhuǎn)載請聯(lián)系授權(quán)(微信ID:GG_Stone
死鎖(Dead Lock)指的是兩個或兩個以上的運算單元(進程、線程或協(xié)程),都在等待對方停止執(zhí)行,以取得系統(tǒng)資源,但是沒有一方提前退出,就稱為死鎖。
死鎖示例
接下來,我們先來演示一下 Java 中最簡單的死鎖,我們創(chuàng)建兩個鎖和兩個線程,讓線程 1 先擁有鎖 A,然后在 1s 后嘗試獲取鎖 B,同時我們啟動線程 2,讓它先擁有鎖 B,然后在 1s 之后嘗試獲取鎖 A,這時就會出現(xiàn)相互等待對方釋放鎖的情況,從而造成死鎖的問題,具體代碼如下:
- publicclass DeadLockExample {
- public static void main(String[] args) {
- Object lockA = new Object(); // 創(chuàng)建鎖 A
- Object lockB = new Object(); // 創(chuàng)建鎖 B
- // 創(chuàng)建線程 1
- Thread t1 = new Thread(new Runnable() {
- @Override
- public void run() {
- // 先獲取鎖 A
- synchronized (lockA) {
- System.out.println("線程 1:獲取到鎖 A!");
- try {
- Thread.sleep(1000);
- } catch (InterruptedException e) {
- e.printStackTrace();
- }
- // 嘗試獲取鎖 B
- System.out.println("線程 1:等待獲取 B...");
- synchronized (lockB) {
- System.out.println("線程 1:獲取到鎖 B!");
- }
- }
- }
- });
- t1.start(); // 運行線程
- // 創(chuàng)建線程 2
- Thread t2 = new Thread(new Runnable() {
- @Override
- public void run() {
- // 先獲取鎖 B
- synchronized (lockB) {
- System.out.println("線程 2:獲取到鎖 B!");
- try {
- Thread.sleep(1000);
- } catch (InterruptedException e) {
- e.printStackTrace();
- }
- // 嘗試獲取鎖 A
- System.out.println("線程 2:等待獲取 A...");
- synchronized (lockA) {
- System.out.println("線程 2:獲取到鎖 A!");
- }
- }
- }
- });
- t2.start(); // 運行線程
- }
- }
以上程序的執(zhí)行結(jié)果如下:
從上述結(jié)果可以看出,線程 1 和線程 2 都在等待對方釋放鎖,這樣就造成了死鎖問題。
死鎖產(chǎn)生原因
通過以上示例,我們可以得出結(jié)論,要產(chǎn)生死鎖需要滿足以下 4 個條件:
- 互斥條件:指運算單元(進程、線程或協(xié)程)對所分配到的資源具有排它性,也就是說在一段時間內(nèi)某個鎖資源只能被一個運算單元所占用。
- 請求和保持條件:指運算單元已經(jīng)保持至少一個資源,但又提出了新的資源請求,而該資源已被其它運算單元占有,此時請求運算單元阻塞,但又對自己已獲得的其它資源保持不放。
- 不可剝奪條件:指運算單元已獲得的資源,在未使用完之前,不能被剝奪。
- 環(huán)路等待條件:指在發(fā)生死鎖時,必然存在運算單元和資源的環(huán)形鏈,即運算單元正在等待另一個運算單元占用的資源,而對方又在等待自己占用的資源,從而造成環(huán)路等待的情況。
只有以上 4 個條件同時滿足,才會造成死鎖問題。
死鎖排查
如果程序出現(xiàn)死鎖問題,可通過以下 4 種方案中的任意一種進行分析和排查。
方案 1:jstack
我們在使用 jstack 之前,先要通過 jps 得到運行程序的進程 ID,使用方法如下:
“jps -l”可以查詢本機所有的 Java 程序,jps(Java Virtual Machine Process Status Tool)是 Java 提供的一個顯示當(dāng)前所有 Java 進程 pid 的命令,適合在 linux/unix/windows 平臺上簡單察看當(dāng)前 Java 進程的一些簡單情況,“-l”用于輸出進程 pid 和運行程序完整路徑名(包名和類名)。
有了進程 ID(PID)之后,我們就可以使用“jstack -l PID”來發(fā)現(xiàn)死鎖問題了,如下圖所示:
jstack 用于生成 Java 虛擬機當(dāng)前時刻的線程快照,“-l”表示長列表(long),打印關(guān)于鎖的附加信息。
PS:可以使用 jstack -help 查看更多命令使用說明。
方案 2:jconsole
使用 jconsole 需要打開 JDK 的 bin 目錄,找到 jconsole 并雙擊打開,如下圖所示:
然后選擇要調(diào)試的程序,如下圖所示:
之后點擊連接進入,選擇“不安全的連接”進入監(jiān)控主頁,如下圖所示:
之后切換到“線程”模塊,點擊“檢測死鎖”按鈕,如下圖所示:
之后稍等片刻就會檢測出死鎖的相關(guān)信息,如下圖所示:
方案 3:jvisualvm
jvisualvm 也在 JDK 的 bin 目錄中,同樣是雙擊打開:
稍等幾秒之后,jvisualvm 中就會出現(xiàn)本地的所有 Java 程序,如下圖所示:
雙擊選擇要調(diào)試的程序:
單機鼠標進入“線程”模塊,如下圖所示:
從上圖可以看出,當(dāng)我們切換到線程一欄之后就會直接顯示出死鎖信息,之后點擊“線程 Dump”生成死鎖的詳情信息,如下圖所示:
方案 4:jmc
jmc 是 Oracle Java Mission Control 的縮寫,是一個對 Java 程序進行管理、監(jiān)控、概要分析和故障排查的工具套件。它也是在 JDK 的 bin 目錄中,同樣是雙擊啟動,如下圖所示:
jmc 主頁信息如下:
之后選中要排查的程序,右鍵“啟動 JMX 控制臺”查看此程序的詳細內(nèi)容,如下圖所示:
然后點擊“線程”,勾中“死鎖檢測”就可以發(fā)現(xiàn)死鎖和死鎖的詳情信息,如下圖所示:
總結(jié)
死鎖是因為兩個或兩個以上的運算單元,都在等待對方停止執(zhí)行,以取得系統(tǒng)資源,但沒有一方提前退出,于是就出現(xiàn)了死鎖。死鎖的排查工具總共有 4 種:
- jstack
- jconsole
- jvisualvm
- jmc
從易用性和性能方面來考慮,推薦使用 jconsole 或 jvisualvm 來排查死鎖。
【編輯推薦】