面試官:如何排查死鎖?
死鎖(Dead Lock)指的是兩個(gè)或兩個(gè)以上的運(yùn)算單元(進(jìn)程、線程或協(xié)程),都在等待對(duì)方停止執(zhí)行,以取得系統(tǒng)資源,但是沒有一方提前退出,就稱為死鎖。
死鎖示例
接下來,我們先來演示一下 Java 中最簡(jiǎn)單的死鎖,我們創(chuàng)建兩個(gè)鎖和兩個(gè)線程,讓線程 1 先擁有鎖 A,然后在 1s 后嘗試獲取鎖 B,同時(shí)我們啟動(dòng)線程 2,讓它先擁有鎖 B,然后在 1s 之后嘗試獲取鎖 A,這時(shí)就會(huì)出現(xiàn)相互等待對(duì)方釋放鎖的情況,從而造成死鎖的問題,具體代碼如下:
以上程序的執(zhí)行結(jié)果如下:
從上述結(jié)果可以看出,線程 1 和線程 2 都在等待對(duì)方釋放鎖,這樣就造成了死鎖問題。
死鎖產(chǎn)生原因
通過以上示例,我們可以得出結(jié)論,要產(chǎn)生死鎖需要滿足以下 4 個(gè)條件:
- 互斥條件:指運(yùn)算單元(進(jìn)程、線程或協(xié)程)對(duì)所分配到的資源具有排它性,也就是說在一段時(shí)間內(nèi)某個(gè)鎖資源只能被一個(gè)運(yùn)算單元所占用。
- 請(qǐng)求和保持條件:指運(yùn)算單元已經(jīng)保持至少一個(gè)資源,但又提出了新的資源請(qǐng)求,而該資源已被其它運(yùn)算單元占有,此時(shí)請(qǐng)求運(yùn)算單元阻塞,但又對(duì)自己已獲得的其它資源保持不放。
- 不可剝奪條件:指運(yùn)算單元已獲得的資源,在未使用完之前,不能被剝奪。
- 環(huán)路等待條件:指在發(fā)生死鎖時(shí),必然存在運(yùn)算單元和資源的環(huán)形鏈,即運(yùn)算單元正在等待另一個(gè)運(yùn)算單元占用的資源,而對(duì)方又在等待自己占用的資源,從而造成環(huán)路等待的情況。
只有以上 4 個(gè)條件同時(shí)滿足,才會(huì)造成死鎖問題。
死鎖排查
如果程序出現(xiàn)死鎖問題,可通過以下 4 種方案中的任意一種進(jìn)行分析和排查。
方案 1:jstack
我們?cè)谑褂?jstack 之前,先要通過 jps 得到運(yùn)行程序的進(jìn)程 ID,使用方法如下:
“jps -l”可以查詢本機(jī)所有的 Java 程序,jps(Java Virtual Machine Process Status Tool)是 Java 提供的一個(gè)顯示當(dāng)前所有 Java 進(jìn)程 pid 的命令,適合在 linux/unix/windows 平臺(tái)上簡(jiǎn)單察看當(dāng)前 Java 進(jìn)程的一些簡(jiǎn)單情況,“-l”用于輸出進(jìn)程 pid 和運(yùn)行程序完整路徑名(包名和類名)。
有了進(jìn)程 ID(PID)之后,我們就可以使用“jstack -l PID”來發(fā)現(xiàn)死鎖問題了,如下圖所示:
jstack 用于生成 Java 虛擬機(jī)當(dāng)前時(shí)刻的線程快照,“-l”表示長(zhǎng)列表(long),打印關(guān)于鎖的附加信息。
PS:可以使用 jstack -help 查看更多命令使用說明。
方案 2:jconsole
使用 jconsole 需要打開 JDK 的 bin 目錄,找到 jconsole 并雙擊打開,如下圖所示:
然后選擇要調(diào)試的程序,如下圖所示:
之后點(diǎn)擊連接進(jìn)入,選擇“不安全的連接”進(jìn)入監(jiān)控主頁,如下圖所示:
之后切換到“線程”模塊,點(diǎn)擊“檢測(cè)死鎖”按鈕,如下圖所示:
之后稍等片刻就會(huì)檢測(cè)出死鎖的相關(guān)信息,如下圖所示:
方案 3:jvisualvm
jvisualvm 也在 JDK 的 bin 目錄中,同樣是雙擊打開:
稍等幾秒之后,jvisualvm 中就會(huì)出現(xiàn)本地的所有 Java 程序,如下圖所示:
雙擊選擇要調(diào)試的程序:
單機(jī)鼠標(biāo)進(jìn)入“線程”模塊,如下圖所示:
從上圖可以看出,當(dāng)我們切換到線程一欄之后就會(huì)直接顯示出死鎖信息,之后點(diǎn)擊“線程 Dump”生成死鎖的詳情信息,如下圖所示:
方案 4:jmc
jmc 是 Oracle Java Mission Control 的縮寫,是一個(gè)對(duì) Java 程序進(jìn)行管理、監(jiān)控、概要分析和故障排查的工具套件。它也是在 JDK 的 bin 目錄中,同樣是雙擊啟動(dòng),如下圖所示:
jmc 主頁信息如下:
之后選中要排查的程序,右鍵“啟動(dòng) JMX 控制臺(tái)”查看此程序的詳細(xì)內(nèi)容,如下圖所示:
然后點(diǎn)擊“線程”,勾中“死鎖檢測(cè)”就可以發(fā)現(xiàn)死鎖和死鎖的詳情信息,如下圖所示:
總結(jié)
死鎖是因?yàn)閮蓚€(gè)或兩個(gè)以上的運(yùn)算單元,都在等待對(duì)方停止執(zhí)行,以取得系統(tǒng)資源,但沒有一方提前退出,于是就出現(xiàn)了死鎖。死鎖的排查工具總共有 4 種:
- jstack
- jconsole
- jvisualvm
- jmc
從易用性和性能方面來考慮,推薦使用 jconsole 或 jvisualvm 來排查死鎖。
作者介紹
磊哥,14 年編程和框架從業(yè)經(jīng)驗(yàn),前 360 技術(shù)專家、CSDN 簽約作者、阿里云專家博主、拉勾網(wǎng)簽約作者、掘金優(yōu)秀作者、慕課網(wǎng)講師等。期待與你相遇,一起探討和分享技術(shù)的樂趣。?