如何排查Java應(yīng)用的死鎖
首先,我們構(gòu)造一個(gè)死鎖場(chǎng)景。
如何構(gòu)造一個(gè)死鎖呢?
很簡(jiǎn)單,只要讓線程1占有對(duì)象a的鎖后,再去請(qǐng)求對(duì)象b的鎖。與此同時(shí),對(duì)象2已經(jīng)占有了對(duì)象b的鎖,再請(qǐng)求對(duì)象a的鎖。線程1與線程2互相等待,形成了死鎖。(在面試中,也會(huì)被經(jīng)常地要求手寫死鎖)
代碼如下:
- package com.example.dl;
- import org.springframework.web.bind.annotation.RequestMapping;
- import org.springframework.web.bind.annotation.RestController;
- @RestController
- public class Controller {
- @RequestMapping("/test")
- public String testDeadLock() {
- final Object a = new Object();
- final Object b = new Object();
- new Thread(() -> {
- synchronized (a) {
- System.out.println(Thread.currentThread().getName() + "占有了對(duì)象a的鎖");
- try {
- Thread.sleep(1000);
- } catch (InterruptedException e) {
- e.printStackTrace();
- }
- System.out.println(Thread.currentThread().getName() + "請(qǐng)求對(duì)象b的鎖");
- synchronized (b) {
- System.out.println(Thread.currentThread().getName() + "占有了對(duì)象b的鎖");
- }
- }
- }, "Thread 1").start();
- new Thread(() -> {
- synchronized (b) {
- System.out.println(Thread.currentThread().getName() + "占有了對(duì)象b的鎖");
- try {
- Thread.sleep(1000);
- } catch (InterruptedException e) {
- e.printStackTrace();
- }
- System.out.println(Thread.currentThread().getName() + "請(qǐng)求對(duì)象a的鎖");
- synchronized (a) {
- System.out.println(Thread.currentThread().getName() + "占有了對(duì)象a的鎖");
- }
- }
- }, "Thread 2").start();
- return "success";
- }
- }
輸出如下:

如果不施加干預(yù),兩個(gè)線程將會(huì)一直僵持著。
這個(gè)只是一個(gè)簡(jiǎn)單的死鎖場(chǎng)景,如果線上發(fā)生這樣的情況,該去如何定位呢?
我們把死鎖代碼放進(jìn)一個(gè)簡(jiǎn)單的SpringBoot中
使用mvn install打包后,將打好的jar包放進(jìn)我們實(shí)驗(yàn)的機(jī)器中,我的項(xiàng)目名稱就叫做dl
使用nohup java -jar dl-0.0.1-SNAPSHOT.jar & 部署運(yùn)行
使用curl http:port/test調(diào)用接口,不出意外的話,現(xiàn)在程序發(fā)生了死鎖。
首先獲取到該java應(yīng)用的進(jìn)程,ps -ef | grep dl | grep -v grep,獲取到pid為12156
接著打印出該進(jìn)程下線程的狀態(tài),并輸出到dl.txt中,jstack 12156 > dl.txt
jstack可以用來生成虛擬機(jī)當(dāng)前的線程快照,快速定位多線程使用不當(dāng)引發(fā)的問題。
在該txt文件的末尾,我們可以看到以下的內(nèi)容:
- Found one Java-level deadlock:
- =============================
- "Thread 2":
- waiting to lock monitor 0x00007f9ea8006008 (object 0x00000000e367d550, a java.lang.Object),
- which is held by "Thread 1"
- "Thread 1":
- waiting to lock monitor 0x00007f9ea8003f08 (object 0x00000000e367d560, a java.lang.Object),
- which is held by "Thread 2"
- Java stack information for the threads listed above:
- ===================================================
- "Thread 2":
- at com.example.dl.Controller.lambda$testDeadLock$1(Controller.java:40)
- - waiting to lock <0x00000000e367d550> (a java.lang.Object)
- - locked <0x00000000e367d560> (a java.lang.Object)
- at com.example.dl.Controller$$Lambda$469/1627217364.run(Unknown Source)
- at java.lang.Thread.run(Thread.java:748)
- "Thread 1":
- at com.example.dl.Controller.lambda$testDeadLock$0(Controller.java:25)
- - waiting to lock <0x00000000e367d560> (a java.lang.Object)
- - locked <0x00000000e367d550> (a java.lang.Object)
- at com.example.dl.Controller$$Lambda$468/117875601.run(Unknown Source)
- at java.lang.Thread.run(Thread.java:748)
- Found 1 deadlock.
可以清晰地看到,Thread 2請(qǐng)求一把被Thread 1占有的鎖,而Thread 1請(qǐng)求一把被Thread 2占有的鎖,這樣就構(gòu)成了死鎖。
當(dāng)然,這個(gè)場(chǎng)景非常的簡(jiǎn)單,但是線上環(huán)境錯(cuò)綜復(fù)雜,在接口響應(yīng)越來越慢、cpu負(fù)載越來越高的時(shí)候,可以使用jstack命令,查看java進(jìn)程內(nèi)線程的狀態(tài),看是否有死循環(huán)、死鎖等。
然后根據(jù)具體情況具體分析,比方說按照順序獲得對(duì)象的鎖,只能是從a到b的順序,線程1獲取a對(duì)象的鎖后,嘗試去獲取b對(duì)象的鎖時(shí),線程2想要直接獲取b對(duì)象的鎖,則首先要獲取對(duì)象a的鎖,從而被線程1阻塞,等到線程1運(yùn)行結(jié)束,釋放所有的鎖后,線程2才可以繼續(xù)運(yùn)行。
或者說超時(shí)直接放棄,換synchronized為ReentranLock,使用其帶有時(shí)間的tryLock方法,一定時(shí)間內(nèi)獲取不到鎖,直接放棄本次對(duì)鎖的申請(qǐng)。