線上CPU飚高(死循環(huán),死鎖...)?幫你迅速定位代碼位置
top基本使用
top 命令運(yùn)行圖:
***行:基本信息
第二行:任務(wù)信息
第三行:CPU使用情況
第四行:物理內(nèi)存使用情況
buff/cache:
buffers 和 cache 都是內(nèi)存中存放的數(shù)據(jù),不同的是,buffers 存放的是準(zhǔn)備寫入磁盤的數(shù)據(jù),而 cache 存放的是從磁盤中讀取的數(shù)據(jù)
在Linux系統(tǒng)中,有一個(gè)守護(hù)進(jìn)程(daemon)會(huì)定期把buffers中的數(shù)據(jù)寫入的磁盤,也可以使用 sync 命令手動(dòng)把buffers中的數(shù)據(jù)寫入磁盤。使用buffers可以把分散的 I/O 操作集中起來,減少了磁盤尋道的時(shí)間和磁盤碎片。
cache是Linux把讀取頻率高的數(shù)據(jù),放到內(nèi)存中,減少I/O。Linux中cache沒有固定大小,根據(jù)使用情況自動(dòng)增加或刪除。
第五行:交換區(qū)使用情況
Swap(內(nèi)存交換區(qū)):
是硬盤上的一塊空間。在內(nèi)存不足的情況下,操作系統(tǒng)把內(nèi)存中不用的數(shù)據(jù)存到硬盤的交換區(qū),騰出內(nèi)存來讓別的程序運(yùn)行。因此,開啟swap會(huì)一定程度的引起 I/O 性能下降(阿里服務(wù)器默認(rèn)不開)
第六行:進(jìn)程詳細(xì)信息
死循環(huán)
構(gòu)造的代碼如下:
- @RestController
- @RequestMapping("top")
- public class ShowTopController {
- private Object lock1 = new Object();
- private Object lock2 = new Object();
- @RequestMapping("test")
- public String test() {
- return "success";
- }
- @RequestMapping("loop")
- public String loop() {
- System.out.println("start");
- while (true) {}
- }
- @RequestMapping("deadlock")
- public String deadlock() {
- new Thread(() -> {
- synchronized (lock1) {
- try{
- TimeUnit.SECONDS.sleep(1);
- } catch (Exception e) {}
- synchronized (lock2) {
- System.out.println("thread1 over");
- }
- }
- }).start();
- new Thread(() -> {
- synchronized (lock2) {
- try{
- TimeUnit.SECONDS.sleep(1);
- } catch (Exception e) {}
- synchronized (lock1) {
- System.out.println("thread2 over");
- }
- }
- }).start();
- return "success";
- }
- }
這里只介紹一下用到的top參數(shù)
先手動(dòng)制造CPU飆高的場(chǎng)景,多執(zhí)行幾次,小編這里執(zhí)行3次
- curl localhost:8080/top/loop
執(zhí)行top
jstack命令工具可以得到線程堆棧信息,根據(jù)這些線程堆棧信息,我們可以去檢查Java程序出現(xiàn)的問題
看到pid為23757的進(jìn)程CPU占用較高,執(zhí)行如下命令
- jstack 23757 > loop.txt
看看pid為23757的進(jìn)程中線程的具體情況
- top -p 23757 -H
當(dāng)然你也可以使用交互命令
- top -p 23757
然后再輸入H,效果和上面一樣
可以看到PID為23772,23773和23774的線程占用CPU較高
這里可能有人有疑惑,為什么線程也有PID啊?其實(shí)線程進(jìn)程都會(huì)有自己的ID,這個(gè)ID就叫做PID,PID是不特指進(jìn)程ID,線程ID也可以叫做PID
將10進(jìn)制的23772轉(zhuǎn)為16進(jìn)制,因?yàn)閖stack中PID用的是16進(jìn)制
- printf "%x" 23772
- 輸出5cdc
打開loop.txt文件,搜5cdc
可以看到線程一直在執(zhí)行ShowTopController中的第23行,即
- while (true) {}
好了定位到代碼中的位置了,當(dāng)然生產(chǎn)環(huán)境中肯定不會(huì)寫一個(gè)死循環(huán)的,有可能在特殊場(chǎng)景下出現(xiàn)死循環(huán),或執(zhí)行一個(gè)方法特別慢,用這種方法很快就能找到代碼位置。
死鎖
接著訪問
- curl localhost:8080/top/loop
執(zhí)行
- jstack 23757 > loop.txt
打開loop.txt文件到***

看到發(fā)現(xiàn)一個(gè)死鎖,死鎖代碼的位置描述的很清楚,生產(chǎn)環(huán)境發(fā)生的死鎖當(dāng)然沒有這么簡(jiǎn)單,所有學(xué)會(huì)用這些命令排查還是很有必要的
本文轉(zhuǎn)載自微信公眾號(hào)「 Java識(shí)堂」,轉(zhuǎn)載本文請(qǐng)聯(lián)系Java識(shí)堂公眾號(hào)。