如何快速分析軟件運(yùn)行瓶頸在哪里?推薦Linux下的一個(gè)強(qiáng)大命令工具
Linux被廣泛用于服務(wù)器系統(tǒng),很多線上服務(wù)在上線前要做壓力測(cè)試,對(duì)發(fā)現(xiàn)的性能問(wèn)題要進(jìn)一步排查和開(kāi)發(fā)優(yōu)化性能。
比如通過(guò) top 、iostat 等命令找到了引起資源異常的進(jìn)程后,就要進(jìn)一步對(duì)該進(jìn)程/線程的內(nèi)存占用、文件系統(tǒng)IO系統(tǒng)調(diào)用次數(shù)、Socket和網(wǎng)絡(luò)通訊阻塞問(wèn)題等做跟蹤分析。由于此時(shí)往往更希望接近真實(shí)場(chǎng)景的運(yùn)行方式,所以除了采用代碼斷點(diǎn)調(diào)試的方式外,最保真、最快速跟蹤到實(shí)際環(huán)境問(wèn)題根源的就是用Linux系統(tǒng)自帶的strace軟件啟動(dòng)問(wèn)題軟件,獲得直接的數(shù)據(jù)實(shí)現(xiàn),故障分析、性能分析。
這是一款Linux下瑞士軍刀級(jí)別的工具,開(kāi)發(fā)者、運(yùn)維人員如果不熟悉,那么非常有必要繼續(xù)往下看。學(xué)會(huì)后可以事半功倍地解決工作中遇到的各類(lèi)軟件開(kāi)發(fā)和軟件運(yùn)維問(wèn)題。
統(tǒng)計(jì)異常系統(tǒng)調(diào)用耗時(shí)、系統(tǒng)調(diào)用次數(shù)過(guò)多的情況:使用strace跟蹤vs code 這個(gè)代碼編輯器的運(yùn)行(軟件文件路徑為 /usr/bin/code )為例:
sudo strace -o strace.log -T -S time -k -O1ns -C -v /usr/bin/code --no-sandbox --user-data-dir /root/data
除了輸出啟動(dòng)過(guò)程從哪些目錄,加載了什么動(dòng)態(tài)庫(kù),用到了什么系統(tǒng)調(diào)用(系統(tǒng)接口函數(shù)),函數(shù)調(diào)用返回值,入?yún)⒅档榷加写蛴?。由于上面參?shù)中使用了-C也就是要求打印匯總報(bào)告,所以在最后會(huì)列出vs code啟動(dòng)過(guò)程中涉及到多少系統(tǒng)調(diào)用、每個(gè)系統(tǒng)調(diào)用的時(shí)間百分比、時(shí)間總計(jì)、調(diào)用次數(shù)、錯(cuò)誤次數(shù)、系統(tǒng)調(diào)用的函數(shù)名。
并在最后一行列出匯總值。
假如我們的業(yè)務(wù)代碼中有個(gè)功能存在bug,過(guò)多調(diào)用了系統(tǒng)調(diào)用(次數(shù)維度),或者傳入的參數(shù)不科學(xué)導(dǎo)致系統(tǒng)調(diào)用執(zhí)行時(shí)間過(guò)長(zhǎng)(時(shí)間維度),那么,通過(guò)strace 的報(bào)告我們可以馬上觀察到線索。再翻看 strace 的 -o strace.log 逐個(gè)系統(tǒng)調(diào)用跟蹤的日志記錄文件,就可以具體排查以下多方面:
- 加載的動(dòng)態(tài)庫(kù)是否正確
- 運(yùn)行時(shí)的環(huán)境變量是否正確
- 調(diào)用的系統(tǒng)調(diào)用接口是否符合業(yè)務(wù)代碼邏輯順序
- 系統(tǒng)調(diào)用入?yún)?、返回值是否符合預(yù)期
- 系統(tǒng)調(diào)用發(fā)生的次數(shù)是否正常
- 每個(gè)系統(tǒng)調(diào)用的持續(xù)時(shí)間是否合理
- 打開(kāi)的文件是否正常?是否使用了缺失的路徑?
最后總結(jié)下:
sudo strace -o strace.log -T -S time -k -O1ns -C -v /usr/bin/code --no-sandbox --user-data-dir /root/data
這個(gè)示例命令中參數(shù)的意思:
- -o strace.log 將跟蹤記錄保存到文件 strace.log
- -T 統(tǒng)計(jì)時(shí)間
- -S 按時(shí)間排序
- -k 打印調(diào)用棧
- -O1ns 以1納秒為單位統(tǒng)計(jì)時(shí)間(實(shí)際由于CPU和系統(tǒng)支持程度的差別,可能無(wú)法統(tǒng)計(jì)到納秒精度)
- -v 盡量詳細(xì)輸出信息
- /usr/bin/code --no-sandbox --user-data-dir /root/data 為vscode 的root用戶模式啟動(dòng)命令+參數(shù)