面向.Net程序員的dump分析
背景
Dump文件是進程的內(nèi)存鏡像??梢园殉绦虻膱?zhí)行狀態(tài)通過調(diào)試器保存到dump文件中。在 Windows 系統(tǒng)上, dump 文件分為內(nèi)核 dump 和用戶態(tài) dump 兩種。前者一般用來分析內(nèi)核相關(guān)的問題,比如驅(qū)動程序;后者一般用來分析用戶態(tài)程序的問題。
一般的程序員可能接觸不到dump文件,反而是運維會用的多一些。不過如果你抗戰(zhàn)在***線,學會dump的分析無疑是掌握一柄利器。因為很多場景下,在線下的單元測試或者性能測試中由于測試用例的不充分或者生產(chǎn)與測試環(huán)境的硬件以及pv量級的不同等等情況導致問題暴露不出,而在生產(chǎn)環(huán)境中又沒有足夠的日志或者堆棧信息來指向問題產(chǎn)生的原因。這個時候dump文件的分析就顯得很有作用。
正文分3節(jié) 抓取dump以及dump的手動和自動分析。對于初學者自動分析dump是很方便的一種渠道。
一. 抓取dump
1. 最簡單的方法 通過任務(wù)管理器
2. 通過debugdiag
debugdiag是一個微軟提供的dump抓取和分析工具。可以建立各種規(guī)則在不同的條件下抓取dump,同時具有強大的dump分析功能。
下載地址:http://www.microsoft.com/en-us/download/details.aspx?id=26798
3. Adplus方式
運行 cmd ,進入 adplus.exe 文件所在目錄,運行如下命令:
單個進程: adplus .exe – hang – p <PID> – o d: ¥
多個進程: adplus .exe – hang – p <PID1> -p <PID2> – o d: ¥
Mini Dump : adplus .exe - MiniOnSecond – hang – p <PID> – o d: ¥
抓取方式的選擇:
任務(wù)管理器的抓取適合dump文件不大,對應(yīng)系統(tǒng)盤默認存放路徑的空間完全足夠的情況。
debugdiag的抓取可以適應(yīng)多種情況,通過工具的配置來完成。
Adplus解決了任務(wù)管理器抓取方式的限制,可以處理對應(yīng)多個進程大文件的情況。
#p#
二. dump的手動分析
工具: winbdg
WinDBG不是專門用于調(diào)試.Net程序的工具,它更偏向于底層,可用于內(nèi)核和驅(qū)動調(diào)試。進行普通的.Net程序調(diào)試還是使用微軟專為.Net開發(fā)的調(diào)試工具MDBG更方便一些。但是WinDBG能看到更多的底層信息,對于某些特別疑難的問題調(diào)試有所幫助,例如內(nèi)存泄漏等問題。
測試代碼下載 : MyDumpTest.7z
首先添加設(shè)定符號文件路徑(Symbol Path),當你使用Visual Studio編譯程序時,是否有留意到在bin/Debug文件夾下會有.pdb后綴的文件?這些文件包含有dll程序集的調(diào)試符號,pdb文件并不包含有執(zhí)行代碼,只是使調(diào)試工具能把代碼執(zhí)行指令翻譯為正確的可識別字符。微軟提供了包含大量pdb文件的公共服務(wù)器,地址如下:http://msdl.microsoft.com/download/symbols。打開windbg程序,選擇“File->Symbol File Path…“,把下面的內(nèi)容復制進去保存。srv*d:\debug\symbols*http://msdl.microsoft.com/download/symbols。
下面這行命令 如果你發(fā)現(xiàn)出現(xiàn)Unable to verify checksum...或者的消息 那是因為你沒有添加.net的sos擴展或者sos的版本沒有對應(yīng)上。.Net1.1時代的SOS擴展已經(jīng)自帶于下載安裝的WinDBG中,從.Net2.0以后,SOS擴展已經(jīng)自帶到.Net框架中:C:\WINDOWS\Microsoft.NET\Framework\v2.0.50727\SOS.dll,為了不至于引起混淆,***的方法就是使用前面的loadby調(diào)試器元命令來讓WinDBG自己決定加載什么版本的SOS。
添加sos:.load C:\WINDOWS\Microsoft.NET\Framework\v4.0.30319\sos.dll。
加載SOS后,使用命令.chain來查看調(diào)試鏈中是否已經(jīng)成功包含SOS擴展。
通過!eeversion查看sos的版本號。
實戰(zhàn)命令: ~ 查看線程
這表明當前dump里記錄的線程數(shù)。如果要切換線程,用波浪線+序號+s來切換,如切換到線程2,那么用~2s即可。
lm 查看你加載的模塊
kb 查看native code調(diào)用棧
用~現(xiàn)在只有線程信息,對于每個線程,在被抓的那一刻,在執(zhí)行什么,我們有命令:kb。
看到clr大家應(yīng)該很眼熟吧。這里已經(jīng)可以看到較詳細的調(diào)試信息了。
!runaway (查看線程對應(yīng) CPU 運行時間)
因為我們的測試程序是測試的是線程阻塞所以我們選一個運行時間為0的,例如415
!dso 查看這個堆棧中的對象
!clrstack 查看這個線程的托管代碼調(diào)用棧
通過上面我們已經(jīng)可以看出這個線程一直都是處于阻塞狀態(tài)。
到這里基本上一個小的測試程序可以告一段落了,當然windbg的功能遠遠不止如此,這里分享一些資源給大家。
資源下載 : WinDbg入門.rar Windbg用法詳解.7z
#p#
三. dump的自動分析
1. debugdiag
這里有幾種規(guī)則類型的選擇,一般我們常用的用crash來查看鎖和堵塞的情況,performance來檢查性能的問題。
選擇完成后直接點擊開始分析
生成報表
查看描述
點擊詳細
這樣,紅色字體就是問題的所在。然后根據(jù)具體問題下發(fā)到對應(yīng)開發(fā)部門解決。
2. Hang自動化分析
在WinDbg輸入如下命令
.shell -ci "~* kb;.echo MANAGED THREADS;!threads;.echo MANAGED CALLSTACKS;~* e !clrstack;" D:\xx.exe
本篇先到此 希望對大家有幫助