自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

Linux調(diào)試器的工作原理(一):基礎(chǔ)篇

系統(tǒng) Linux
這是調(diào)試器工作原理系列文章的第一篇,我不確定這個(gè)系列會有多少篇文章,會涉及多少話題,但我仍會從這篇基礎(chǔ)開始。

[[189018]]

這是調(diào)試器工作原理系列文章的第一篇,我不確定這個(gè)系列會有多少篇文章,會涉及多少話題,但我仍會從這篇基礎(chǔ)開始。

這一篇會講什么

我將為大家展示 Linux 中調(diào)試器的主要構(gòu)成模塊 - ptrace 系統(tǒng)調(diào)用。這篇文章所有代碼都是基于 32 位 Ubuntu 操作系統(tǒng)。值得注意的是,盡管這些代碼是平臺相關(guān)的,將它們移植到其它平臺應(yīng)該并不困難。

緣由

為了理解我們要做什么,讓我們先考慮下調(diào)試器為了完成調(diào)試都需要什么資源。調(diào)試器可以開始一個(gè)進(jìn)程并調(diào)試這個(gè)進(jìn)程,又或者將自己同某個(gè)已經(jīng)存在的進(jìn)程關(guān)聯(lián)起來。調(diào)試器能夠單步執(zhí)行代碼,設(shè)定斷點(diǎn)并且將程序執(zhí)行到斷點(diǎn),檢查變量的值并追蹤堆棧。許多調(diào)試器有著更高級的特性,例如在調(diào)試器的地址空間內(nèi)執(zhí)行表達(dá)式或者調(diào)用函數(shù),甚至可以在進(jìn)程執(zhí)行過程中改變代碼并觀察效果。

盡管現(xiàn)代的調(diào)試器都十分的復(fù)雜(我沒有檢查,但我確信 gdb 的代碼行數(shù)至少有六位數(shù)),但它們的工作的原理卻是十分的簡單。調(diào)試器的基礎(chǔ)是操作系統(tǒng)與編譯器 / 鏈接器提供的一些基礎(chǔ)服務(wù),其余的部分只是簡單的編程而已。

Linux 的調(diào)試 - ptrace

Linux 調(diào)試器中的瑞士軍刀便是 ptrace 系統(tǒng)調(diào)用(使用 man 2 ptrace 命令可以了解更多)。這是一種復(fù)雜卻強(qiáng)大的工具,可以允許一個(gè)進(jìn)程控制另外一個(gè)進(jìn)程并從內(nèi)部替換Peek and poke被控制進(jìn)程的內(nèi)核鏡像的值(Peek and poke 在系統(tǒng)編程中是很知名的叫法,指的是直接讀寫內(nèi)存內(nèi)容)。

接下來會深入分析。

執(zhí)行進(jìn)程的代碼

我將編寫一個(gè)示例,實(shí)現(xiàn)一個(gè)在“跟蹤”模式下運(yùn)行的進(jìn)程。在這個(gè)模式下,我們將單步執(zhí)行進(jìn)程的代碼,就像機(jī)器碼(匯編代碼)被 CPU 執(zhí)行時(shí)一樣。我將分段展示、講解示例代碼,在文章的末尾也有完整 c 文件的下載鏈接,你可以編譯、執(zhí)行或者隨心所欲的更改。

更進(jìn)一步的計(jì)劃是實(shí)現(xiàn)一段代碼,這段代碼可以創(chuàng)建可執(zhí)行用戶自定義命令的子進(jìn)程,同時(shí)父進(jìn)程可以跟蹤子進(jìn)程。首先是主函數(shù):

  1. int main(int argc, char** argv) 
  2.     pid_t child_pid; 
  3.     if (argc < 2) { 
  4.         fprintf(stderr, "Expected a program name as argument\n"); 
  5.         return -1; 
  6.     } 
  7.     child_pid = fork(); 
  8.     if (child_pid == 0) 
  9.         run_target(argv[1]); 
  10.     else if (child_pid > 0) 
  11.         run_debugger(child_pid); 
  12.     else { 
  13.         perror("fork"); 
  14.         return -1; 
  15.     } 
  16.     return 0; 

看起來相當(dāng)?shù)暮唵危何覀冇?fork 創(chuàng)建了一個(gè)新的子進(jìn)程(這篇文章假定讀者有一定的 Unix/Linux 編程經(jīng)驗(yàn)。我假定你知道或至少了解 fork、exec 族函數(shù)與 Unix 信號)。if 語句的分支執(zhí)行子進(jìn)程(這里稱之為 “target”),else if 的分支執(zhí)行父進(jìn)程(這里稱之為 “debugger”)。

下面是 target 進(jìn)程的代碼:

  1. void run_target(const char* programname) 
  2.     procmsg("target started. will run '%s'\n", programname); 
  3.     /* Allow tracing of this process */ 
  4.     if (ptrace(PTRACE_TRACEME, 0, 0, 0) < 0) { 
  5.         perror("ptrace"); 
  6.         return
  7.     } 
  8.     /* Replace this process's image with the given program */ 
  9.     execl(programname, programname, 0); 

這段代碼中最值得注意的是 ptrace 調(diào)用。在 sys/ptrace.h 中,ptrace 是如下定義的:

  1. long ptrace(enum __ptrace_request request, pid_t pid, 
  2.                  void *addr, void *data); 

第一個(gè)參數(shù)是 _request_,這是許多預(yù)定義的 PTRACE_* 常量中的一個(gè)。第二個(gè)參數(shù)為請求分配進(jìn)程 ID。第三個(gè)與第四個(gè)參數(shù)是地址與數(shù)據(jù)指針,用于操作內(nèi)存。上面代碼段中的 ptrace 調(diào)用發(fā)起了 PTRACE_TRACEME 請求,這意味著該子進(jìn)程請求系統(tǒng)內(nèi)核讓其父進(jìn)程跟蹤自己。幫助頁面上對于 request 的描述很清楚:

意味著該進(jìn)程被其父進(jìn)程跟蹤。任何傳遞給該進(jìn)程的信號(除了 SIGKILL)都將通過 wait() 方法阻塞該進(jìn)程并通知其父進(jìn)程。此外,該進(jìn)程的之后所有調(diào)用 exec() 動作都將導(dǎo)致 SIGTRAP 信號發(fā)送到此進(jìn)程上,使得父進(jìn)程在新的程序執(zhí)行前得到取得控制權(quán)的機(jī)會。如果一個(gè)進(jìn)程并不需要它的的父進(jìn)程跟蹤它,那么這個(gè)進(jìn)程不應(yīng)該發(fā)送這個(gè)請求。(pid、addr 與 data 暫且不提)

我高亮了這個(gè)例子中我們需要注意的部分。在 ptrace 調(diào)用后,run_target 接下來要做的就是通過 execl 傳參并調(diào)用。如同高亮部分所說明,這將導(dǎo)致系統(tǒng)內(nèi)核在 execl 創(chuàng)建進(jìn)程前暫時(shí)停止,并向父進(jìn)程發(fā)送信號。

是時(shí)候看看父進(jìn)程做什么了。

  1. void run_debugger(pid_t child_pid) 
  2.     int wait_status; 
  3.     unsigned icounter = 0; 
  4.     procmsg("debugger started\n"); 
  5.     /* Wait for child to stop on its first instruction */ 
  6.     wait(&wait_status); 
  7.     while (WIFSTOPPED(wait_status)) { 
  8.         icounter++; 
  9.         /* Make the child execute another instruction */ 
  10.         if (ptrace(PTRACE_SINGLESTEP, child_pid, 0, 0) < 0) { 
  11.             perror("ptrace"); 
  12.             return
  13.         } 
  14.         /* Wait for child to stop on its next instruction */ 
  15.         wait(&wait_status); 
  16.     } 
  17.     procmsg("the child executed %u instructions\n", icounter); 

如前文所述,一旦子進(jìn)程調(diào)用了 exec,子進(jìn)程會停止并被發(fā)送 SIGTRAP 信號。父進(jìn)程會等待該過程的發(fā)生并在第一個(gè) wait() 處等待。一旦上述事件發(fā)生了,wait() 便會返回,由于子進(jìn)程停止了父進(jìn)程便會收到信號(如果子進(jìn)程由于信號的發(fā)送停止了,WIFSTOPPED 就會返回 true)。

父進(jìn)程接下來的動作就是整篇文章最需要關(guān)注的部分了。父進(jìn)程會將 PTRACE_SINGLESTEP 與子進(jìn)程 ID 作為參數(shù)調(diào)用 ptrace 方法。這就會告訴操作系統(tǒng),“請恢復(fù)子進(jìn)程,但在它執(zhí)行下一條指令前阻塞”。周而復(fù)始地,父進(jìn)程等待子進(jìn)程阻塞,循環(huán)繼續(xù)。當(dāng) wait() 中傳出的信號不再是子進(jìn)程的停止信號時(shí),循環(huán)終止。在跟蹤器(父進(jìn)程)運(yùn)行期間,這將會是被跟蹤進(jìn)程(子進(jìn)程)傳遞給跟蹤器的終止信號(如果子進(jìn)程終止 WIFEXITED 將返回 true)。

icounter 存儲了子進(jìn)程執(zhí)行指令的次數(shù)。這么看來我們小小的例子也完成了些有用的事情 - 在命令行中指定程序,它將執(zhí)行該程序并記錄它從開始到結(jié)束所需要的 cpu 指令數(shù)量。接下來就讓我們這么做吧。

測試

我編譯了下面這個(gè)簡單的程序并利用跟蹤器運(yùn)行它:

  1. #include <stdio.h> 
  2. int main() 
  3.     printf("Hello, world!\n"); 
  4.     return 0; 

令我驚訝的是,跟蹤器花了相當(dāng)長的時(shí)間,并報(bào)告整個(gè)執(zhí)行過程共有超過 100,000 條指令執(zhí)行。僅僅是一條輸出語句?什么造成了這種情況?答案很有趣(至少你同我一樣癡迷與機(jī)器/匯編語言)。Linux 的 gcc 默認(rèn)會動態(tài)的將程序與 c 的運(yùn)行時(shí)庫動態(tài)地鏈接。這就意味著任何程序運(yùn)行前的第一件事是需要動態(tài)庫加載器去查找程序運(yùn)行所需要的共享庫。這些代碼的數(shù)量很大 - 別忘了我們的跟蹤器要跟蹤每一條指令,不僅僅是主函數(shù)的,而是“整個(gè)進(jìn)程中的指令”。

所以當(dāng)我將測試程序使用靜態(tài)編譯時(shí)(通過比較,可執(zhí)行文件會多出 500 KB 左右的大小,這部分是 C 運(yùn)行時(shí)庫的靜態(tài)鏈接),跟蹤器提示只有大概 7000 條指令被執(zhí)行。這個(gè)數(shù)目仍然不小,但是考慮到在主函數(shù)執(zhí)行前 libc 的初始化以及主函數(shù)執(zhí)行后的清除代碼,這個(gè)數(shù)目已經(jīng)是相當(dāng)不錯(cuò)了。此外,printf 也是一個(gè)復(fù)雜的函數(shù)。

仍然不滿意的話,我需要的是“可以測試”的東西 - 例如可以完整記錄每一個(gè)指令運(yùn)行的程序執(zhí)行過程。這當(dāng)然可以通過匯編代碼完成。所以我找到了這個(gè)版本的 “Hello, world!” 并編譯了它。

  1. section    .text 
  2.     ; The _start symbol must be declared for the linker (ld) 
  3.     global _start 
  4. _start: 
  5.     ; Prepare arguments for the sys_write system call: 
  6.     ;   - eax: system call number (sys_write) 
  7.     ;   - ebx: file descriptor (stdout) 
  8.     ;   - ecx: pointer to string 
  9.     ;   - edx: string length 
  10.     mov    edx, len 
  11.     mov    ecx, msg 
  12.     mov    ebx, 1 
  13.     mov    eax, 4 
  14.     ; Execute the sys_write system call 
  15.     int    0x80 
  16.     ; Execute sys_exit 
  17.     mov    eax, 1 
  18.     int    0x80 
  19. section   .data 
  20. msg db    'Hello, world!', 0xa 
  21. len equ    $ - msg 

當(dāng)然,現(xiàn)在跟蹤器提示 7 條指令被執(zhí)行了,這樣一來很容易區(qū)分它們。

深入指令流

上面那個(gè)匯編語言編寫的程序使得我可以向你介紹 ptrace 的另外一個(gè)強(qiáng)大的用途 - 詳細(xì)顯示被跟蹤進(jìn)程的狀態(tài)。下面是 run_debugger 函數(shù)的另一個(gè)版本:

  1. void run_debugger(pid_t child_pid) 
  2.     int wait_status; 
  3.     unsigned icounter = 0; 
  4.     procmsg("debugger started\n"); 
  5.     /* Wait for child to stop on its first instruction */ 
  6.     wait(&wait_status); 
  7.     while (WIFSTOPPED(wait_status)) { 
  8.         icounter++; 
  9.         struct user_regs_struct regs; 
  10.         ptrace(PTRACE_GETREGS, child_pid, 0, &regs); 
  11.         unsigned instr = ptrace(PTRACE_PEEKTEXT, child_pid, regs.eip, 0); 
  12.         procmsg("icounter = %u.  EIP = 0x%08x.  instr = 0x%08x\n"
  13.                     icounter, regs.eip, instr); 
  14.         /* Make the child execute another instruction */ 
  15.         if (ptrace(PTRACE_SINGLESTEP, child_pid, 0, 0) < 0) { 
  16.             perror("ptrace"); 
  17.             return
  18.         } 
  19.         /* Wait for child to stop on its next instruction */ 
  20.         wait(&wait_status); 
  21.     } 
  22.     procmsg("the child executed %u instructions\n", icounter); 

不同僅僅存在于 while 循環(huán)的開始幾行。這個(gè)版本里增加了兩個(gè)新的 ptrace 調(diào)用。第一條將進(jìn)程的寄存器值讀取進(jìn)了一個(gè)結(jié)構(gòu)體中。 sys/user.h 定義有 user_regs_struct。如果你查看頭文件,頭部的注釋這么寫到:

  1. /* 這個(gè)文件只為了 GDB 而創(chuàng)建 
  2.    不用詳細(xì)的閱讀.如果你不知道你在干嘛, 
  3.    不要在除了 GDB 以外的任何地方使用此文件  */ 

不知道你做何感想,但這讓我覺得我們找對地方了。回到例子中,一旦我們在 regs 變量中取得了寄存器的值,我們就可以通過將 PTRACE_PEEKTEXT 作為參數(shù)、 regs.eip(x86 上的擴(kuò)展指令指針)作為地址,調(diào)用 ptrace ,讀取當(dāng)前進(jìn)程的當(dāng)前指令(警告:如同我上面所說,文章很大程度上是平臺相關(guān)的。我簡化了一些設(shè)定 - 例如,x86 指令集不需要調(diào)整到 4 字節(jié),我的32位 Ubuntu unsigned int 是 4 字節(jié)。事實(shí)上,許多平臺都不需要。從內(nèi)存中讀取指令需要預(yù)先安裝完整的反匯編器。我們這里沒有,但實(shí)際的調(diào)試器是有的)。下面是新跟蹤器所展示出的調(diào)試效果:

  1. $ simple_tracer traced_helloworld 
  2. [5700] debugger started 
  3. [5701] target started. will run 'traced_helloworld' 
  4. [5700] icounter = 1\.  EIP = 0x08048080\.  instr = 0x00000eba 
  5. [5700] icounter = 2\.  EIP = 0x08048085\.  instr = 0x0490a0b9 
  6. [5700] icounter = 3\.  EIP = 0x0804808a.  instr = 0x000001bb 
  7. [5700] icounter = 4\.  EIP = 0x0804808f.  instr = 0x000004b8 
  8. [5700] icounter = 5\.  EIP = 0x08048094\.  instr = 0x01b880cd 
  9. Hello, world! 
  10. [5700] icounter = 6\.  EIP = 0x08048096\.  instr = 0x000001b8 
  11. [5700] icounter = 7\.  EIP = 0x0804809b.  instr = 0x000080cd 
  12. [5700] the child executed 7 instructions 

現(xiàn)在,除了 icounter,我們也可以觀察到指令指針與它每一步所指向的指令。怎么來判斷這個(gè)結(jié)果對不對呢?使用 objdump -d 處理可執(zhí)行文件:

  1. $ objdump -d traced_helloworld 
  2. traced_helloworld:     file format elf32-i386 
  3. Disassembly of section .text: 
  4. 08048080 <.text>: 
  5.  8048080:     ba 0e 00 00 00          mov    $0xe,%edx 
  6.  8048085:     b9 a0 90 04 08          mov    $0x80490a0,%ecx 
  7.  804808a:     bb 01 00 00 00          mov    $0x1,%ebx 
  8.  804808f:     b8 04 00 00 00          mov    $0x4,%eax 
  9.  8048094:     cd 80                   int    $0x80 
  10.  8048096:     b8 01 00 00 00          mov    $0x1,%eax 
  11.  804809b:     cd 80                   int    $0x80 

這個(gè)結(jié)果和我們跟蹤器的結(jié)果就很容易比較了。

將跟蹤器關(guān)聯(lián)到正在運(yùn)行的進(jìn)程

如你所知,調(diào)試器也能關(guān)聯(lián)到已經(jīng)運(yùn)行的進(jìn)程?,F(xiàn)在你應(yīng)該不會驚訝,ptrace 通過以 PTRACE_ATTACH 為參數(shù)調(diào)用也可以完成這個(gè)過程。這里我不會展示示例代碼,通過上文的示例代碼應(yīng)該很容易實(shí)現(xiàn)這個(gè)過程。出于學(xué)習(xí)目的,這里使用的方法更簡便(因?yàn)槲覀冊谧舆M(jìn)程剛開始就可以讓它停止)。

代碼

上文中的簡單的跟蹤器(更高級的,可以打印指令的版本)的完整c源代碼可以在這里找到。它是通過 4.4 版本的 gcc 以 -Wall -pedantic --std=c99 編譯的。

結(jié)論與計(jì)劃

誠然,這篇文章并沒有涉及很多內(nèi)容 - 我們距離親手完成一個(gè)實(shí)際的調(diào)試器還有很長的路要走。但我希望這篇文章至少可以使得調(diào)試這件事少一些神秘感。ptrace 是功能多樣的系統(tǒng)調(diào)用,我們目前只展示了其中的一小部分。

單步調(diào)試代碼很有用,但也只是在一定程度上有用。上面我通過 C 的 “Hello World!” 做了示例。為了執(zhí)行主函數(shù),可能需要上萬行代碼來初始化 C 的運(yùn)行環(huán)境。這并不是很方便。最理想的是在 main 函數(shù)入口處放置斷點(diǎn)并從斷點(diǎn)處開始分步執(zhí)行。為此,在這個(gè)系列的下一篇,我打算展示怎么實(shí)現(xiàn)斷點(diǎn)。

參考

撰寫此文時(shí)參考了如下文章:

責(zé)任編輯:龐桂玉 來源: Linux中國
相關(guān)推薦

2017-06-22 10:44:55

Linux調(diào)試器準(zhǔn)備環(huán)境

2017-06-28 14:21:22

Linux調(diào)試器斷點(diǎn)

2017-10-09 10:56:49

Linux調(diào)試器處理變量

2017-10-12 18:20:44

Linux調(diào)試器高級主題

2017-10-09 10:26:01

Linux調(diào)試器堆棧展開

2016-09-27 20:12:33

Android虛擬機(jī)Android動態(tài)調(diào)試

2017-07-25 10:30:32

Linux調(diào)試器Elves和dwarv

2017-09-25 08:04:31

Linux調(diào)試器源碼級斷點(diǎn)

2017-08-28 14:40:57

Linux調(diào)試器源碼和信號

2010-03-01 11:06:52

Python 調(diào)試器

2017-07-05 14:37:07

Linux調(diào)試器寄存器和內(nèi)存

2020-03-16 10:05:13

EmacsGUDLinux

2023-02-28 11:39:55

CMake腳本項(xiàng)目

2009-06-23 11:05:05

Mircosoft C

2017-08-28 15:29:19

Linux調(diào)試器源碼級逐步執(zhí)行

2009-12-14 10:57:34

Ruby調(diào)試器

2011-08-31 16:51:12

Lua調(diào)試器

2011-08-31 16:47:07

Lua調(diào)試器

2010-02-24 09:32:24

Python 調(diào)試器

2011-08-24 11:08:09

Lua
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號