最短的崩潰程序(C語言版)
想寫個崩潰的C語言小程序,看起來是個奇怪的主意,不過在我曾經教過的一門實驗課上,這是作業(yè)之一!實際上,這是一件非常有教學意義的事情。
通常學生們要么嘗試反向引用一個非法地址,要么就是除0.除0會引發(fā)SIGFPE信號(浮點異常)。這里有一個小例子程序,使用除零方法來使之崩潰:
- int main()
- {
- return 1/0;
- }
我們也可以刪掉return關鍵字,但是當我這么做的時候gcc不會為這些語句生成可執(zhí)行代碼,即便優(yōu)化選項被disable掉了。我們還可以通過把上面的語句改成賦值語句,使上面的代碼改變一些特征:
- i;
- int main()
- {
- i=1/0;
- }
注意我聲明了一個沒有類型的i。這樣的代碼在C89標準里是有效的,因為所有的聲明都有隱形的缺省類型int。在C99和其他一些C標準里這是一個錯誤。假定我們寫的是C89代碼,那么我們甚至可以使用隱形int來聲明main函數(shù):
- i;
- main()
- {
- i=1/0;
- }
那是相當短的代碼了 — 如果我們不把用于縮進的空格計算進來,只有16個字符。然而,我們還可以做得更好!
當C程序在編譯的時候,編譯器會產生一個或更多對象文件,文件里有對于用到的庫和全程對象(函數(shù)和變量)的符號索引。然后這些對象文件會被進行鏈接,這時符號索引被地址所代替,就產生了一個可執(zhí)行文件。
編譯器在一個對象文件里提供了一個調用main函數(shù)的入口點。調用main函數(shù)意味著我們試圖執(zhí)行在存儲在main函數(shù)鏈接的位置所對應地址里的指令。
有趣的是,鏈接器對于不同對象的類型是沒有概念的,它只知道它們的地址。所以,如果我們用一個常規(guī)的全程變量替換main函數(shù),編譯器會高興地build對象文件,因為它不關心對象main的類型是什么;鏈接器也會高興地鏈接它,因為它只關心main函數(shù)對應的地址。
所以,考慮這個C程序:
- int main=0;
這個程序會編譯成一個可執(zhí)行文件,它會試圖調用地址0,而0并不是我們能夠訪問的地址,這樣我們會得到SIGSEGV信號(分段錯誤)。
更正:我前面關于這個程序崩潰的原因分析是錯的。這個程序會試圖按函數(shù)方式去執(zhí)行main,而這樣不會奏效,因為編譯器把它放到了不可執(zhí)行的數(shù)據段。所以變量main初始化為什么值都無所謂了。(感謝Zack的糾正)
現(xiàn)在我們已經非常接近最小的崩潰的C程序了。我們可以利用這個技巧,配合隱形int類型,來把它進一步縮短。
- main=0;
還有,C里的全局變量都會隱形地初始化為0,所以上面的代碼就等同于:
- main;
好了,現(xiàn)在我們得到了最短的崩潰的C程序!
補充:
Hacker News用戶femto指出,編譯和鏈接一個空文件也是可能的。我沒有發(fā)布這個是因為gcc會拒絕編譯和鏈接這樣的程序,它會要求分開編譯和鏈接的過程。
另外,要是我們再學究一點,我應該指出我這里的“全局”變量意思是說“靜態(tài)”變量。
英文原文:llbit.se