為什么重復(fù)free()比內(nèi)存泄漏危害更大
C程序設(shè)計中,內(nèi)存操作相關(guān)的錯誤可以說是最常見,同時也是非常隱蔽的一類錯誤。這類錯誤往往導(dǎo)致程序莫名其妙地崩潰、耗盡系統(tǒng)資源,或是形成嚴(yán)重的安全弱點。
在 FreeBSD,以及多數(shù)其他 BSD 派生的系統(tǒng)中,重復(fù) free() 在默認(rèn)情況下都會導(dǎo)致 C 函數(shù)庫調(diào)用 abort() 終止程序。除了 malloc(3) 函數(shù)族本身的設(shè)計之外,這也是一項非常重要的安全特性。與此相反,包括 *BSD 在內(nèi)的多數(shù)系統(tǒng)的 C 函數(shù)庫并不對堆進(jìn)行審計,也就是說,從 API 設(shè)計者的觀點來看,內(nèi)存泄漏并不被認(rèn)為是非常嚴(yán)重的程序設(shè)計問題。
為什么會有這樣的區(qū)別呢?事實上,內(nèi)存泄漏同樣可以導(dǎo)致比較嚴(yán)重的問題,例如響應(yīng)速度變慢、進(jìn)程由于占用的資源太多而被 OS 殺掉導(dǎo)致 DoS 等等。為了回答這個問題,我們來觀察一下兩種問題出現(xiàn)的場景。
內(nèi)存泄漏 是指這樣一種場景:程序分配了一塊內(nèi)存,但已經(jīng)不再持有引用這塊內(nèi)存的對象(通常是指針)。從 OS 的角度,它知道進(jìn)程持有的內(nèi)存數(shù)量;然而,從進(jìn)程的角度,它可能并不完全知道自己持有哪些內(nèi)存。
換言之,內(nèi)存泄漏就是通過遍歷進(jìn)程內(nèi)所有可以從棧上,或以靜態(tài)變量形式存于堆上的指針及其后繼,無法到達(dá)所有全部已分配內(nèi)存的情形。
如果程序不存在其他問題(例如緩沖區(qū)溢出),此時程序訪問內(nèi)存時,任何時候都不會在無意中覆寫超出范圍的數(shù)據(jù)。即,將數(shù)據(jù)覆寫到程序其他部分保存數(shù)據(jù)的內(nèi)存單元。
而 重復(fù)釋放 則指這樣一種場景:程序分配一塊內(nèi)存之后,經(jīng)過使用將這塊內(nèi)存釋放,但并沒有將指向這塊內(nèi)存的所有指針抹零或回收,并在其他部分再次將指向同一塊內(nèi)存單元的指針交給內(nèi)存分配器去進(jìn)行釋放操作。這種情況下,我們可以斷言:
1、程序邏輯并不清楚這塊內(nèi)存已經(jīng)被釋放;
2、有理由相信,對這塊內(nèi)存進(jìn)行的寫操作,可能已經(jīng)影響了程序其他部分的行為,因為這塊內(nèi)存可能已經(jīng)分配作為其他用途。
因此,這應(yīng)被看作立即停止程序運行的一項致命錯誤,因為程序行為已經(jīng)出現(xiàn)了異常,而C函數(shù)庫擁有的信息不足以糾正這種異常行為,而另一方面,程序可能已經(jīng)發(fā)生了堆緩沖區(qū)溢出。
為了削弱這類問題帶來的實質(zhì)性安全影響,現(xiàn)代的內(nèi)存分配器往往會將尺寸接近的內(nèi)存塊放在一起(這樣做還能夠抑制內(nèi)存碎片的產(chǎn)生,并提高CPU的數(shù)據(jù)緩存命中率,因為通常程序會傾向于一次性地訪問相近的內(nèi)存結(jié)構(gòu))。
從而能夠在一定程度上減輕由于向已經(jīng)釋放的內(nèi)存塊繼續(xù)寫數(shù)據(jù)導(dǎo)致的損害(因為這些內(nèi)存很可能被分配給同樣的數(shù)據(jù)結(jié)構(gòu),這類寫操作的危害往往會低于向其他類型的數(shù)據(jù)結(jié)構(gòu)寫數(shù)據(jù),特別是當(dāng)這些數(shù)據(jù)中包含一部分用戶輸入的時候)。
當(dāng)然,徹底消除這類問題,需要為程序設(shè)計語言增加一些新的基礎(chǔ)設(shè)施(例如強(qiáng)類型、托管內(nèi)存等)。現(xiàn)代程序設(shè)計語言如Java、Python和.net系列等,都采用了避免這類問題的措施。然而,也正因為如此,通過這些語言入門并準(zhǔn)備撰寫 C 程序的開發(fā)人員就更需要注意這類問題。
【編輯推薦】