性能優(yōu)化技巧之工具選擇
編者按:性能優(yōu)化,不僅需要對系統(tǒng)和代碼熟悉,更需要一個強(qiáng)有力的工具支持。本文是性能優(yōu)化系列文章的第三篇,從性能優(yōu)化要考慮工具的哪些問題開始說起,到性能優(yōu)化工具都有哪些?本文為您一一介紹。
“工欲善其事,必先利其器”(孔子),雖然“思想比工具更重要”(彎曲網(wǎng)友),但是,如果沒有工具支持,性能優(yōu)化就會非常累。思想不好掌握,但是使用工具還是比較好學(xué)習(xí)的,有了工具支持,可以讓初級開發(fā)者更容易入門。
性能優(yōu)化用到的工具,需要考慮哪些方面的問題?
1)使用工具是否需要重新編譯代碼?
一般來說,性能優(yōu)化工具基本上都需要重新編譯代碼。因?yàn)樵谏a(chǎn)環(huán)境里面使用的image,應(yīng)該是已經(jīng)優(yōu)化過的image。不應(yīng)該在用戶環(huán)境里面去調(diào)試性能問題。但Build-in的工具有一個好處就是性能測試所用的image和性能調(diào)試所用的image是相同的,這樣可以避免重新編譯所帶來的誤差。
2)工具本身對測量結(jié)果的影響
如果是Build-in的工具,需要減小工具對性能的影響,啟用工具和不啟用工具對性能的影響應(yīng)該在一定范圍之內(nèi),比如5%,否則不清楚是工具本身影響性能還是被測量的代碼性能下降。
如果是需要重新編譯使用的工具,這里的測試是一個相對值,不能做為性能指標(biāo)的依據(jù)。因?yàn)榫幾g會修改代碼的位置,也可能會往代碼里面加一個測量函數(shù),它生成的image和性能測試的image不一樣。
在這里要列出幾個我用過的Linux工具,其他系統(tǒng)應(yīng)該也有對應(yīng)的工具,讀者可以自己搜索。
性能測試工具一般分這么幾種
1)收集CPU的performance counter。CPU里面有很多performance counter,打開之后,會記錄CPU某些事件的數(shù)量,比如cache miss, 指令數(shù),指令時間等等。這些counter需要編程才能使用。測量哪一段代碼完全由自己掌握。
2)利用編譯器的功能,在函數(shù)入口和出口自動加回調(diào)函數(shù),在回調(diào)函數(shù)里面,記錄入口和出口的時間。收集這些信息,可以得到函數(shù)的調(diào)用流程和每個函數(shù)所花費(fèi)的時間。
3)自己在代碼里面加入時間測量點(diǎn),測量某段代碼執(zhí)行的時間。這種工具看起來和#1的作用差不多,但是由于performance counter編程有很多限制,所以這種工具有時還是有用處的。
在Linux里面,我們經(jīng)常會用到
1)Oprofile
Oprofile已經(jīng)加入了linux的內(nèi)核代碼庫,所以不需要打patch,但是還需要重新編譯內(nèi)核才可以使用。這是使用最廣泛的linux工具,網(wǎng)上有很多使用指南,讀者可以自己搜索參考。
http://oprofile.sourceforge.net/news/
http://people.redhat.com/wcohen/Oprofile.pdf
2) KFT and Gprof
KFT是kernel的一個patch,只對kernel有效;Gprof是gcc里面的一個工具,只對用戶空間的程序有效。這兩個工具都需要重新編譯代碼,它們都用到了gcc里面的finstrument-functions選項(xiàng)。編譯時會在函數(shù)入口,出口加回調(diào)函數(shù),而且inline函數(shù)也會改成非inline的。它的工作原理可以參考:
http://blog.linux.org.tw/~jserv/archives/001870.html
http://blog.linux.org.tw/~jserv/archives/001723.html
http://elinux.org/Kernel_Function_Trace
http://www.network-theory.co.uk/docs/gccintro/gccintro_80.html
個人認(rèn)為這是一個非常有用的工具,對讀代碼也有幫助,是居家旅行的必備。這里還有一個slide比較各種工具的,可以看看。
3) Performance counter
http://anton.ozlabs.org/blog/2009/09/04/using-performance-counters-for-linux/
Linux performance counter,用于收集CPU的performance counter,已經(jīng)加入了內(nèi)核代碼庫。通常來說,performance counter的粒度太大,基本沒有什么用處,因?yàn)闆]法定位問題出在哪里;如果粒度太小,就需要手工編程,不能靠加幾個檢查點(diǎn)就可以了。所以還是要結(jié)合上面兩個工具一起用才有好的效果。
工具解決哪些問題?
1)幫助建立基線。沒有基線,就沒辦法做性能優(yōu)化。性能優(yōu)化是個迭代的過程,指望一次搞定是不現(xiàn)實(shí)的。
2)幫助定位問題。這里有兩個涵義:一是性能問題出現(xiàn)在什么地方,是由哪一段代碼引起的;二是性能問題的原因,cache miss,TLB miss還是其他。
3)幫助驗(yàn)證優(yōu)化方案。優(yōu)化的結(jié)果應(yīng)該能在工具里面體現(xiàn)出來,而不是靠蒙。
【編輯推薦】
- 性能優(yōu)化技巧之代碼層次優(yōu)化
- 新的技術(shù)產(chǎn)業(yè):Web性能優(yōu)化
- Linux網(wǎng)絡(luò)性能優(yōu)化方法簡析
- 網(wǎng)站性能優(yōu)化最佳實(shí)踐