程序體積優(yōu)化的十個(gè)小妙招
本文轉(zhuǎn)載自微信公眾號(hào)「程序喵大人」,作者程序喵大人。轉(zhuǎn)載本文請(qǐng)聯(lián)系程序喵大人公眾號(hào)。
大家好,我是程序喵,眾所周知,前兩天,小破站又上市了,慷慨的宣布要給員工加雞腿,激動(dòng)的喵哥一夜沒睡好,萬萬妹想到啊,人算不如天算,公司真的發(fā)了雞腿,沒錯(cuò),就是你想的那個(gè)。
雞腿啥的不想了,我還是安心肝文章吧。。。
前一段時(shí)間在知乎上看到個(gè)問題:Linux如何優(yōu)化可執(zhí)行程序的體積?
在我們的日常工作中,一般對(duì)程序的體積都有嚴(yán)格的要求,有時(shí)候僅僅因?yàn)閹鬃止?jié)的代碼段體積或者多了幾十毫秒的運(yùn)行時(shí)間,整個(gè)項(xiàng)目就達(dá)不到驗(yàn)收標(biāo)準(zhǔn),甚至不能成功上線。這里我拋磚引玉先提出幾個(gè)思路,大家如果有好的優(yōu)化策略歡迎打在評(píng)論區(qū)。
大體思路有這些:
- 好好寫代碼,減小代碼段體積,別人300代碼的邏輯我們50行搞定,程序體積肯定有機(jī)會(huì)更小一些,這個(gè)就得考驗(yàn)開發(fā)者自己的編程功底了
- 如果是C++程序,可以盡量減少模板的使用,模板實(shí)例化可能會(huì)導(dǎo)致代碼膨脹
- 不用引用沒有用的頭文件
- 使用strip,像脫衣服一樣,移除程序的所有符號(hào),這也是很多開發(fā)者常用的方式
- strip只會(huì)清除普通符號(hào),不會(huì)動(dòng)態(tài)符號(hào)表中的符號(hào),某些動(dòng)態(tài)符號(hào)其實(shí)也可以隱藏掉,進(jìn)而來減小庫的體積,可以使用-fvisibility=hidden命令
- 巧用.bss段,未初始化的全局變量和局部靜態(tài)變量會(huì)存在.bss段中,這些變量不占用程序空間
- inline-limit:內(nèi)聯(lián)過多會(huì)導(dǎo)致代碼段體積較大,可以通過此優(yōu)化選項(xiàng)減少內(nèi)聯(lián)的數(shù)量
- 開啟Os編譯,這是產(chǎn)生較小代碼體積的優(yōu)化選項(xiàng)
- 適當(dāng)使用編譯選項(xiàng)-fdata-sections和-ffunction-sections
- 考慮鏈接動(dòng)態(tài)庫而非靜態(tài)庫
以上說的太籠統(tǒng)了?貼心如我早就準(zhǔn)備好了,不謝~
strip使用
在Linux中可以使用man strip查看strip使用方法,最主要的就是移除所有符號(hào)的-s參數(shù),用于清除所有的符號(hào)信息:
- strip -s xxx
在使用strip之前先使用nm查看下可執(zhí)行程序的符號(hào)信息:
- ~/test$ nm a.out
- 0000000000200da0 d _DYNAMIC
- 0000000000200fa0 d _GLOBAL_OFFSET_TABLE_
- 000000000000089b t _GLOBAL__sub_I__Z4funcPc
- 0000000000000930 R _IO_stdin_used
- w _ITM_deregisterTMCloneTable
- w _ITM_registerTMCloneTable
- 0000000000000852 t _Z41__static_initialization_and_destruction_0ii
- 00000000000007fa T _Z4funcPc
- 000000000000081c T _Z4funci
- U _ZNSt8ios_base4InitC1Ev@@GLIBCXX_3.4
- U _ZNSt8ios_base4InitD1Ev@@GLIBCXX_3.4
- 0000000000201020 B _ZSt4cout@@GLIBCXX_3.4
- 0000000000000934 r _ZStL19piecewise_construct
- 0000000000201131 b _ZStL8__ioinit
- U _ZStlsISt11char_traitsIcEERSt13basic_ostreamIcT_ES5_PKc@@GLIBCXX_3.4
- 0000000000000b24 r __FRAME_END__
- 0000000000000940 r __GNU_EH_FRAME_HDR
- 0000000000201010 D __TMC_END__
- 0000000000201010 B __bss_start
- U __cxa_atexit@@GLIBC_2.2.5
- w __cxa_finalize@@GLIBC_2.2.5
- 0000000000201000 D __data_start
- 00000000000007b0 t __do_global_dtors_aux
- 0000000000200d98 t __do_global_dtors_aux_fini_array_entry
- 0000000000201008 D __dso_handle
- 0000000000200d88 t __frame_dummy_init_array_entry
- w __gmon_start__
- 0000000000200d98 t __init_array_end
- 0000000000200d88 t __init_array_start
- 0000000000000920 T __libc_csu_fini
- 00000000000008b0 T __libc_csu_init
- U __libc_start_main@@GLIBC_2.2.5
- 0000000000201010 D _edata
- 0000000000201138 B _end
- 0000000000000924 T _fini
- 0000000000000688 T _init
- 00000000000006f0 T _start
- 0000000000201130 b completed.7698
- 0000000000201000 W data_start
- 0000000000000720 t deregister_tm_clones
- 00000000000007f0 t frame_dummy
- 000000000000083d T main
- 0000000000000760 t register_tm_clones
當(dāng)前這個(gè)可執(zhí)行程序的文件大小是8840字節(jié):
- -rwxrwxrwx 1 a a 8840 Nov 29 14:54 a.out
使用strip清除符號(hào)信息:
- ~/test$ strip -s a.out
strip后再查看可執(zhí)行文件的符號(hào)信息:
- ~/test$ nm a.out nm: a.out: no symbols
發(fā)現(xiàn)什么符號(hào)都沒有了,但還是可以執(zhí)行。
strip后的可執(zhí)行程序文件大小是6120字節(jié):
- -rwxrwxrwx 1 a a 6120 Nov 29 14:54 a.out
具體可以看我這篇文章:《Linux有一個(gè)命令你一定要知道》
-fvisibility=hidden可以這樣使用:
- $ g++ -fvisibility=hidden -c layer.cxx -o layer.o
巧用.bss段:
看下面代碼:
- #include <stdio.h>
- int a[1000];
- int b[1000] = {1};
- int main() {
- printf("程序喵\n");
- return 0;
- }
我們查看下文件大小和各個(gè)段大小:
- $ gcc testlink.c -o test
- $ ls -l test
- -rwxrwxrwx 1 wzq wzq 12368 May 30 08:48 test
- $ size test
- text data bss dec hex filename
- 1512 4616 4032 10160 27b0 test
再看這段初始化的代碼:
- #include <stdio.h>
- int a[1000] = {1};
- int b[1000] = {1};
- int main() {
- printf("程序喵\n");
- return 0;
- }
再查看下文件大小和各個(gè)段大?。?/p>
- $ gcc testlink.c -o test
- $ ls -l test
- -rwxrwxrwx 1 wzq wzq 16368 May 30 08:49 test
- $ size test
- text data bss dec hex filename
- 1512 8616 8 10136 2798 test
可以看到僅僅是做了一次初始化,文件大小就從12368變成了16368,正好是初始化了的那a[1000]的大小,這4000字節(jié)從.bss段移動(dòng)到了.data段,程序大小增加了,這里可以看出.bss段不占據(jù)磁盤空間。
巧用-fdata-sections和-ffunction-sections:
現(xiàn)在的程序和庫通常來講都很大,一個(gè)目標(biāo)文件可能包含成百上千個(gè)函數(shù)或變量,當(dāng)需要用到某個(gè)目標(biāo)文件的任意一個(gè)函數(shù)或變量時(shí),就需要把它整個(gè)目標(biāo)文件都鏈接進(jìn)來,也就是說那些沒有用到的函數(shù)也會(huì)被鏈接進(jìn)去,這會(huì)導(dǎo)致鏈接輸出文件變的很大,造成空間浪費(fèi)。
有一個(gè)編譯選項(xiàng)叫函數(shù)級(jí)別鏈接,可以使得某個(gè)函數(shù)或變量單獨(dú)保存在一個(gè)段里面,都鏈接器需要用到某個(gè)函數(shù)時(shí),就將它合并到輸出文件中,對(duì)于沒用到的函數(shù)則將他們拋棄,減少空間浪費(fèi),但這會(huì)減慢編譯和鏈接過程,GCC編譯器的編譯選項(xiàng)是:
- -ffunction-sections -fdata-sections