自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

如何分析和提高(C/C++)程序的編譯速度?

開發(fā) 后端
當(dāng)我們遇到這樣情況的時候,是不是不知所措呢?怎么防止遇到這樣的情況呢,我們來分析一下程序加速的一些方法。

[[327635]]

當(dāng)我們遇到這樣情況的時候,是不是不知所措呢?怎么防止遇到這樣的情況呢,我們來分析一下程序加速的一些方法。

硬件、編譯器造成的

使用好點的電腦無疑是一個操作上的最佳選擇,其次,對于編譯器也是可以編譯選項優(yōu)化的,例如在VS環(huán)境中,可以通過配置屬性來實現(xiàn),具體步驟如下,大家可以參考:https://blog.csdn.net/yizhou2010/article/details/52635288

代碼編寫風(fēng)格

多使用自加、自減指令和復(fù)合賦值表達式

你覺得使用i++ ,i = i + 1,i += 1有區(qū)別嗎?我們來測試一下C代碼: 

  1. void asd() {}  
  2. int main() {  
  3.     int i=0 
  4.     i++;  
  5.     asd();  //方便區(qū)分上下文  
  6.     ii=i+1;  
  7.     asd();  
  8.     i+=1;  
  9.     return 0;  

反匯編: 

  1. mov     [rbp+i], 0    //i的初始化  
  2. add     [rbp+i], 1    //i++;  
  3. call    _Z3asdv         ; asd(void)  
  4. add     [rbp+i], 1    //ii=i+1;  
  5. call    _Z3asdv         ; asd(void)  
  6. add     [rbp+i], 1    //i+=1; 

我們看到這個結(jié)果是一樣的,但是在更加復(fù)雜的表達式中就會多生成幾個指令了,而且用 i += 1 的,總是比寫 i = i + 1的要稍微那么好看些。

除法換成乘法或者移位來表達

除法就是由乘法的過程逆推來的,依次減掉(如果x夠減的)y^(2^31),y^(2^30),...y^8,y^4,y^2,y^1。減掉相應(yīng)數(shù)量的y就在結(jié)果加上相應(yīng)的數(shù)量,一般來說,更耗時間一些,用一個demo來測試一下 

  1. auto time_start = std::chrono::system_clock::now();  
  2. int iCount = 100000 
  3. double k ;  
  4. for (int i = 0; i < 1000000; i++)  
  5.  
  6.      tmp = iCount / 2;  
  7.  
  8. std::chrono::duration<double> time_spend = std::chrono::system_clock::now() - time_start;  
  9. double test1 = time_spend.count() * 1000;  
  10. cout<<"test1 cost "<<time_cost<<" ms"<<endl 
  11. time_start = std::chrono::system_clock::now() ;  
  12. for (int i = 0; i < 1000000; i++)  
  13.  
  14.      tmp = iCount * 0.5f;  
  15. time_spend = std::chrono::system_clock::now() - time_start;  
  16. test2 = time_spend.count() * 1000;  
  17. cout<<"test2 cost "<<time_cost<<" ms"<<endl 
  18. time_start = std::chrono::system_clock::now() ;  
  19. for (int i = 0; i < 1000000; i++)  
  20.  
  21.      tmp = iCount >>1;  
  22.  
  23. time_spend = std::chrono::system_clock::now() - time_start;  
  24. test3 = time_spend.count() * 1000;  
  25. cout<<"test3 cost "<<time_cost<<" ms"<<endl

我們輸出結(jié)果會發(fā)現(xiàn),移位和乘法比除法要省3-5倍時間,移位相對而言是最省時間的。

多用直接初始化,少用拷貝初始化 

  1. string s1 = "hiya";    // 拷貝初始化  
  2. string s2("hello");    // 直接初始化  
  3. string s3(10, 'c');    // 直接初始化 

當(dāng)我們使用拷貝初始化時,我們要求編譯器將右側(cè)運算對象拷貝到正在創(chuàng)建的對象中,如果需要的話還要進行類型轉(zhuǎn)換,會浪費一定的資源時間,而直接初始化是要求編譯器使用普通的函數(shù)匹配來選擇與我們提供的參數(shù)最匹配的構(gòu)造函數(shù)和拷貝構(gòu)造函數(shù)。

我們來看看Primer中怎么說的

當(dāng)用于類類型對象時,初始化的復(fù)制形式和直接形式有所不同:直接初始化直接調(diào)用與實參匹配的構(gòu)造函數(shù),復(fù)制初始化總是調(diào)用復(fù)制構(gòu)造函數(shù)。復(fù)制初始化首先使用指定構(gòu)造函數(shù)創(chuàng)建一個臨時對象,然后用復(fù)制構(gòu)造函數(shù)將那個臨時對象復(fù)制到正在創(chuàng)建的對象”

還有一段說到:

通常直接初始化和復(fù)制初始化僅在低級別優(yōu)化上存在差異,然而,對于不支持復(fù)制的類型,或者使用非explicit構(gòu)造函數(shù)的時候,它們有本質(zhì)區(qū)別:   

  1. ifstream file1("filename")://ok:direct initialization  
  2. ifstream file2 = "filename";//error:copy constructor is private 

局部變量、靜態(tài)局部變量、全局變量與靜態(tài)全局變量

  •  局部變量是存在于堆棧中的,對其空間的分配僅僅是修改一次esp寄存器的內(nèi)容即可;
  •  靜態(tài)局部變量是定義在函數(shù)內(nèi)部的,靜態(tài)局部變量定義時前面要加static關(guān)鍵字來標識,靜態(tài)局部變量所在的函數(shù)在多調(diào)用多次時,只有第一次才經(jīng)歷變量定義和初始化;
  •  當(dāng)一個文件或者數(shù)據(jù)反復(fù)使用時,應(yīng)該存儲在全局變量中,避免重復(fù)加載使用;
  •  靜態(tài)全局變量是靜態(tài)存儲方式,靜態(tài)全局變量則限制了其作用域,即只在定義該變量的源文件內(nèi)有效,在同一源程序的其它源文件中不能使用它。

靜態(tài)變量是低效的,當(dāng)一塊數(shù)據(jù)被反復(fù)讀寫,其數(shù)據(jù)會留在CPU的一級緩存(Cache)中

代碼冗余度

避免大的循環(huán),循環(huán)中避免判斷語句

在寫程序過程中,最影響代碼運行速度的往往都是循環(huán)語句,我記得當(dāng)時在寫matlab的時候,處理大數(shù)據(jù),都是禁止用循環(huán)的,特別是多層嵌套的循環(huán)語句。

其次,盡量將循環(huán)嵌套控制在 3 層以內(nèi),有研究數(shù)據(jù)表明,當(dāng)循環(huán)嵌套超過 3 層,程序員對循環(huán)的理解能力會極大地降低。同時,這樣程序的執(zhí)行效率也會很低。因此,如果代碼循環(huán)嵌套超過 3 層,建議重新設(shè)計循環(huán)或?qū)⒀h(huán)內(nèi)的代碼改寫成一個子函數(shù)。 

  1. for (i=0;i<100;i++)  
  2.  
  3.     for (j=0;j<5;j++)  
  4.     {  
  5.        for (j=0;j<5;j++)  
  6.         {  
  7.             /*處理代碼*/  
  8.         }  
  9.     }  

多重 for 循環(huán)中,如果有可能,應(yīng)當(dāng)盡量將最長的循環(huán)放在最內(nèi)層,最短的循環(huán)放在最外層,以減少 CPU 跨切循環(huán)層的次數(shù) 

  1. for (i=0;i<100;i++)  
  2.  
  3.     for (j=0;j<5;j++)  
  4.     {  
  5.             /*處理代碼*/  
  6.     }  

改為: 

  1. for (j=0;j<5;j++)  
  2.  
  3.     for (i=0;i<100;i++)  
  4.     {  
  5.             /*處理代碼*/  
  6.     }  

邏輯判斷不要在循環(huán)中使用,當(dāng) for 循環(huán)的次數(shù)很大時,執(zhí)行多余的判斷不僅會消耗系統(tǒng)的資源,而且會打斷循環(huán)“流水線”作業(yè),使得編譯器不能對循環(huán)進行優(yōu)化處理,降低程序的執(zhí)行效率 

  1. if (condition)  
  2.  
  3.     for (i = 0;i < n;i++)  
  4.     {  
  5.         /*處理代碼*/  
  6.     }  
  7.  
  8. else  
  9.  
  10.     for (i = 0;i < n;i++)  
  11.     {  
  12.         /*處理代碼*/  
  13.     }  

盡量避免遞歸,遞歸就是不停的調(diào)用自身,所以非常消耗資源,甚至造成堆棧溢出和程序崩潰等等問題! 

  1. int Func(int n)  
  2.  
  3. if(n < 2 
  4. return 1;  
  5. else  
  6. return n*Func(n-1);  

因此,掌握循環(huán)優(yōu)化的各種實用技術(shù)是提高程序效率的利器,也是一個高水平程序必須具備的基本功。

盡量不使用繼承和多重繼承

多重繼承增加了類的繼承層次的復(fù)雜性,調(diào)試難度增加當(dāng)然風(fēng)險也增加了,而且使用父類指針指向子類對象變成了一件復(fù)雜的事情,得用到C++中提供的dynamic_cast來執(zhí)行強制轉(zhuǎn)換。但是dynamic_cast是在運行期間而非編譯期間進行轉(zhuǎn)換的,因此會會帶來一些輕微的性能損失,建議類型轉(zhuǎn)換盡量采用c++內(nèi)置的類型轉(zhuǎn)換函數(shù),而不要強行轉(zhuǎn)換

少用模板,因為模板是編譯期技術(shù),大量采用模板也會增加編譯時間

在c++primer3中,有一句話:

在多個文件之間編譯相同的函數(shù)模板定義增加了不必要的編譯時間簡單點說,對于一個zhidaovector的函數(shù),比如size(),如果在不同的cpp中出現(xiàn),在這些文件編譯的時候都要把vector::size()編譯一遍。然后在鏈接的時候把重復(fù)的函數(shù)去掉,很顯然增加了編譯時間。模版函數(shù)需要在編譯的時候?qū)嵗痾hidao,所以呢,不把模版的實現(xiàn)代碼放到頭文件中的話(在頭文件中實例化),那么每個使用到這個模版的cpp的都要把這個模版重新實例化一遍,所以增加了編內(nèi)譯時間

編碼依賴性

聲明與實現(xiàn)分離,刪除不必要的#include

  •  使用include時,只需要include這個接口頭文件就好
  •  并不是所有的文件都需要包含頭文件 iostream,定義了輸出函數(shù)引用就好
  •  ostream頭文件也不要,替換為 iosfwd, 為什么,參數(shù)和返回類型只要前向聲明(forward declared )就可以編譯通過

盡量減少參數(shù)傳遞,多用引用來傳遞參數(shù)。 

  1. bool func1(string s1,  string s2)  
  2. bool func2(string *s1, string *s2)  
  3. bool func3(string &s1, string &s2) 

指針和引用都不會創(chuàng)建新的對象,函數(shù)func2和func3不需要調(diào)用析構(gòu)和構(gòu)造函數(shù),函數(shù)func1使用值傳遞在參數(shù)傳遞和函數(shù)返回時,需要調(diào)用string的構(gòu)造函數(shù)和析構(gòu)函數(shù)兩次。

適當(dāng)?shù)牟捎肞IMPL模式

很實用的一種基礎(chǔ)模式,通過一個私有的成員指針,將指針所指向的類的內(nèi)部實現(xiàn)數(shù)據(jù)進行隱藏。將實現(xiàn)放到CPP里,主要作用在于編譯分離,其實是增加了編碼量以及初次編譯時長,增量編譯才體現(xiàn)作用。例如:指針的大小為(64位)或32(8位),X發(fā)生變化,指針大小卻不會改變,文件c.h也不需要重編譯。

未完待續(xù)

方法還有很多,比如使用多線程,多任務(wù)并行編譯,分布式編譯,預(yù)編譯等等,另外,在編譯大型項目時,分布式編譯更優(yōu),往往能夠大幅度提升性能。 

 

責(zé)任編輯:龐桂玉 來源: C語言與C++編程
相關(guān)推薦

2011-05-24 16:03:30

C++編譯速度

2010-01-15 17:18:57

C++源程序

2019-05-24 16:20:11

Python 開發(fā)編程語言

2010-01-28 10:33:10

C++開發(fā)程序

2010-01-13 18:44:03

C++編譯

2014-03-06 09:18:48

C++CIDE

2021-02-26 10:41:59

C++程序員代碼

2023-11-20 09:57:03

內(nèi)聯(lián)函數(shù)C++

2010-01-20 13:29:40

C++環(huán)境

2010-01-22 13:20:27

C++代碼

2010-01-26 15:51:06

C++變量

2011-01-14 12:44:32

Linux PPCEclipseC

2009-04-10 13:57:50

C#C++Java

2010-01-28 17:14:38

Visual C++應(yīng)

2010-01-14 15:29:44

C++編譯器

2010-01-27 15:46:15

學(xué)習(xí)C++效率

2010-01-12 17:55:03

C++程序

2011-04-11 09:43:25

C++C

2014-09-19 10:46:36

LuaCC++

2010-10-20 13:43:37

C++編譯器
點贊
收藏

51CTO技術(shù)棧公眾號