自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項目管理免費題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設(shè)置退出

陳皓：代碼執(zhí)行的效率

作者：陳皓 2012-07-16 01:20:09

開發(fā) 開發(fā)工具

在《性能調(diào)優(yōu)攻略》里，我說過，要調(diào)優(yōu)性需要找到程序中的Hotspot，也就是被調(diào)用最多的地方，這種地方，只要你能優(yōu)化一點點，你的性能就會有質(zhì)的提高。在這里我給大家舉三個關(guān)于代碼執(zhí)行效率的例子……

在《性能調(diào)優(yōu)攻略》里，我說過，要調(diào)優(yōu)性需要找到程序中的Hotspot，也就是被調(diào)用最多的地方，這種地方，只要你能優(yōu)化一點點，你的性能就會有質(zhì)的提高。在這里我給大家舉三個關(guān)于代碼執(zhí)行效率的例子（它們都來自于網(wǎng)上）

第一個例子

PHP中Getter和Setter的效率（來源reddit）

這個例子比較簡單，你可以跳過。

考慮下面的PHP代碼：我們可看到，使用Getter/Setter的方式，性能要比直接讀寫成員變量要差一倍以上。

<?php  
    //dog_naive.php  
   
    class dog {  
        public $name = "";  
        public function setName($name) {  
            $this-&gt;name = $name;  
        }  
        public function getName() {  
            return $this-&gt;name;  
        }  
    }  
   
    $rover = new dog();  
        //通過Getter/Setter方式  
    for ($x=0; $x<10; $x++) {  
        $t = microtime(true);  
        for ($i=0; $i<1000000; $i++) {  
            $rover->setName("rover");  
            $n = $rover->getName();  
        }  
        echo microtime(true) - $t;  
        echo "\n";  
    }  
        //直接存取變量方式  
        for ($x=0; $x<10; $x++) {  
        $t = microtime(true);  
        for($i=0; $i<1000000; $i++) {  
            $rover->name = "rover";  
            $n = $rover->name;  
        }  
        echo microtime(true) - $t;  
        echo "\n";  
    }  
?>

這個并沒有什么稀，因為有函數(shù)調(diào)用的開銷，函數(shù)調(diào)用需要壓棧出棧，需要傳值，有時還要需要中斷，要干的事太多了。所以，代碼多了，效率自然就慢了。所有的語言都這個德行，這就是為什么C++要引入inline的原因。而且Java在打開優(yōu)化的時候也可以優(yōu)化之。但是對于動態(tài)語言來說，這個事就變得有點困難了。

你可能會以為使用下面的代碼（Magic Function）會好一些，但實際其性能更差。

class dog {  
    private $_name = "";  
    function __set($property,$value) {  
        if($property == 'name') $this->_name = $value;  
    }  
    function __get($property) {  
        if($property == 'name') return $this->_name;  
    }  
}

動態(tài)語言的效率從來都是一個問題，如果你需要PHP有更好的性能，你可能需要使用FaceBook的HipHop來把PHP編譯成C語言。

第二個例子

為什么Python程序在函數(shù)內(nèi)執(zhí)行得更快？（來源StackOverflow）

考慮下面的代碼，一個在函數(shù)體內(nèi)，一個是全局的代碼。

函數(shù)內(nèi)的代碼執(zhí)行效率為 1.8s

def main():  
    for i in xrange(10**8):  
        pass  
main()

函數(shù)體外的代碼執(zhí)行效率為 4.5s

for i in xrange(10**8):  
    pass

不用太糾結(jié)時間，只是一個示例，我們可以看到效率查得很多。為什么會這樣呢？我們使用 dis module 反匯編函數(shù)體內(nèi)的bytecode 代碼，使用 compile builtin 反匯編全局bytecode，我們可以看到下面的反匯編（注意我高亮的地方）

Main函數(shù)反匯編

13 FOR_ITER                 6 (to 22)  
16 STORE_FAST               1 (i)  
19 JUMP_ABSOLUTE           13

全局代碼

13 FOR_ITER                 6 (to 22)  
16 STORE_NAME               1 (i)  
19 JUMP_ABSOLUTE           13

我們可以看到，差別就是 STORE_FAST 和 STORE_NAME，前者比后者快很多。所以，在全局代碼中，變量i成了一個全局變量，而函數(shù)中的i是放在本地變量表中，所以在全局變量表中查找變量就慢很多。如果你在main函數(shù)中聲明global i 那么效率也就下來了。原因是，本地變量是存在一個數(shù)組中（直到），用一個整型常量去訪問，而全局變量存在一個dictionary中，查詢很慢。

（注：在C/C++中，這個不是一個問題）

第三個例子

為什么排好序的數(shù)據(jù)在遍歷時會更快？（來源StackOverflow）

參看如下C/C++的代碼：

for (unsigned i = 0; i < 100000; ++i) {  
   // primary loop  
    for (unsigned j = 0; j < arraySize; ++j) {  
        if (data[j] >= 128)  
            sum += data[j];  
    }  
}

如果你的data數(shù)組是排好序的，那么性能是1.93s，如果沒有排序，性能為11.54秒。差5倍多。無論是C/C++/Java，或是別的什么語言都基本上一樣。

這個問題的原因是—— branch prediction （分支預(yù)判）偉大的stackoverflow給了一個非常不錯的解釋。

考慮我們一個鐵路分叉，當(dāng)我們的列車來的時候，扳道員知道分個分叉通往哪，但不知道這個列車要去哪兒，司機知道要去哪，但是不知道走哪條分叉。所以，我們需要讓列車停下來，然后司機和扳道員溝通一下。這樣的性能太差了。

所以，我們可以優(yōu)化一下，那就是猜，我們至少有50%的概率猜對，如果猜對了，火車行駛性能巨高，猜錯了，就得讓火車退回來。如果我猜對的概率高，那么，我們的性能就會高，否則老是猜錯了，性能就很差。

[[84577]]

Image by Mecanismo, from Wikimedia Commons:http://commons.wikimedia.org/wiki/File:Entroncamento_do_Transpraia.JPG

我們的if-else 就像這個鐵路分叉一樣，下面紅箭頭所指的就是搬道器。

那么，我們的搬道器是怎么預(yù)判的呢？就是使用過去的歷史數(shù)據(jù)，如果歷史數(shù)據(jù)有90%以上的走左邊，那么就走左邊。所以，我們排好序的數(shù)據(jù)就更容易猜得對。

排好序的

T = 走分支（條件表達式為true）  
N = 不走分支(條件表達式為false)  
   
data[] = 0, 1, 2, 3, 4, ... 126, 127, 128, 129, 130, ... 250, 251, 252, ...  
branch = N  N  N  N  N  ...   N    N    T    T    T  ...   T    T    T  ...  
   
= NNNNNNNNNNNN ... NNNNNNNTTTTTTTTT ... TTTTTTTTTT  (easy to predict)

未排序的

data[] = 226, 185, 125, 158, 198, 144, 217, 79, 202, 118,  14, 150, 177, 182, 133, ...  
branch =   T,   T,   N,   T,   T,   T,   T,  N,   T,   N,   N,   T,   T,   T,   N  ...  
   
= TTNTTTTNTNNTTTN ...   (completely random - hard to predict)

從上面我們可以看到，排好序的數(shù)據(jù)更容易預(yù)測分支。

對此，那我們怎么辦？我們需要在這種循環(huán)中除去if-else語句。比如：

我們把條件語句：

if (data[j] >= 128)  
sum += data[j];

變成：

int t = (data[j] - 128) >> 31;  
sum += ~t & data[j];

“沒有分叉”的性能基本上和“排好序有分支”一個樣，無論是C/C++，還是Java。

注：在GCC下，如果你使用 -O3 or -ftree-vectorize 編譯參數(shù)，GCC會幫你優(yōu)化分叉語句為無分叉語句。VC++2010沒有這個功能。

最后，推薦大家一個網(wǎng)站——Google Speed，網(wǎng)站上的有一些教程告訴你如何寫出更快的Web程序。

（全文完）

原文鏈接：http://coolshell.cn/articles/7886.html

責(zé)任編輯：林師授來源：酷殼

51CTO技術(shù)棧公眾號

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營

<cite id="9dmd5"><track id="9dmd5"><sub id="9dmd5"></sub></track></cite>

<legend id="9dmd5"><track id="9dmd5"></track></legend>