自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

性能優(yōu)化,我們應(yīng)該知道的更多一點

運維 系統(tǒng)運維
當(dāng)我們談到性能優(yōu)化,更多的同學(xué)可能想到的是系統(tǒng)層面的性能優(yōu)化,而對于程序代碼本身的優(yōu)化卻比較少。實際上,除了系統(tǒng)層面的性能優(yōu)化外,在程序代碼層面的性能優(yōu)化效果也是非常好的。

當(dāng)我們談到性能優(yōu)化,更多的同學(xué)可能想到的是系統(tǒng)層面的性能優(yōu)化。比如在一個Web服務(wù)程序中,通過Redis或者其它緩存來提升網(wǎng)站訪問的速度等。對于程序代碼本身的優(yōu)化卻比較少。這一方面是編譯器為我們做了很多優(yōu)化工作,另外一方面是覺得系統(tǒng)層面的優(yōu)化效果更明顯,也更高大上。實際上,除了系統(tǒng)層面的性能優(yōu)化外,在程序代碼層面的性能優(yōu)化效果也是非常好的。

廢話不多說,我們以事實說話。大家看一下下面兩段程序,兩段程序的作用完全相同,就是將一個二維數(shù)組中的每一個元素做加1操作。大家看一下,覺得這兩段的程序是否會有性能差異?實際測試結(jié)果是兩者有近4倍的性能差異。

性能優(yōu)化,我們應(yīng)該知道的更多一點

性能差異的原因分析

大家考慮一下,為什么有如此之大的性能差異?結(jié)合代碼,我們看到兩段代碼的差異在于對數(shù)組元素的訪問順序,前者是逐列訪問,而后者是逐行訪問。結(jié)合圖1可能會理解的更加清楚一些。然后,我們在結(jié)合C語言中二維數(shù)據(jù)數(shù)據(jù)在內(nèi)存中的排布規(guī)則(可以在上述代碼中通過打印地址的方式驗證一下),可以知道前者是訪問連續(xù)的地址空間,而后者訪問的是跳躍的地址空間。

性能優(yōu)化,我們應(yīng)該知道的更多一點

圖1 兩種訪問形式

以整形數(shù)組為例,也就是說,前者訪問的地址依次為X,X+4,X+8等等。而后者訪問的地址則依次為X,X+4096,X+8192。后者每次跳躍4KB的地址空間。

了解了上述差異后,大家有沒有想到性能差異的原因?我們知道CPU為了提升訪問內(nèi)存的性能,在其和內(nèi)存之間增加了緩存,現(xiàn)代CPU緩存通常為3級緩存,分別是L1、L2和L3,其中L1和L2是CPU核獨有的,而L3是同一顆CPU的多核共享的。其基本的架構(gòu)如圖2所示。

性能優(yōu)化,我們應(yīng)該知道的更多一點

圖2 CPU緩存架構(gòu)

由于緩存分布式的特點,在多個CPU之間需要保證其一致性。扯遠了,總之緩存需要切割為比較小的粒度進行管理,這個小粒度的管理單元稱為緩存行(可以類比頁緩存中的緩存頁)。由于緩存的容量遠遠小于內(nèi)存的容量,因此緩存無法把內(nèi)存中的內(nèi)容都加載其中。緩存能夠其作用的最主要的原因是利用的常規(guī)業(yè)務(wù)訪問數(shù)據(jù)的兩個特性,也就是空間局部性和時間局部性。

  • 空間局部性:對于剛被訪問的數(shù)據(jù),其相鄰的數(shù)據(jù)在將來被訪問的概率高。
  • 時間局部性:對于剛被訪問的數(shù)據(jù),其本身在將來被訪問的概率高。

了解了上述原理,我們就知道,對于上面程序程序代碼,由于第二段程序依次跳躍的太遠,也就是不滿足空間局部性,從而導(dǎo)致緩存命中失敗。也就是說第二段程序其實無法訪問緩存中的數(shù)據(jù),而是直接訪問的內(nèi)存。而內(nèi)存的訪問性能要遠遠低于緩存的訪問性能,因此就出現(xiàn)了文章一開始的近4倍的性能差異。

關(guān)于程序性能的其它考慮

我們程序的很微小的改動就有可能對性能產(chǎn)生非常大的影響。因此,我們在日常開發(fā)中應(yīng)該處處注意代碼中是否有不恰當(dāng)?shù)拇a導(dǎo)致性能問題。下面我們在列舉一個關(guān)于性能相關(guān)的程序?qū)嵗员愦蠹以谝院蟮拈_發(fā)中參考。

1. 程序結(jié)構(gòu)

不合理的程序結(jié)構(gòu)對性能的影響有的時候是災(zāi)難性的。下面兩個函數(shù)的性能差異在字符串很長的情況下將非常巨大。函數(shù)lower1在每次循環(huán)中都計算一下字符串的長度,而這種計算并不是必要的。函數(shù)lower2則是在循環(huán)開始之前計算字符串長度,而后通過一個恒定的變量來進行條件判斷。問題的根源在于strlen函數(shù),這個函數(shù)通過循環(huán)計算字符串的長度,如果字符串比較長,那這個函數(shù)將相當(dāng)耗時。

性能優(yōu)化,我們應(yīng)該知道的更多一點

2. 過程(函數(shù))調(diào)用

我們知道在過程調(diào)用的時候會存在壓棧和出棧等操作,這些操作通常都是對內(nèi)存的操作,且過程比較復(fù)雜。也就是說,函數(shù)的調(diào)用過程是比較耗時的操作,盡量減少函數(shù)調(diào)用。

值得慶幸的是現(xiàn)代的編譯器可以對函數(shù)調(diào)用做很多優(yōu)化工作,簡單的函數(shù)調(diào)用通??梢员痪幾g器優(yōu)化調(diào)。所謂優(yōu)化調(diào)是只在機器語言(匯編語言)層面已經(jīng)沒有高級語言的函數(shù)調(diào)用了。

我們通過一個具體的例子看一下,通過C語言實現(xiàn)一個簡單的函數(shù)調(diào)用,其中函數(shù)fun_1調(diào)用函數(shù)fun_2,而函數(shù)fun_2又調(diào)用了printf。這里fun_2并沒有做什么太多的工作,只是將兩個參數(shù)相加后傳給printf。

性能優(yōu)化,我們應(yīng)該知道的更多一點

圖3 函數(shù)調(diào)用優(yōu)化

如圖所示,在gcc不做任何優(yōu)化的情況下,反匯編的代碼(圖3左下角)可以看出,整個邏輯非常清晰,只是按部就班的調(diào)用函數(shù)。但是,通過-O2優(yōu)化后,匯編代碼變得非常簡潔了(圖3右下角),通過fun_1的匯編代碼可以看出它根本沒有調(diào)用fun_2,而是直接調(diào)用的printf函數(shù)。因此,在不影響其功能的情況下,編譯器是可以優(yōu)化調(diào)函數(shù)調(diào)用的。但這不是絕對的,稍微復(fù)雜的函數(shù)調(diào)用編譯器可能就無能為力了,而此時就可能導(dǎo)致性能損耗。

3. 運算符差異

不同的運算的耗時差異也是非常巨大的,比如乘法的耗時是加法的兩三倍,而除法的耗時是加法的十倍以上。因此在訪問頻度比較高的邏輯中減少除法的使用將會明顯的提升。

在Java的HashMap實現(xiàn)中,通過位運算來計算哈希的Key,而不是通過模運算。因為模運算本身是除法運算,性能要比位運算差十倍以上。

  1. static final int hash(Object key) { 
  2.  int h; 
  3.  return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16); 

更詳細的處理邏輯請參考JDK的源代碼,本文僅僅是拋個磚 。

4. 引用與拷貝

支持類的高級語言在傳遞對象參數(shù)的時候涉及拷貝的過程,對象的拷貝也是比較消耗性能的操作。當(dāng)然,高級語言通過一種成為引用的機制實現(xiàn)了對象地址的傳遞,這樣就避免了拷貝的過程(這就是傳值與傳址的差異)。

在程序開發(fā)過程中關(guān)于性能的問題還很多,本文無法一一列舉出來。但,關(guān)鍵的問題是掌握技術(shù)的底層實現(xiàn)原理,任何其它高層的內(nèi)容都可以通過底層原理解釋的,正所謂萬變不離其宗。

責(zé)任編輯:趙寧寧 來源: 今日頭條
相關(guān)推薦

2019-06-17 06:18:27

邊緣計算物聯(lián)網(wǎng)霧計算

2020-09-25 17:44:43

人工智能 倫敦時裝學(xué)院

2010-05-20 15:29:43

優(yōu)化IIS

2015-07-17 11:12:43

IOS搜索API

2015-07-21 16:43:13

IOSUI

2024-07-29 00:00:00

C程序色彩文本

2015-12-08 16:14:04

2023-12-25 07:56:23

Linux內(nèi)存管理內(nèi)存映射

2021-10-18 10:21:28

程序員技能優(yōu)化

2021-07-14 11:13:46

線程性能優(yōu)化阿里云

2024-07-11 08:26:00

2022-06-29 10:06:27

Webpack優(yōu)化技巧前端

2009-07-09 15:09:05

JDK卸載

2012-03-27 08:49:19

Json

2009-09-14 19:44:27

LINQ To SQL

2017-09-07 15:12:42

程序員

2024-09-02 14:30:43

2017-01-15 15:13:37

Android性能優(yōu)化優(yōu)化點

2009-07-17 16:43:02

JRuby性能優(yōu)化

2023-12-29 08:29:15

QPS系統(tǒng)應(yīng)用
點贊
收藏

51CTO技術(shù)棧公眾號