面試官:請(qǐng)說(shuō)一下如何優(yōu)化結(jié)構(gòu)體性能?
?前言
之前分享過(guò)2篇結(jié)構(gòu)體文章:10秒改struct性能直接提升15%,產(chǎn)品姐姐都夸我好棒? 和 ??Go語(yǔ)言空結(jié)構(gòu)體這3種妙用,你知道嗎??? 得到了大家的好評(píng)。
這篇繼續(xù)分享進(jìn)階內(nèi)容:
結(jié)構(gòu)體的定義,大家都很熟悉,想要定義出更節(jié)省內(nèi)存空間的結(jié)構(gòu)體,可不是一件簡(jiǎn)單的事。
我們必須掌握Go的結(jié)構(gòu)體內(nèi)存對(duì)齊機(jī)制,才能做出相應(yīng)的優(yōu)化:節(jié)省內(nèi)存并提高性能。
先來(lái)看個(gè)例子
下面定義兩個(gè)結(jié)構(gòu)體,字段都一樣,只是部分字段稍微調(diào)整了一下順序。
但輸出的結(jié)果卻完全不同:一個(gè)順序調(diào)整就節(jié)省了8個(gè)字節(jié),太神奇了。
為什么bad占用24字節(jié),而good卻只占用16字節(jié)呢?
想要解開(kāi)這個(gè)問(wèn)題,我們得先來(lái)學(xué)習(xí)一下內(nèi)存對(duì)齊機(jī)制,然后再來(lái)進(jìn)一步分析。
原理講解
基本概念
為了能讓CPU可以更快的存儲(chǔ)、讀取到各個(gè)字段,Go編譯器會(huì)幫我們把結(jié)構(gòu)體做數(shù)據(jù)的對(duì)齊。
所謂的數(shù)據(jù)對(duì)齊,是指內(nèi)存地址的大小是所存儲(chǔ)數(shù)據(jù)大小的整數(shù)倍(按字節(jié)為單位),以便CPU可以一次將該數(shù)據(jù)從內(nèi)存中讀取出來(lái),減少了讀取次數(shù)。
編譯器通過(guò)在結(jié)構(gòu)體的各個(gè)字段之間填充一些空白,來(lái)達(dá)到對(duì)齊的目的。
CPU訪問(wèn)內(nèi)存
CPU 訪問(wèn)內(nèi)存時(shí),并不是逐個(gè)字節(jié)訪問(wèn),而是以機(jī)器字(word)為單位進(jìn)行訪問(wèn)。
比如 64位CPU的字長(zhǎng)(word size)為8bytes,那么CPU訪問(wèn)內(nèi)存的單位也是8字節(jié),每次加載的內(nèi)存數(shù)據(jù)也是固定的若干字長(zhǎng),如8words(64bytes)、16words(128bytes)等
對(duì)齊系數(shù)
不同硬件平臺(tái)占用的大小和對(duì)齊值都可能是不一樣的,每個(gè)特定平臺(tái)上的編譯器都有自己的默認(rèn)"對(duì)齊系數(shù)",32位系統(tǒng)對(duì)齊系數(shù)是4,64位系統(tǒng)對(duì)齊系數(shù)是8
不同類型的對(duì)齊系數(shù)也可能不一樣,使用Go?語(yǔ)言中的unsafe.Alignof?函數(shù)可以返回相應(yīng)類型的對(duì)齊系數(shù),對(duì)齊系數(shù)都符合2^n這個(gè)規(guī)律,最大也不會(huì)超過(guò)8
對(duì)齊原則
- 結(jié)構(gòu)體變量中成員的偏移量必須是成員大小的整數(shù)倍
- 整個(gè)結(jié)構(gòu)體的內(nèi)存大小必須是最大字節(jié)的整數(shù)倍(結(jié)構(gòu)體的內(nèi)存占用是1/4/8/16byte…)
案例分析
BadSt結(jié)構(gòu)體,占用24個(gè)字節(jié)
分析過(guò)程:
- 字段A 4字節(jié):先計(jì)算偏移量,最開(kāi)頭下標(biāo)為0,0%4=0,正好整除,先占用4個(gè)字節(jié);
- 字段B 8字節(jié):下標(biāo)4-7,對(duì)8都不能整除,則填充空白,下標(biāo)8可以整除,所以下標(biāo)8-15 8個(gè)字節(jié)為字段B的存儲(chǔ)使用;
- 字段C 1字節(jié):下標(biāo)16,對(duì)1可以整除,所以下標(biāo)16則用作字段C的存儲(chǔ);
- 最后,該結(jié)構(gòu)體字段最大字節(jié)為8且目前已占用17字節(jié),要保證是整數(shù)倍,所以最后面需要填充7個(gè)字節(jié),占滿24字節(jié),才能滿足條件(對(duì)齊原則2)。
GoodSt結(jié)構(gòu)體,占用16個(gè)字節(jié)
分析過(guò)程:
- 字段A 4字節(jié):先計(jì)算偏移量,最開(kāi)頭下標(biāo)為0,0%4=0,正好整除,先占用4個(gè)字節(jié);
- 字段C 1字節(jié):下標(biāo)4,對(duì)1可以整除,所以下標(biāo)4則用作字段C的存儲(chǔ);
- 字段B 8字節(jié):下標(biāo)5-7,對(duì)8都不能整除,則填充空白,下標(biāo)8可以整除,所以下標(biāo)8-15 8個(gè)字節(jié)為字段B的存儲(chǔ)使用;
- 最后,該結(jié)構(gòu)體字段最大字節(jié)為8且目前已占用16字節(jié),正好是整數(shù)倍,所以后面不再需要填充空白了。
總結(jié)
通過(guò)上文的原理講解和案例分析,我們發(fā)現(xiàn)內(nèi)存對(duì)齊機(jī)制并不復(fù)雜。
可以簡(jiǎn)單理解為:將對(duì)齊系數(shù)小的字段,盡可能放在一起,盡量減少空白填充。
掌握了內(nèi)存對(duì)齊機(jī)制后,結(jié)構(gòu)體Struct的優(yōu)化,調(diào)整下字段順序,效果立竿見(jiàn)影。內(nèi)存對(duì)齊其實(shí)就是典型的空間換時(shí)間的方式,來(lái)達(dá)到優(yōu)化的目的。牢記對(duì)齊原則,對(duì)實(shí)際場(chǎng)景進(jìn)行分析,減少空白填充。
本文轉(zhuǎn)載自微信公眾號(hào)「 程序員升級(jí)打怪之旅」,作者「王中陽(yáng)Go」,可以通過(guò)以下二維碼關(guān)注。
轉(zhuǎn)載本文請(qǐng)聯(lián)系「 程序員升級(jí)打怪之旅」公眾號(hào)。