自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<sub id="15x8x"></sub>

<p id="15x8x"><li id="15x8x"><pre id="15x8x"></pre></li></p>

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項目管理免費題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設(shè)置退出

Golang | 是返回Struct還是返回Struct的指針

作者：KINGYT 2021-08-02 07:57:02

網(wǎng)絡(luò) 通信技術(shù)

對于這個問題，我想大部分人的回答，肯定都是返回指針，因為這樣可以避免結(jié)構(gòu)體的拷貝，使代碼的效率更高，性能更好。

當(dāng)我們定義一個函數(shù)時，是返回結(jié)構(gòu)體呢，還是返回指向結(jié)構(gòu)體的指針呢?

對于這個問題，我想大部分人的回答，肯定都是返回指針，因為這樣可以避免結(jié)構(gòu)體的拷貝，使代碼的效率更高，性能更好。

但真的是這樣嗎?

在回答這個問題之前，我們先寫幾個示例，來確定一些基本事實：

上圖中，函數(shù)f返回的是結(jié)構(gòu)體S的指針，即一個地址，這個可以通過其匯編來確認(rèn)：

看上圖中的選中行。

第一行是調(diào)用函數(shù)f，其結(jié)果，即結(jié)構(gòu)體S的指針，或結(jié)構(gòu)體S的地址，是放到ax寄存器中返回的。

第二行用0x8(ax)，即ax中的地址加8的形式，來獲得結(jié)構(gòu)體S中a2字段的值，然后將該值和0x2相比，以進(jìn)行后續(xù)邏輯。

由此可見，返回結(jié)構(gòu)體指針的形式，確實是只傳遞了一個地址。

我們再來看下返回結(jié)構(gòu)體的情況：

這次函數(shù)f返回的是S，而不是*S，看看這樣寫其匯編是什么樣子：

上圖main函數(shù)的匯編中，通過調(diào)用函數(shù)f，初始化了main函數(shù)棧中，0x0(sp)到0x50(sp)的內(nèi)存段，該內(nèi)存段共有80個字節(jié)，正好對應(yīng)于結(jié)構(gòu)體S的大小。

在函數(shù)f返回后，sp寄存器存放的，正是函數(shù)f初始化的結(jié)構(gòu)體S的地址。

接著，我們看上圖中的選中行，該段邏輯通過runtime.duffcopy函數(shù)，將棧中內(nèi)存段0x0(sp)到0x50(sp)的值，拷貝到了內(nèi)存段0x50(sp)到0xa0(sp)的部分，即將函數(shù)f初始化的結(jié)構(gòu)體S，從內(nèi)存地址0x0(sp)，拷貝到了0x50(sp)。

然后，通過0x58(sp)，即sp中的地址加上0x58的形式，獲得拷貝后的結(jié)構(gòu)體S中，a2字段的值，最后將其和0x2比較，以進(jìn)行后續(xù)邏輯。

由上可見，當(dāng)函數(shù)返回結(jié)構(gòu)體時，確實存在著一次結(jié)構(gòu)體的拷貝操作。

對比以上兩個示例我們看到，返回指針的確會更好些，因為這樣節(jié)省了一次結(jié)構(gòu)體的拷貝操作。

但這樣性能就真的更好嗎?

寫個benchmark測試下：

執(zhí)行看下結(jié)果：

這兩個benchmark的時間幾乎是相等的，其結(jié)果并不像我們預(yù)料的那樣，返回指針的形式會更快些。

為什么呢?

看下這兩個benchmark對應(yīng)的匯編：

它們居然都被優(yōu)化成了空跑for循環(huán)了，難怪這兩個測試耗時是一樣的。

加上編譯器指令//go:noinline，防止f1/f2函數(shù)被內(nèi)聯(lián)，進(jìn)而被過度優(yōu)化：

如上圖的第9行和第14行。

再來看下測試程序的匯編，確保以上操作是有效的。

先看下函數(shù)f1及其對應(yīng)的benchmark：

再看下函數(shù)f2及其對應(yīng)的benchmark：

這次這兩個都沒有問題。

再來跑下benchmark：

這次結(jié)果顯示，f2函數(shù)，即返回結(jié)構(gòu)體形式，比f1函數(shù)，即返回指針的形式，居然快了將近5倍，意不意外?

這是為什么呢?

其實在上圖中，就有一些線索。

看BenchmarkF1那行，其最后兩列顯示，每次調(diào)用f1函數(shù)，都會有一次堆內(nèi)存分配操作，其分配內(nèi)存的大小為80字節(jié)，正好對應(yīng)于結(jié)構(gòu)體S的大小，也就是說，f1函數(shù)中結(jié)構(gòu)體S的內(nèi)存，都是在堆上分配的。

而在BenchmarkF2中，就沒有發(fā)生堆內(nèi)存的分配操作，f2函數(shù)中的結(jié)構(gòu)體S，都是在棧上分配的。

這個也可以通過上面展示的，f1/f2函數(shù)的匯編代碼看到。

f1函數(shù)的匯編是通過runtime.newobject在堆上分配內(nèi)存的，而f2函數(shù)則是直接就在棧上把內(nèi)存分配好了，并沒有調(diào)用runtime.newobject函數(shù)。

那為什么在堆上分配內(nèi)存，會比在棧上分配內(nèi)存慢這么多呢?

有兩點原因，一是在堆上分配內(nèi)存的函數(shù)runtime.newobject，其本身邏輯就比較復(fù)雜，二是堆上分配的內(nèi)存，后期還要通過gc來對其進(jìn)行內(nèi)存回收，這些邏輯加起來，遠(yuǎn)比在棧上分配內(nèi)存，外加一次拷貝操作要耗時的多。

有關(guān)go內(nèi)存是在堆上分配的，還是在棧上分配的，這個是在編譯過程中，通過逃逸分析來確定的，其主體思想是：

假設(shè)有變量v，及指向v的指針p，如果p的生命周期大于v的生命周期，則v的內(nèi)存要在堆上分配。

其實逃逸分析的具體邏輯，遠(yuǎn)比上面說的復(fù)雜，如果有興趣研究代碼，可以從下面開始入手：

當(dāng)然，我們也可以在編譯時，通過加上-m參數(shù)，來讓編譯器告訴我們，一個變量到底是分配在堆上，還是在棧上：

看上圖，f1函數(shù)中的&S{...}逃逸到了堆上，即是在堆上分配的。

以上是對80字節(jié)大小的結(jié)構(gòu)體，返回指針和返回值情況的比較，那如果結(jié)構(gòu)體字節(jié)數(shù)更小或更大會怎么樣呢?

經(jīng)過測試，1MiB字節(jié)以下，返回結(jié)構(gòu)體都更有優(yōu)勢。

那返回指針的方式是不是沒用了呢?也不是，如果你最終的結(jié)構(gòu)體，就是要存放到堆里，比如要存放到全局的map里，那返回指針優(yōu)勢就更大些，因為其省去了返回結(jié)構(gòu)體時的拷貝操作。

就這些，希望對你有所幫助。

本文轉(zhuǎn)載自微信公眾號「卯時卯刻」，可以通過以下二維碼關(guān)注。轉(zhuǎn)載本文請聯(lián)系卯時卯刻公眾號。

責(zé)任編輯：武曉燕來源：卯時卯刻

Struct 指針函數(shù)

51CTO技術(shù)棧公眾號

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營