自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

使用 Go defer 要小心這 2 個雷區(qū)!

開發(fā) 后端
大家擔心如果循環(huán)過大 defer 鏈表會巨長,不夠 “精益求精”。又或是猜想會不會 Go defer 的設計和 Redis 數(shù)據(jù)結構設計類似,自己做了優(yōu)化,其實沒啥大影響?

[[395204]]

大家好,我是煎魚。

在 Go 語言中 defer 是一個非常有意思的關鍵字特性。例子如下:

  1. package main 
  2.  
  3. import "fmt" 
  4.  
  5. func main() { 
  6.  defer fmt.Println("煎魚了"
  7.  
  8.  fmt.Println("腦子進"

輸出結果是:

  1. 腦子進 
  2. 煎魚了 

在前幾天我的讀者群內有小伙伴討論起了下面這個問題:

讀者群的聊天截圖

簡單來講,問題就是針對在 for 循環(huán)里搞 defer 關鍵字,是否會造成什么性能影響?

因為在 Go 語言的底層數(shù)據(jù)結構設計上 defer 是鏈表的數(shù)據(jù)結構:

defer 基本底層結構

大家擔心如果循環(huán)過大 defer 鏈表會巨長,不夠 “精益求精”。又或是猜想會不會 Go defer 的設計和 Redis 數(shù)據(jù)結構設計類似,自己做了優(yōu)化,其實沒啥大影響?

今天這篇文章,我們就來探索循環(huán) Go defer,造成底層鏈表過長會不會帶來什么問題,若有,具體有什么影響?

開始吸魚之路。

defer 性能優(yōu)化 30%

在早年 Go1.13 時曾經(jīng)對 defer 進行了一輪性能優(yōu)化,在大部分場景下 提高了 defer 30% 的性能:

Go defer 1.13 優(yōu)化記錄

我們來回顧一下 Go1.13 的變更,看看 Go defer 優(yōu)化在了哪里,這是問題的關鍵點。

以前和現(xiàn)在對比

在 Go1.12 及以前,調用 Go defer 時匯編代碼如下:

  1. 0x0070 00112 (main.go:6)    CALL    runtime.deferproc(SB) 
  2.  0x0075 00117 (main.go:6)    TESTL    AX, AX 
  3.  0x0077 00119 (main.go:6)    JNE    137 
  4.  0x0079 00121 (main.go:7)    XCHGL    AX, AX 
  5.  0x007a 00122 (main.go:7)    CALL    runtime.deferreturn(SB) 
  6.  0x007f 00127 (main.go:7)    MOVQ    56(SP), BP 

在 Go1.13 及以后,調用 Go defer 時匯編代碼如下:

  1. 0x006e 00110 (main.go:4) MOVQ AX, (SP) 
  2. 0x0072 00114 (main.go:4) CALL runtime.deferprocStack(SB) 
  3. 0x0077 00119 (main.go:4) TESTL AX, AX 
  4. 0x0079 00121 (main.go:4) JNE 139 
  5. 0x007b 00123 (main.go:7) XCHGL AX, AX 
  6. 0x007c 00124 (main.go:7) CALL runtime.deferreturn(SB) 
  7. 0x0081 00129 (main.go:7) MOVQ 112(SP), BP 

從匯編的角度來看,像是原本調用 runtime.deferproc 方法改成了調用 runtime.deferprocStack 方法,難道是做了什么優(yōu)化?

我們抱著疑問繼續(xù)看下去。

defer 最小單元:_defer

相較于以前的版本,Go defer 的最小單元 _defer 結構體主要是新增了 heap 字段:

  1. type _defer struct { 
  2.  siz     int32 
  3.  siz     int32 // includes both arguments and results 
  4.  started bool 
  5.  heap    bool 
  6.  sp      uintptr // sp at time of defer 
  7.  pc      uintptr 
  8.  fn      *funcval 
  9.  ... 

該字段用于標識這個 _defer 是在堆上,還是在棧上進行分配,其余字段并沒有明確變更,那我們可以把聚焦點放在 defer 的堆棧分配上了,看看是做了什么事。

deferprocStack

  1. func deferprocStack(d *_defer) { 
  2.  gp := getg() 
  3.  if gp.m.curg != gp { 
  4.   throw("defer on system stack"
  5.  } 
  6.   
  7.  d.started = false 
  8.  d.heap = false 
  9.  d.sp = getcallersp() 
  10.  d.pc = getcallerpc() 
  11.  
  12.  *(*uintptr)(unsafe.Pointer(&d._panic)) = 0 
  13.  *(*uintptr)(unsafe.Pointer(&d.link)) = uintptr(unsafe.Pointer(gp._defer)) 
  14.  *(*uintptr)(unsafe.Pointer(&gp._defer)) = uintptr(unsafe.Pointer(d)) 
  15.  
  16.  return0() 

這一塊代碼挺常規(guī)的,主要是獲取調用 defer 函數(shù)的函數(shù)棧指針、傳入函數(shù)的參數(shù)具體地址以及PC(程序計數(shù)器),這塊在前文 《深入理解 Go defer》 有詳細介紹過,這里就不再贅述了。

這個 deferprocStack 特殊在哪呢?

可以看到它把 d.heap 設置為了 false,也就是代表 deferprocStack 方法是針對將 _defer 分配在棧上的應用場景的。

deferproc

問題來了,它又在哪里處理分配到堆上的應用場景呢?

  1. func newdefer(siz int32) *_defer { 
  2.  ... 
  3.  d.heap = true 
  4.  d.link = gp._defer 
  5.  gp._defer = d 
  6.  return d 

具體的 newdefer 是在哪里調用的呢,如下:

  1. func deferproc(siz int32, fn *funcval) { // arguments of fn follow fn 
  2.  ... 
  3.  sp := getcallersp() 
  4.  argp := uintptr(unsafe.Pointer(&fn)) + unsafe.Sizeof(fn) 
  5.  callerpc := getcallerpc() 
  6.  
  7.  d := newdefer(siz) 
  8.  ... 

非常明確,先前的版本中調用的 deferproc 方法,現(xiàn)在被用于對應分配到堆上的場景了。

小結

  • 可以確定的是 deferproc 并沒有被去掉,而是流程被優(yōu)化了。
  • Go 編譯器會根據(jù)應用場景去選擇使用 deferproc 還是 deferprocStack 方法,他們分別是針對分配在堆上和棧上的使用場景。

優(yōu)化在哪兒

主要優(yōu)化在于其 defer 對象的堆棧分配規(guī)則的改變,措施是:編譯器對 defer 的 for-loop 迭代深度進行分析。

  1. // src/cmd/compile/internal/gc/esc.go 
  2. case ODEFER: 
  3.  if e.loopdepth == 1 { // top level 
  4.   n.Esc = EscNever // force stack allocation of defer record (see ssa.go) 
  5.   break 
  6.  } 

如果 Go 編譯器檢測到循環(huán)深度(loopdepth)為 1,則設置逃逸分析的結果,將分配到棧上,否則分配到堆上。

  1. // src/cmd/compile/internal/gc/ssa.go 
  2. case ODEFER: 
  3.  d := callDefer 
  4.  if n.Esc == EscNever { 
  5.   d = callDeferStack 
  6.  } 
  7.  s.call(n.Left, d) 

以此免去了以前頻繁調用 systemstack、mallocgc 等方法所帶來的大量性能開銷,來達到大部分場景提高性能的作用。

循環(huán)調用 defer

回到問題本身,知道了 defer 優(yōu)化的原理后。那 “循環(huán)里搞 defer 關鍵字,是否會造成什么性能影響?”

最直接的影響就是這大約 30% 的性能優(yōu)化直接全無,且由于姿勢不正確,理論上 defer 既有的開銷(鏈表變長)也變大,性能變差。

因此我們要避免以下兩種場景的代碼:

  • 顯式循環(huán):在調用 defer 關鍵字的外層有顯式的循環(huán)調用,例如:for-loop 語句等。
  • 隱式循環(huán):在調用 defer 關鍵字有類似循環(huán)嵌套的邏輯,例如:goto 語句等。

顯式循環(huán)

第一個例子是直接在代碼的 for 循環(huán)中使用 defer 關鍵字:

  1. func main() { 
  2.  for i := 0; i <= 99; i++ { 
  3.   defer func() { 
  4.    fmt.Println("腦子進煎魚了"
  5.   }() 
  6.  } 

這個也是最常見的模式,無論是寫爬蟲時,又或是 Goroutine 調用時,不少人都喜歡這么寫。

這屬于顯式的調用了循環(huán)。

隱式循環(huán)

第二個例子是在代碼中使用類似 goto 關鍵字:

  1. func main() { 
  2.  i := 1 
  3. food: 
  4.  defer func() {}() 
  5.  if i == 1 { 
  6.   i -= 1 
  7.   goto food 
  8.  } 

這種寫法比較少見,因為 goto 關鍵字有時候甚至會被列為代碼規(guī)范不給使用,主要是會造成一些濫用,所以大多數(shù)就選擇其實方式實現(xiàn)邏輯。

這屬于隱式的調用,造成了類循環(huán)的作用。

總結

顯然,Defer 在設計上并沒有說做的特別的奇妙。他主要是根據(jù)實際的一些應用場景進行了優(yōu)化,達到了較好的性能。

雖然本身 defer 會帶一點點開銷,但并沒有想象中那么的不堪使用。除非你 defer 所在的代碼是需要頻繁執(zhí)行的代碼,才需要考慮去做優(yōu)化。

否則沒有必要過度糾結,在實際上,猜測或遇到性能問題時,看看 PProf 的分析,看看 defer 是不是在相應的 hot path 之中,再進行合理優(yōu)化就好。

 

所謂的優(yōu)化,可能也只是去掉 defer 而采用手動執(zhí)行,并不復雜。在編碼時避免踩到 defer 的顯式和隱式循環(huán)這 2 個雷區(qū)就可以達到性能最大化了。

 

責任編輯:武曉燕 來源: 腦子進煎魚了
相關推薦

2025-03-12 00:22:00

2013-06-25 09:52:32

GoGo語言Go編程

2024-01-07 23:11:16

defer?Go語言

2022-08-23 08:53:31

Go項目語言

2020-02-05 14:42:52

網(wǎng)絡安全IT安全漏洞

2018-12-04 14:00:41

協(xié)程編程模式PHP

2021-03-31 22:51:51

手機爆炸充電

2019-04-26 12:29:04

云遷移數(shù)據(jù)

2023-07-11 08:46:38

閉包函數(shù)Rust

2021-04-22 10:14:46

Redis數(shù)據(jù)庫命令

2020-08-06 08:27:21

JavaScript概念語言

2021-03-30 15:10:50

Java序列化

2021-10-18 21:41:10

Go程序員 Defer

2021-06-07 23:19:44

Golang語言 Defer

2022-06-08 10:40:18

顯卡礦卡暴跌

2010-04-22 10:13:46

Google英特爾

2011-08-09 13:43:48

2010-12-01 11:08:43

職場

2013-09-03 10:18:16

虛擬網(wǎng)絡VMware思科

2018-09-26 07:33:31

點贊
收藏

51CTO技術棧公眾號