簡單的 For 循環(huán)也會踩的坑
本文轉(zhuǎn)載自微信公眾號「crossoverJie」,作者crossoverJie。轉(zhuǎn)載本文請聯(lián)系crossoverJie公眾號。
前言
最近實現(xiàn)某個業(yè)務(wù)時,需要讀取數(shù)據(jù)然后再異步處理;在 Go 中實現(xiàn)起來自然就比較簡單,偽代碼如下:
- list := []*Demo{{"a"}, {"b"}}
- for _, v := range list {
- go func() {
- fmt.Println("name="+v.Name)
- }()
- }
- type Demo struct {
- Name string
- }
看似非常簡單幾行代碼卻和我們的預(yù)期不符,打印之后輸出的是:
- name=b
- name=b
并不是我們預(yù)期的:
- name=a
- name=b
坑一
由于寫 go 的資歷尚淺、道行更是淺薄,這 bug 我硬是找了個把小時;剛開始還以為是數(shù)據(jù)源的問題,經(jīng)歷了好幾輪自我懷疑??傊^程先不表,先看看如何修復(fù)這個問題。
首先第一種辦法是使用臨時變量:
- list := []*Demo{{"a"}, {"b"}}
- for _, v := range list {
- temp:=v
- go func() {
- fmt.Println("name="+temp.Name)
- }()
- }
這樣便可正確輸出,其實從這種寫法中也能看出問題的端倪。
在第一種沒有使用臨時變量時,主協(xié)程很快就運行完畢,這時候打印的子協(xié)程可能還沒運行;當開始運行的時候,這里的 v 已經(jīng)被最后一個賦值了。
所以這里打印的一直都是最后一個變量。
而使用臨時變量會將當前遍歷的值拷貝一份,自然就不會互相影響了。
當然除了臨時變量也可使用閉包解決。
- list := []*Demo{{"a"}, {"b"}}
- for _, v := range list {
- go func(temp *Demo) {
- fmt.Println("name="+temp.Name)
- }(v)
- }
將參數(shù)通過閉包傳遞時,每個 goroutine 都會在自己的棧中存放一份參數(shù)的拷貝,這樣也能區(qū)分了。
坑二
與之類似的還有第二個坑:
- list2 := []Demo{{"a"}, {"b"}}
- var alist []*Demo
- for _, test := range list2 {
- alist = append(alist, &test)
- }
- fmt.Println(alist[0].Name, alist[1].Name)
這段代碼與我們預(yù)期不不符:
- b b
但我們稍加修改就可以了:
- list2 := []Demo{{"a"}, {"b"}}
- var alist []Demo
- for _, test := range list2 {
- fmt.Printf("addr=%p\n", &test)
- alist = append(alist, test)
- }
- fmt.Println(alist[0].Name, alist[1].Name)
- addr=0xc000010240
- addr=0xc000010240
- a b
順便打印了內(nèi)存地址,其實從結(jié)果中大概就能猜到原因;每次遍歷打印的內(nèi)存地址都是相同,所以如果我們存放的是指針,本質(zhì)上存儲的都是同一塊內(nèi)存地址的內(nèi)容,所以值相同。
而如果我們只存儲值,不存指針自然也不會有這個問題。
但如果想使用指針如何處理呢?
- list2 := []Demo{{"a"}, {"b"}}
- var alist []*Demo
- for _, test := range list2 {
- temp := test
- //fmt.Printf("addr=%p\n", &test)
- alist = append(alist, &temp)
- }
- fmt.Println(alist[0].Name, alist[1].Name)
也簡單,同樣的使用臨時變量即可。
通過官方源碼可以得知,for range 只是語法糖,本質(zhì)上也是 for 循環(huán);因為每次都是對同一個對象遍歷賦值,所以便會出現(xiàn)這樣的“烏龍”。
defer 的坑
for 循環(huán) + defer 也是組合坑(雖然不推薦這么用),還是先來看個例子:
- // demo1
- func main() {
- a := []int{1, 2, 3}
- for _, v := range a {
- defer fmt.Println(v)
- }
- }
- // demo2
- func main() {
- a := []int{1, 2, 3}
- for _, v := range a {
- defer func() {
- fmt.Println(v)
- }()
- }
- }
分別輸出:
- //demo1
- 3
- 2
- 1
- //demo2
- 3
- 3
- 3
demo1的結(jié)果很好理解,defer 可以理解為將執(zhí)行語句放入到棧中,所以呈現(xiàn)的結(jié)果是先進后出。
而demo2中,由于是閉包,閉包對變量 v 持有的是引用,所以在最終延遲執(zhí)行時 v 已經(jīng)被最后一個值賦值,所以打印出來都是相同的。
解決方法與上文類似,傳入?yún)?shù)即可解決:
- for _, v := range a {
- defer func(v int) {
- fmt.Println(v)
- }(v)
- }
這類細節(jié)問題日常開發(fā)大概率是碰不上的,最有可能遇到的就是面試了,所以多了解了解也沒壞處。
總結(jié)
類似于第一種情況在 for 循環(huán)中 goroutine 調(diào)用,我覺得 IDE 完全是可以做到提醒的;比如 IDEA 中就把大部分認為可能發(fā)的錯誤包含進去,期待后續(xù) goland 的更新。
但其實這幾種錯誤官方博客已經(jīng)提醒過了。
圖片https://github.com/golang/go/wiki/CommonMistakes#using-reference-to-loop-iterator-variable只是大部分人估計都沒去看過,這事之后我也得花時間好好閱讀下。