Go多協(xié)程并發(fā)環(huán)境下的錯(cuò)誤處理
引言
在Go語(yǔ)言中,我們通常會(huì)用到panic和recover來(lái)拋出錯(cuò)誤和捕獲錯(cuò)誤,這一對(duì)操作在單協(xié)程環(huán)境下我們正常用就好了,并不會(huì)踩到什么坑。但是在多協(xié)程并發(fā)環(huán)境下,我們常常會(huì)碰到以下兩個(gè)問(wèn)題。假設(shè)我們現(xiàn)在有2個(gè)協(xié)程,我們叫它們協(xié)程A和B好了:
- 如果協(xié)程A發(fā)生了panic,協(xié)程B是否會(huì)因?yàn)閰f(xié)程A的panic而掛掉?
- 如果協(xié)程A發(fā)生了panic,協(xié)程B是否能用recover捕獲到協(xié)程A的panic?
答案分別是:會(huì)、不能。
那么下面我們來(lái)一一驗(yàn)證,并給出在具體的業(yè)務(wù)場(chǎng)景下的最佳實(shí)踐。
問(wèn)題一
- 如果協(xié)程A發(fā)生了panic,協(xié)程B是否會(huì)因?yàn)閰f(xié)程A的panic而掛掉?
為了驗(yàn)證這個(gè)問(wèn)題,我們寫(xiě)一段程序:
- package main
- import (
- "fmt"
- "time"
- )
- func main() {
- // 協(xié)程A
- go func() {
- for {
- fmt.Println("goroutine1_print")
- }
- }()
- // 協(xié)程B
- go func() {
- time.Sleep(1 * time.Second)
- panic("goroutine2_panic")
- }()
- time.Sleep(2 * time.Second)
- }
首先主協(xié)程開(kāi)啟兩個(gè)子協(xié)程A和B,A協(xié)程不停的循環(huán)打印goroutine1_print字符串;B協(xié)程在睡眠1s后,就會(huì)拋出panic(睡眠這一步為了確保在A跑起來(lái)開(kāi)始打印了之后,B才會(huì)panic),主協(xié)程睡眠2s,等待A、B子協(xié)程全部執(zhí)行完畢,主協(xié)程退出。最終打印結(jié)果如下:
- ...
- goroutine1_print
- goroutine1_print
- goroutine1_print
- goroutine1_print
- goroutine1_print
- goroutine1_print
- goroutine1_print
- goroutine1_print
- goroutine1_print
- goroutine1_print
- goroutine1_print
- goroutine1_print
- panic: goroutine2_panicgoroutine1_print
- goroutine1_print
- goroutine goroutine1_print
- 19goroutine1_print
- goroutine1_print
- goroutine1_print
- goroutine1_print
- [runninggoroutine1_print
- ]:
- goroutine1_print
- goroutine1_print
- goroutine1_print
- main.main.func2()
- /Users/jiangbaiyan/go/src/awesomeProject/main.go:18 +0x46
- created by main.main
- /Users/jiangbaiyan/go/src/awesomeProject/main.go:16 +0x4d
我們可以看到,在協(xié)程B發(fā)生panic之前,協(xié)程A一直在打印字符串;然后協(xié)程A和panic交替打印字符串,最后主協(xié)程與協(xié)程A、B全部退出。所以我們可以看到,一個(gè)協(xié)程panic之后,是會(huì)導(dǎo)致所有的協(xié)程全部掛掉的,程序會(huì)整體退出,到這里我們就驗(yàn)證了第一個(gè)問(wèn)題的答案。
至于panic和協(xié)程A交替打印的原因,可能是因?yàn)閜anic也需要打印字符串。因?yàn)榇蛴∫彩切枰獣r(shí)間的,當(dāng)我們執(zhí)行panic這一行代碼的時(shí)候,到panic真正觸發(fā)所有協(xié)程掛掉,是需要一定的時(shí)間的(盡管這個(gè)時(shí)間很短暫),所以再這一小段時(shí)間內(nèi),我們會(huì)看到交替打印的現(xiàn)象。
問(wèn)題二
- 如果協(xié)程A發(fā)生了panic,其他協(xié)程是否能用recover捕獲到協(xié)程A的panic?
還是類似上面那段代碼,我們還可以再精簡(jiǎn)一下:
- package main
- import (
- "fmt"
- "time"
- )
- func main() {
- defer func() {
- if e := recover(); e != nil {
- fmt.Println("recover_panic")
- }
- }()
- go func() {
- panic("goroutine2_panic")
- }()
- time.Sleep(2 * time.Second)
- }
我們這次只開(kāi)啟一個(gè)協(xié)程,并在主協(xié)程中加入了recover,希望它能夠捕獲到子協(xié)程中的panic,但是結(jié)果未能如愿:
- panic: goroutine2_panic
- goroutine 6 [running]:
- main.main.func2()
- /Users/jiangbaiyan/go/src/awesomeProject/main.go:17 +0x39
- created by main.main
- /Users/jiangbaiyan/go/src/awesomeProject/main.go:16 +0x57
- Process finished with exit code 2
我們看到,recover并沒(méi)有生效。所以,哪個(gè)協(xié)程發(fā)生了panic,我們就需要在哪個(gè)協(xié)程recover,我們改成這樣:
- package main
- import (
- "fmt"
- "time"
- )
- func main() {
- go func() {
- defer func() {
- if e := recover(); e != nil {
- fmt.Println("recover_panic")
- }
- }()
- panic("goroutine2_panic")
- }()
- time.Sleep(2 * time.Second)
- }
結(jié)果成功打印recover_panic字符串:
- recover_panic
- Process finished with exit code 0
所以我們的答案也得到了驗(yàn)證:協(xié)程A發(fā)生panic,協(xié)程B無(wú)法recover到協(xié)程A的panic,只有協(xié)程自己內(nèi)部的recover才能捕獲自己拋出的panic。
最佳實(shí)踐
我們先假設(shè)有這樣一個(gè)場(chǎng)景,我們要開(kāi)發(fā)一個(gè)客戶端,這個(gè)客戶端需要調(diào)用2個(gè)服務(wù),這2個(gè)服務(wù)沒(méi)有任何先后順序的依賴,所以我們可以開(kāi)啟2個(gè)goroutine,通過(guò)并發(fā)調(diào)用這兩個(gè)服務(wù)來(lái)獲得性能提升。那么這個(gè)時(shí)候我們剛才所談到的問(wèn)題一就成了問(wèn)題。
通常來(lái)講,我們不希望其中一個(gè)服務(wù)調(diào)用失敗,另一個(gè)服務(wù)調(diào)用也跟著失敗,而是要繼續(xù)執(zhí)行完其他幾個(gè)服務(wù)調(diào)用邏輯,這個(gè)時(shí)候我們?cè)撛趺崔k呢?
聰明的你一定會(huì)想到,我在每個(gè)協(xié)程內(nèi)部編寫(xiě)一個(gè)recover語(yǔ)句,讓他接住每個(gè)協(xié)程自己可能會(huì)發(fā)生的panic,就能夠解決一個(gè)協(xié)程panic而導(dǎo)致所有協(xié)程掛掉的問(wèn)題了。我們編寫(xiě)如下代碼,這就是在業(yè)務(wù)開(kāi)發(fā)中,結(jié)合問(wèn)題二解決問(wèn)題一的最佳實(shí)踐:
- // 并發(fā)調(diào)用服務(wù),每個(gè)handler都會(huì)傳入一個(gè)調(diào)用邏輯函數(shù)
- func GoroutineNotPanic(handlers ...func() error) (err error) {
- var wg sync.WaitGroup
- // 假設(shè)我們要調(diào)用handlers這么多個(gè)服務(wù)
- for _, f := range handlers {
- wg.Add(1)
- // 每個(gè)函數(shù)啟動(dòng)一個(gè)協(xié)程
- go func(handler func() error) {
- defer func() {
- // 每個(gè)協(xié)程內(nèi)部使用recover捕獲可能在調(diào)用邏輯中發(fā)生的panic
- if e := recover(); e != nil {
- // 某個(gè)服務(wù)調(diào)用協(xié)程報(bào)錯(cuò),可以在這里打印一些錯(cuò)誤日志
- }
- wg.Done()
- }()
- // 取第一個(gè)報(bào)錯(cuò)的handler調(diào)用邏輯,并最終向外返回
- e := handler()
- if err == nil && e != nil {
- err = e
- }
- }(f)
- }
- wg.Wait()
- return
- }
以上方法調(diào)用示例:
- // 調(diào)用示例
- func main() {
- // 調(diào)用邏輯1
- aRpc := func() error {
- panic("rpc logic A panic")
- return nil
- }
- // 調(diào)用邏輯2
- bRpc := func() error {
- fmt.Println("rpc logic B")
- return nil
- }
- err := GoroutineNotPanic(aRpc, bRpc)
- if err != nil {
- fmt.Println(err)
- }
- }
這樣我們就實(shí)現(xiàn)了一個(gè)通用的并發(fā)處理邏輯,每次調(diào)用我們只需要把業(yè)務(wù)邏輯的函數(shù)傳入即可,不用每次自己?jiǎn)为?dú)編寫(xiě)一套并發(fā)控制邏輯;同時(shí)調(diào)用邏輯2就不會(huì)因?yàn)檎{(diào)用邏輯1的panic而掛掉了,容錯(cuò)率更高。在業(yè)務(wù)開(kāi)發(fā)中我們可以參考這種實(shí)現(xiàn)方式~
本文轉(zhuǎn)載自微信公眾號(hào)「NoSay」,可以通過(guò)以下二維碼關(guān)注。轉(zhuǎn)載本文請(qǐng)聯(lián)系NoSay公眾號(hào)。