先聊聊「內(nèi)存分配」,再聊聊Go的「逃逸分析」
要搞清楚GO的逃逸分析一定要先搞清楚內(nèi)存分配和堆棧:
內(nèi)存分配既可以分配到堆中,也可以分配到棧中。
什么樣的數(shù)據(jù)會被分配到棧中,什么樣的數(shù)據(jù)又會被分配到堆中呢?
GO語言是如何進行內(nèi)存分配的呢?其設(shè)計初衷和實現(xiàn)原理是什么呢?
我們先來聊一下內(nèi)存管理、堆、棧的知識點:
內(nèi)存管理
內(nèi)存管理主要包括兩個動作:分配與釋放。逃逸分析就是服務(wù)于內(nèi)存分配。
棧
在Go中,棧的內(nèi)存是由編譯器自動進行分配和釋放,棧區(qū)往往存儲著函數(shù)參數(shù)、局部變量和調(diào)用函數(shù)幀,它們隨著函數(shù)的創(chuàng)建而分配,函數(shù)的退出而銷毀。
一個goroutine對應(yīng)一個棧,棧是調(diào)用棧(call stack)的簡稱。一個棧通常又包含了許多棧幀(stack frame),它描述的是函數(shù)之間的調(diào)用關(guān)系,每一幀對應(yīng)一個尚未返回的函數(shù)調(diào)用,它本身也是以棧形式存放數(shù)據(jù)。
堆
與棧不同的是,應(yīng)用程序在運行時只會存在一個堆。
我們可以簡單理解為:我們用GO語言開發(fā)過程中,要考慮的內(nèi)存管理只是針對堆內(nèi)存而言的。
程序在運行期間可以主動從堆上申請內(nèi)存,這些內(nèi)存通過Go的內(nèi)存分配器分配,并由垃圾收集器回收。
堆和棧的對比
加鎖
- 棧不需要加鎖:棧是每個goroutine獨有的,這就意味著棧上的內(nèi)存操作是不需要加鎖的。
- 堆有時需要加鎖:堆上的內(nèi)存,有時需要加鎖防止多線程沖突
延伸知識點:為什么堆上的內(nèi)存有時需要加鎖?而不是一直需要加鎖呢?
因為Go的內(nèi)存分配策略學(xué)習(xí)了TCMalloc的線程緩存思想,他為每個處理器P分配了一個mcache,從mcache分配內(nèi)存也是無鎖的
性能
- 棧內(nèi)存管理 性能好:棧上的內(nèi)存,它的分配與釋放非常高效的。簡單地說,它只需要兩個CPU指令:一個是分配入棧,另外一個是棧內(nèi)釋放。只需要借助于棧相關(guān)寄存器即可完成。
- 堆內(nèi)存管理 性能差:對于程序堆上的內(nèi)存回收,還需要通過標記清除階段,例如Go采用的三色標記法。
緩存策略
- 棧緩存性能更好
- 堆緩存性能較差
原因是:棧內(nèi)存能更好地利用CPU的緩存策略,因為棧空間相較于堆來說是更連續(xù)的。
逃逸分析
上面說了這么多堆和棧的知識點,目的是為了讓大家更好的理解逃逸分析。
正如上面講的,相比于把內(nèi)存分配到堆中,分配到棧中優(yōu)勢更明顯。
Go語言也是這么做的:Go編譯器會盡可能將變量分配到到棧上。
但是,當編譯器無法證明函數(shù)返回的變量有沒有被引用時,編譯器就必須在堆上分配該變量,以此避免懸掛指針(dangling pointer)的問題。
另外,如果局部變量占用內(nèi)存非常大,也會將其分配在堆上。
Go是如何確定內(nèi)存是分配到棧上還是堆上的呢?
答案就是:逃逸分析。
編譯器通過逃逸分析技術(shù)去選擇堆或者棧,逃逸分析的基本思想如下:檢查變量的生命周期是否是完全可知的,如果通過檢查,則在棧上分配。否則,就是所謂的逃逸,必須在堆上進行分配。
逃逸分析原則
Go語言雖然沒有明確說明逃逸分析原則,但是有以下幾點準則,是可以參考的。
- 不同于JAVA JVM的運行時逃逸分析,Go的逃逸分析是在編譯期完成的:編譯期無法確定的參數(shù)類型必定放到堆中;
- 如果變量在函數(shù)外部存在引用,則必定放在堆中;
- 如果變量占用內(nèi)存較大時,則優(yōu)先放到堆中;
- 如果變量在函數(shù)外部沒有引用,則優(yōu)先放到棧中;
逃逸分析舉例
我們使用這個命令來查看逃逸分析的結(jié)果:go build -gcflags '-m -m -l'
1.參數(shù)是interface類型
運行結(jié)果
原因分析
因為Println(a ...interface{})的參數(shù)是interface{}類型,編譯期無法確定其具體的參數(shù)類型,所以內(nèi)存分配到堆中。
2. 變量在函數(shù)外部有引用
運行結(jié)果
原因分析
變量a在函數(shù)外部存在引用。
我們來分析一下執(zhí)行過程:當函數(shù)執(zhí)行完畢,對應(yīng)的棧幀就被銷毀,但是引用已經(jīng)被返回到函數(shù)之外。如果這時外部通過引用地址取值,雖然地址還在,但是這塊內(nèi)存已經(jīng)被釋放回收了,這就是非法內(nèi)存。
為了避免上述非法內(nèi)存的情況,在這種情況下變量的內(nèi)存分配必須分配到堆上。
3. 變量內(nèi)存占用較大
運行結(jié)果
原因分析
我們定義了一個容量為10000的int類型切片,發(fā)生了逃逸,內(nèi)存分配到了堆上(heap)。
注意看:
我們再簡單修改一下代碼,將切片的容量和長度修改為1,再次查看逃逸分析的結(jié)果,我們發(fā)現(xiàn),沒有發(fā)生逃逸,內(nèi)存默認分類到了棧上。
所以,當變量占用內(nèi)存較大時,會發(fā)生逃逸分析,將內(nèi)存分配到堆上。
4. 變量大小不確定時
我們再簡單修改一下上面的代碼:
運行結(jié)果
原因分析
我們通過控制臺的輸出結(jié)果可以很明顯的看出:發(fā)生了逃逸,分配到了heap堆中。
原因是這樣的:
我們雖然在代碼段中給變量 l 賦值了1,但是編譯期間只能識別到初始化int類型切片時,傳入的長度和容量是變量l,編譯期并不能確定變量l的值,所以發(fā)生了逃逸,會把內(nèi)存分配到堆中。
思考題
好了,我們舉了4個逃逸分析的經(jīng)典案例,相信聰明的你已經(jīng)理解了逃逸分析的作用和發(fā)生逃逸的場景。
我們來想一下,在理解逃逸分析的原理之后,在開發(fā)的過程中如何更好的編碼,進而提高程序的效率,更好的利用內(nèi)存呢?
如何實踐?
理解逃逸分析一定能幫助我們寫出更好的程序。知道變量分配在棧堆之上的差別后,我們就要盡量寫出分配在棧上的代碼。因為堆上的變量變少后,可以減輕內(nèi)存分配的開銷,減小GC的壓力,提高程序的運行速度。
但是我們也要有過猶不及的指導(dǎo)思想。
我認為沒有一成不變的開發(fā)模式,我們一定是在不斷的需求變化,業(yè)務(wù)變化中求得平衡的:
舉個例子
舉個日常開發(fā)中函數(shù)傳參的例子:
有些場景下我們不應(yīng)該傳遞結(jié)構(gòu)體指針,而應(yīng)該直接傳遞結(jié)構(gòu)體。
為什么會這樣呢?雖然直接傳遞結(jié)構(gòu)體需要值拷貝,但是這是在棧上完成的操作,開銷遠比變量逃逸后動態(tài)地在堆上分配內(nèi)存少的多。
當然這種做法不是絕對的,要根據(jù)場景去分析:
- 如果結(jié)構(gòu)體較大,傳遞結(jié)構(gòu)體指針更合適,因為指針類型相比值類型能節(jié)省大量的內(nèi)存空間
- 如果結(jié)構(gòu)體較小,傳遞結(jié)構(gòu)體更適合,因為在棧上分配內(nèi)存,可以有效減少GC壓力
總結(jié)
通過本文的介紹,相信你一定加深了堆棧的理解;搞清楚逃逸分析的作用和原理之后能夠指導(dǎo)我們寫出更優(yōu)雅的代碼。
我們在日常開發(fā)中,要根據(jù)實際場景考慮,如何將內(nèi)存盡量分配到棧中,減少GC的壓力,提高性能。
如何找到應(yīng)用開發(fā)效率、程序運行效率、對機器的壓力及負載的平衡點,是程序員進階之旅中的必修課。
本文轉(zhuǎn)載自微信公眾號「 程序員升級打怪之旅」,作者「王中陽Go」,可以通過以下二維碼關(guān)注。
轉(zhuǎn)載本文請聯(lián)系「 程序員升級打怪之旅」公眾號。