詳解 Go 團(tuán)隊(duì)不建議用的 Unsafe.Pointer
本文轉(zhuǎn)載自微信公眾號「腦子進(jìn)煎魚了」,作者陳煎魚。轉(zhuǎn)載本文請聯(lián)系腦子進(jìn)煎魚了公眾號。
大家好,我是煎魚。
大家在學(xué)習(xí) Go 的時候,肯定都學(xué)過 “Go 的指針是不支持指針運(yùn)算和轉(zhuǎn)換” 這個知識點(diǎn)。為什么呢?
首先,Go 是一門靜態(tài)語言,所有的變量都必須為標(biāo)量類型。不同的類型不能夠進(jìn)行賦值、計算等跨類型的操作。
那么指針也對應(yīng)著相對的類型,也在 Compile 的靜態(tài)類型檢查的范圍內(nèi)。同時靜態(tài)語言,也稱為強(qiáng)類型。也就是一旦定義了,就不能再改變它。
錯誤的示例
- func main(){
- num := 5
- numPointer := &num
- flnum := (*float32)(numPointer)
- fmt.Println(flnum)
- }
輸出結(jié)果:
- # command-line-arguments
- ...: cannot convert numPointer (type *int) to type *float32
在示例中,我們創(chuàng)建了一個 num 變量,值為 5,類型為 int,準(zhǔn)備干一番大事。
接下來我們?nèi)×似鋵τ诘闹羔樀刂泛?,試圖強(qiáng)制轉(zhuǎn)換為 *float32,結(jié)果失敗...
萬能的破壁 unsafe
針對剛剛的 “錯誤示例”,我們可以采用今天的男主角 unsafe 標(biāo)準(zhǔn)庫來解決。它是一個神奇的包,在官方的詮釋中,有如下概述:
- 圍繞 Go 程序內(nèi)存安全及類型的操作。
- 很可能會是不可移植的。
- 不受 Go 1 兼容性指南的保護(hù)。
簡單來講就是,不怎么推薦你使用,因?yàn)樗?unsafe(不安全的)。
但是在特殊的場景下,使用了它,可以打破 Go 的類型和內(nèi)存安全機(jī)制,讓你獲得眼前一亮的驚喜效果。
unsafe.Pointer
為了解決這個問題,需要用到 unsafe.Pointer。它表示任意類型且可尋址的指針值,可以在不同的指針類型之間進(jìn)行轉(zhuǎn)換(類似 C 語言的 void * 的用途)。
其包含四種核心操作:
- 任何類型的指針值都可以轉(zhuǎn)換為 Pointer。
- Pointer 可以轉(zhuǎn)換為任何類型的指針值。
- uintptr 可以轉(zhuǎn)換為 Pointer。
- Pointer 可以轉(zhuǎn)換為 uintptr。
在這一部分,重點(diǎn)看第一點(diǎn)、第二點(diǎn)。你再想想怎么修改 “錯誤的例子” 讓它運(yùn)行起來?
修改如下:
- func main(){
- num := 5
- numPointer := &num
- flnum := (*float32)(unsafe.Pointer(numPointer))
- fmt.Println(flnum)
- }
輸出結(jié)果:
- 0xc4200140b0
在上述代碼中,我們小加改動。通過 unsafe.Pointer 的特性對該指針變量進(jìn)行了修改,就可以完成任意類型(*T)的指針轉(zhuǎn)換。
需要注意的是,這時還無法對變量進(jìn)行操作或訪問,因?yàn)椴恢涝撝羔樀刂分赶虻臇|西具體是什么類型。不知道是什么類型,又如何進(jìn)行解析呢?
無法解析也就自然無法對其變更了。
unsafe.Offsetof
在上小節(jié)中,我們對普通的指針變量進(jìn)行了修改。那么它是否能做更復(fù)雜一點(diǎn)的事呢?
- type Num struct{
- i string
- j int64
- }
- func main(){
- n := Num{i: "EDDYCJY", j: 1}
- nPointer := unsafe.Pointer(&n)
- niPointer := (*string)(unsafe.Pointer(nPointer))
- *niPointer = "煎魚"
- njPointer := (*int64)(unsafe.Pointer(uintptr(nPointer) + unsafe.Offsetof(n.j)))
- *njPointer = 2
- fmt.Printf("n.i: %s, n.j: %d", n.i, n.j)
- }
輸出結(jié)果:
- n.i: 煎魚, n.j: 2
在剖析這段代碼做了什么事之前,我們需要了解結(jié)構(gòu)體的一些基本概念:
- 結(jié)構(gòu)體的成員變量在內(nèi)存存儲上是一段連續(xù)的內(nèi)存。
- 結(jié)構(gòu)體的初始地址就是第一個成員變量的內(nèi)存地址。
- 基于結(jié)構(gòu)體的成員地址去計算偏移量。就能夠得出其他成員變量的內(nèi)存地址。
再回來看看上述代碼,得出執(zhí)行流程:
- 修改 n.i 值:i 為第一個成員變量。因此不需要進(jìn)行偏移量計算,直接取出指針后轉(zhuǎn)換為 Pointer,再強(qiáng)制轉(zhuǎn)換為字符串類型的指針值即可。
- 修改 n.j 值:j 為第二個成員變量。需要進(jìn)行偏移量計算,才可以對其內(nèi)存地址進(jìn)行修改。在進(jìn)行了偏移運(yùn)算后,當(dāng)前地址已經(jīng)指向第二個成員變量。接著重復(fù)轉(zhuǎn)換賦值即可。
細(xì)節(jié)分析
需要注意的是,這里使用了如下方法(來完成偏移計算的目標(biāo)):
1、uintptr:uintptr 是 Go 的內(nèi)置類型。返回?zé)o符號整數(shù),可存儲一個完整的地址。后續(xù)常用于指針運(yùn)算
- type uintptr uintptr
2、unsafe.Offsetof:返回成員變量 x 在結(jié)構(gòu)體當(dāng)中的偏移量。更具體的講,就是返回結(jié)構(gòu)體初始位置到 x 之間的字節(jié)數(shù)。需要注意的是入?yún)? ArbitraryType 表示任意類型,并非定義的 int。它實(shí)際作用是一個占位符
- func Offsetof(x ArbitraryType) uintptr
在這一部分,其實(shí)就是巧用了 Pointer 的第三、第四點(diǎn)特性。這時候就已經(jīng)可以對變量進(jìn)行操作了。
糟糕的例子
- func main(){
- n := Num{i: "EDDYCJY", j: 1}
- nPointer := unsafe.Pointer(&n)
- ...
- ptr := uintptr(nPointer)
- njPointer := (*int64)(unsafe.Pointer(ptr + unsafe.Offsetof(n.j)))
- ...
- }
這里存在一個問題,uintptr 類型是不能存儲在臨時變量中的。因?yàn)閺?GC 的角度來看,uintptr 類型的臨時變量只是一個無符號整數(shù),并不知道它是一個指針地址。
因此當(dāng)滿足一定條件后,ptr 這個臨時變量是可能被垃圾回收掉的,那么接下來的內(nèi)存操作,豈不成迷?
總結(jié)
簡潔回顧兩個知識點(diǎn),如下:
- 第一是 unsafe.Pointer 可以讓你的變量在不同的指針類型轉(zhuǎn)來轉(zhuǎn)去,也就是表示為任意可尋址的指針類型。
- 第二是 uintptr 常用于與 unsafe.Pointer 打配合,用于做指針運(yùn)算,巧妙地很。
最后還是那句,沒有特殊必要的話。是不建議使用 unsafe 標(biāo)準(zhǔn)庫,它并不安全。雖然它常常能讓你眼前一亮。