淺析 Go 與 C 的指針
運算符
C 和 Go 都相同:
- & 運算符取出變量所在的內存地址
- * 運算符取出指針變量所指向的內存地址里面的值,也叫 “ 解引用 ”
C 語言版示例:
- #include <stdio.h>
- int main()
- {
- int bar = 1;
- // 聲明一個指向 int 類型的值的指針
- int *ptr;
- // 通過 & 取出 bar 變量所在的內存地址并賦值給 ptr 指針
- ptr = &bar;
- // 打印 ptr 的值(為地址),*prt 表示取出指針變量所指向的內存地址里面的值
- printf("%p %d\n", ptr, *ptr);
- return (0);
- }
- // 輸出結果:
- // 0x7ffd5471ee54 1
Go 語言版示例:
- package main
- import "fmt"
- func main() {
- bar := 1
- // 聲明一個指向 int 類型的值的指針
- var ptr *int
- // 通過 & 取出 bar 變量所在的內存地址并賦值給 ptr 指針
- ptr = &bar
- // 打印 ptr 變量儲存的指針地址,*prt 表示取出指針變量所指向的內存地址里面的值
- fmt.Printf("%p %d\n", ptr, *ptr)
- }
- // 輸出結果:
- // 0xc000086020 1
Go 還可以使用 new 關鍵字來分配內存創(chuàng)建指定類型的指針。
- // 聲明一個指向 int 類型的值的指針
- // var ptr *int
- ptr := new(int)
- // 通過 & 取出 bar 變量所在的內存地址并賦值給 ptr 指針
- ptr = &bar
數組名和數組首地址
對于一個數組
- // C
- int arr[5] = {1, 2, 3, 4, 5};
- // Go
- // 需要指定長度,否則類型為切片
- arr := [5]int{1, 2, 3, 4, 5}
在 C 中,數組名 arr 代表的是數組首元素的地址,相當于 &arr[0]
而 &arr 代表的是整個數組 arr 的首地址
- // C
- // arr 數組名代表數組首元素的地址
- printf("arr -> %p\n", arr);
- // &arr[0] 代表數組首元素的地址
- printf("&arr[0] -> %p\n", &arr[0]);
- // &arr 代表整個數組 arr 的首地址
- printf("&arr -> %p\n", &arr);
- // 輸出結果:
- // arr -> 0061FF0C
- // &arr[0] -> 0061FF0C
- // &arr -> 0061FF0C
運行程序可以發(fā)現 arr 和 &arr 的輸出值是相同的,但是它們的意義完全不同。
首先數組名 arr 作為一個標識符,是 arr[0] 的地址,從 &arr[0] 的角度去看就是一個指向 int 類型的值的指針。
而 &arr 是一個指向 int[5] 類型的值的指針。
可以進一步對其進行指針偏移驗證
- // C
- // 指針偏移
- printf("arr+1 -> %p\n", arr + 1);
- printf("&arr+1 -> %p\n", &arr + 1);
- // 輸出結果:
- // arr+1 -> 0061FF10
- // &arr+1 -> 0061FF20
這里涉及到偏移量的知識:一個類型為 T 的指針的移動,是以 sizeof(T) 為移動單位的。
- arr+1 : arr 是一個指向 int 類型的值的指針,因此偏移量為 1*sizeof(int)
- &arr+1 : &arr 是一個指向 int[5] 的指針,它的偏移量為 1*sizeof(int)*5
到這里相信你應該可以理解 C 語言中的 arr 和 &arr 的區(qū)別了吧,接下來看看 Go 語言
- // 嘗試將數組名 arr 作為地址輸出
- fmt.Printf("arr -> %p\n", arr)
- fmt.Printf("&arr[0] -> %p\n", &arr[0])
- fmt.Printf("&arr -> %p\n", &arr)
- // 輸出結果:
- // arr -> %!p([5]int=[1 2 3 4 5])
- // &arr[0] -> 0xc00000c300
- // &arr -> 0xc00000c300
&arr[0] 和 &arr 與 C 語言一致。
但是數組名 arr 在 Go 中已經不是數組首元素的地址了,代表的是整個數組的值,所以輸出時會提示 %!p([5]int=[1 2 3 4 5])
指針運算
指針本質上就是一個無符號整數,代表了內存地址。
指針和整數值可以進行加減法運算,比如上文的指針偏移例子:
- 加n : 一個類型為 T 的指針,以 n*sizeof(T) 為單位向高位移動。
- 減n : 一個類型為 T 的指針,以 n*sizeof(T) 為單位向低位移動。
其中 sizeof(T) 代表的是數據類型占據的字節(jié),比如 int 在 32 位環(huán)境下為 4 字節(jié),64 位環(huán)境下為 8 字節(jié)
C 語言示例:
- #include <stdio.h>
- int main()
- {
- int arr[] = {1, 2, 3, 4, 5};
- // ptr 是一個指針,為 arr 數組的第一個元素地址
- int *ptr = arr;
- printf("%p %d\n", ptr, *ptr);
- // ptr 指針向高位移動一個單位,移向到 arr 數組第二個元素地址
- ptr++;
- printf("%p %d\n", ptr, *ptr);
- return (0);
- }
- // 輸出結果:
- // 0061FF08 1
- // 0061FF0C 2
在這里 ptr++ 從 0061FF08 移動了 sizeof(int) = 4 個字節(jié)到 0061FF0C ,指向了下一個數組元素的地址
Go 語言示例:
- package main
- import "fmt"
- func main() {
- arr := [5]uint32{1, 2, 3, 4, 5}
- // ptr 是一個指針,為 arr 數組的第一個元素地址
- ptr := &arr[0]
- fmt.Println(ptr, *ptr)
- // ptr 指針向高位移動一個單位,移向到 arr 數組第二個元素地址
- ptr++
- fmt.Println(ptr, *ptr)
- }
- // 輸出結果:
- // 編譯報錯:
- // .\main.go:13:5: invalid operation: ptr++ (non-numeric type *uint32)
編譯報錯 *uint32 非數字類型,不支持運算,說明 Go 是不支持指針運算的。
這個其實在 Go Wiki[1] 中的 Go 從 C++ 過渡文檔中有提到過:Go has pointers but not pointer arithmetic.
Go 有指針但不支持指針運算。
另辟蹊徑
那還有其他辦法嗎?答案當然是有的。
在 Go 標準庫中提供了一個 unsafe 包用于編譯階段繞過 Go 語言的類型系統(tǒng),直接操作內存。
我們可以利用 unsafe 包來實現指針運算。
- func Alignof(x ArbitraryType) uintptr
- func Offsetof(x ArbitraryType) uintptr
- func Sizeof(x ArbitraryType) uintptr
- type ArbitraryType
- func Slice(ptr *ArbitraryType, len IntegerType) []ArbitraryType
- type IntegerType
- type Pointer
- func Add(ptr Pointer, len IntegerType) Pointer
核心介紹:
- uintptr : Go 的內置類型。是一個無符號整數,用來存儲地址,支持數學運算。常與 unsafe.Pointer 配合做指針運算
- unsafe.Pointer : 表示指向任意類型的指針,可以和任何類型的指針互相轉換(類似 C 語言中的 void* 類型的指針),也可以和 uintptr 互相轉換
- unsafe.Sizeof : 返回操作數在內存中的字節(jié)大小,參數可以是任意類型的表達式,例如 fmt.Println(unsafe.Sizeof(uint32(0))) 的結果為 4
- unsafe.Offsetof : 函數的參數必須是一個字段 x.f,然后返回 f 字段相對于 x 起始地址的偏移量,用于計算結構體成員的偏移量
原理:
Go 的 uintptr 類型存儲的是地址,且支持數學運算
*T (任意指針類型) 和 unsafe.Pointer 不能運算,但是 unsafe.Pointer 可以和 *T 、 uintptr 互相轉換
因此,將 *T 轉換為 unsafe.Pointer 后再轉換為 uintptr ,uintptr 進行運算之后重新轉換為 unsafe.Pointer => *T 即可
代碼實現:
- package main
- import (
- "fmt"
- "unsafe"
- )
- func main() {
- arr := [5]uint32{1, 2, 3, 4, 5}
- ptr := &arr[0]
- // ptr(*uint32類型) => one(unsafe.Pointer類型)
- one := unsafe.Pointer(ptr)
- // one(unsafe.Pointer類型) => *uint32
- fmt.Println(one, *(*uint32)(one))
- // one(unsafe.Pointer類型) => one(uintptr類型) 后向高位移動 unsafe.Sizeof(arr[0]) = 4 字節(jié)
- // twoUintptr := uintptr(one) + unsafe.Sizeof(arr[0])
- // ??!twoUintptr 不能作為臨時變量
- // uintptr 類型的臨時變量只是一個無符號整數,并不知道它是一個指針地址,可能被 GC
- // 運算完成后應該直接轉換回 unsafe.Pointer :
- two := unsafe.Pointer(uintptr(one) + unsafe.Sizeof(arr[0]))
- fmt.Println(two, *(*uint32)(two))
- }
- // 輸出結果:
- // 0xc000012150 1
- // 0xc000012154 2
甚至還可以更改結構體的私有成員:
- // model/model.go
- package model
- import (
- "fmt"
- )
- type M struct {
- foo uint32
- bar uint32
- }
- func (m M) Print() {
- fmt.Println(m.foo, m.bar)
- }
- // main.go
- package main
- import (
- "example/model"
- "unsafe"
- )
- func main() {
- m := model.M{}
- m.Print()
- foo := unsafe.Pointer(&m)
- *(*uint32)(foo) = 1
- bar := unsafe.Pointer(uintptr(foo) + 4)
- *(*uint32)(bar) = 2
- m.Print()
- }
- // 輸出結果:
- // 0 0
- // 1 2
小 Tips
Go 的底層 slice 切片源碼就使用了 unsafe 包
- // slice 切片的底層結構
- type slice struct {
- // 底層是一個數組指針
- array unsafe.Pointer
- // 長度
- len int
- // 容量
- cap int
- }
總結
- Go 可以使用 & 運算符取地址,也可以使用 new 創(chuàng)建指針
- Go 的數組名不是首元素地址
- Go 的指針不支持運算
- Go 可以使用 unsafe 包打破安全機制來操控指針,但對我們開發(fā)者而言,是 "unsafe" 不安全的
參考資料
[1]Go Wiki: https://github.com/golang/go/wiki/GoForCPPProgrammers
本文轉載自微信公眾號「尋尋覓覓的Gopher」,可以通過以下二維碼關注。轉載本文請聯系尋尋覓覓的Gopher公眾號。