Go 如何實現(xiàn)啟動參數(shù)的加載
剛學 Go 的同學一定思考過 Go 程序的啟動過程,關(guān)于這個問題可以看饒大的文章 Go 程序是怎樣跑起來的。今天我們將問題縮小,來學習 Go 程序是怎么加載啟動參數(shù),以及如何進行參數(shù)解析。
C 參數(shù)解析
學習過 C 語言的童鞋,一定對 argc 和 argv 不會陌生。
C 程序總是從主函數(shù) main 開始執(zhí)行的,而在帶參數(shù)的主函數(shù)中,依照慣例,會使用 argc 和 argv 的命名作為主函數(shù)參數(shù)。
其中,argc (argument count)代表的是命令行參數(shù)個數(shù),argv(argument value) 是用來存放指向參數(shù)的指針數(shù)組。
- #include <stdio.h>
- int main(int argc, char *argv[])
- {
- printf("argc = %d\n",argc);
- printf("argv[0] = %s, argv[1] = %s, argv[2] = %s \n", argv[0], argv[1], argv[2]);
- return 0;
- }
編譯執(zhí)行以上 C 代碼,得到輸出如下
- $ gcc c_main.c -o main
- $ ./main foo bar sss ddd
- argc = 5
- argv[0] = ./main, argv[1] = foo, argv[2] = bar
那在 Go 語言中,又該如何獲取命令行參數(shù)呢?
os.Args 加載
同 C 一樣,Go 程序也是從 main 主函數(shù)開始(用戶層)執(zhí)行,但主函數(shù)中并沒有定義 argc 和 argv。
我們可以通過 os.Args 函數(shù),獲取命令行參數(shù)。
- package main
- import (
- "fmt"
- "os"
- )
- func main() {
- for i, v := range os.Args {
- fmt.Printf("arg[%d]: %v\n", i, v)
- }
- }
編譯執(zhí)行 Go 函數(shù)
- $ go build main.go
- $ ./main foo bar sss ddd
- arg[0]: ./main
- arg[1]: foo
- arg[2]: bar
- arg[3]: sss
- arg[4]: ddd
同 C 一樣,第一個參數(shù)也是代表可執(zhí)行文件。
加載實現(xiàn)
下文我們需要展示一些 Go 匯編代碼,為了方便讀者理解,先通過兩圖了解 Go 匯編語言對 CPU 的重新抽象。
X86/AMD64 架構(gòu)
Go 偽寄存器
Go匯編為了簡化匯編代碼的編寫,引入了 PC、FP、SP、SB 四個偽寄存器。
四個偽寄存器加上其它的通用寄存器就是 Go 匯編語言對 CPU 的重新抽象。當然,該抽象的結(jié)構(gòu)也適用于其它非 X86 類型的體系結(jié)構(gòu)。
回到正題,命令行參數(shù)的解析過程是程序啟動中的一部分內(nèi)容。
以 linux amd64 系統(tǒng)為例,Go 程序的執(zhí)行入口位于runtime/rt0_linux_amd64.s。
- TEXT _rt0_amd64_linux(SB),NOSPLIT,$-8
- JMP _rt0_amd64(SB)
_rt0_amd64函數(shù)實現(xiàn)于 runtime/asm_amd64.s
- TEXT _rt0_amd64(SB),NOSPLIT,$-8
- MOVQ 0(SP), DI // argc
- LEAQ 8(SP), SI // argv
- JMP runtime·rt0_go(SB)
看到 argc 和 argv 的身影了嗎?在這里,它們從棧內(nèi)存分別被加載到了 DI、SI 寄存器。
rt0_go函數(shù)完成了 runtime 的所有初始化工作,但我們這里僅關(guān)注 argc 和 argv 的處理過程。
- TEXT runtime·rt0_go(SB),NOSPLIT|TOPFRAME,$0
- // copy arguments forward on an even stack
- MOVQ DI, AX // argc
- MOVQ SI, BX // argv
- SUBQ $(4*8+7), SP // 2args 2auto
- ANDQ $~15, SP
- MOVQ AX, 16(SP)
- MOVQ BX, 24(SP)
- ...
- MOVL 16(SP), AX // copy argc
- MOVL AX, 0(SP)
- MOVQ 24(SP), AX // copy argv
- MOVQ AX, 8(SP)
- CALL runtime·args(SB)
- CALL runtime·osinit(SB)
- CALL runtime·schedinit(SB)
- ...
經(jīng)過一系列操作之后,argc 和 argv 又被折騰回了棧內(nèi)存 0(SP)和 8(SP) 中。
args 函數(shù)位于runtime/runtime1.go中
- var (
- argc int32
- argv **byte
- )
- func args(c int32, v **byte) {
- argc = c
- argv = v
- sysargs(c, v)
- }
在這里,argc 和 argv 分別被保存至變量runtime.argc和runtime.argv。
在rt0_go函數(shù)中調(diào)用執(zhí)行完args函數(shù)后,還會執(zhí)行schedinit。
- func schedinit() {
- ...
- goargs()
- ...
goargs實現(xiàn)于runtime/runtime1.go
- var argslice []string
- func goargs() {
- if GOOS == "windows" {
- return
- }
- argslice = make([]string, argc)
- for i := int32(0); i < argc; i++ {
- argslice[i] = gostringnocopy(argv_index(argv, i))
- }
- }
該函數(shù)的目的是,將指向棧內(nèi)存的命令行參數(shù)字符串指針,封裝成 Go 的 string類型,最終保存于runtime.argslice。
這里有個知識點,Go 是如何將 C 字符串封裝成 Go string 類型的呢?答案就在以下代碼。
- func gostringnocopy(str *byte) string {
- ss := stringStruct{str: unsafe.Pointer(str), len: findnull(str)}
- s := *(*string)(unsafe.Pointer(&ss))
- return s
- }
- func argv_index(argv **byte, i int32) *byte {
- return *(**byte)(add(unsafe.Pointer(argv), uintptr(i)*sys.PtrSize))
- }
- func add(p unsafe.Pointer, x uintptr) unsafe.Pointer {
- return unsafe.Pointer(uintptr(p) + x)
- }
此時,Go 已經(jīng)將 argc 和 argv 的信息保存至runtime.argslice中,那聰明的你一定能猜到os.Args方法就是讀取的該slice。
在os/proc.go中,是它的實現(xiàn)
- var Args []string
- func init() {
- if runtime.GOOS == "windows" {
- // Initialized in exec_windows.go.
- return
- }
- Args = runtime_args()
- }
- func runtime_args() []string // in package runtime
而runtime_args方法的實現(xiàn)是位于 runtime/runtime.go中的os_runtime_args函數(shù)
- //go:linkname os_runtime_args os.runtime_args
- func os_runtime_args() []string { return append([]string{}, argslice...) }
在這里實現(xiàn)了runtime.argslice的拷貝。至此,os.Args方法最終成功加載了命令行參數(shù) argv 信息。
總結(jié)
本文我們介紹了 Go 可以利用os.Args解析程序啟動時的命令行參數(shù),并學習了它的實現(xiàn)過程。
在加載實現(xiàn)的源碼學習中,我們發(fā)現(xiàn)如果從一個點出發(fā),去追溯它的實現(xiàn)原理,這個過程并不復(fù)雜,希望童鞋們不要懼怕研究源碼。
os.Args方法將命令行參數(shù)存儲在字符串切片中,通過遍歷即可提取它們。但在實際開發(fā)中我們一般不會直接使用os.Args方法,因為 Go 為我們提供了一個更好用的 flag 包。但鑒于篇幅原因,該部分的內(nèi)容以后再寫了。
參考
go語言高級編程--------匯編語言部分學習筆記:https://blog.csdn.net/cyq6239075/article/details/106480140
Go 程序是怎樣跑起來的:https://mp.weixin.qq.com/s/Rewl0DKnq6CY53m5D3G2qw