操作無符號(hào)整數(shù)的注意事項(xiàng)
在很多強(qiáng)類型編程語(yǔ)言中都會(huì)有一種特殊的類型——無符號(hào)整數(shù)類型,該數(shù)據(jù)類型在使用過程中往往稍不留意就會(huì)引發(fā)出乎意料的bug。
至于,有什么注意事項(xiàng)以及需要了解的知識(shí)點(diǎn),一起來看看吧。
1. go源碼中的數(shù)據(jù)類型
- // go源碼位置: src/math/const.go
- //
- // Integer limit values.
- const (
- MaxInt8 = 1<<7 - 1
- MinInt8 = -1 << 7
- MaxInt16 = 1<<15 - 1
- MinInt16 = -1 << 15
- MaxInt32 = 1<<31 - 1
- MinInt32 = -1 << 31
- MaxInt64 = 1<<63 - 1
- MinInt64 = -1 << 63
- MaxUint8 = 1<<8 - 1
- MaxUint16 = 1<<16 - 1
- MaxUint32 = 1<<32 - 1
- MaxUint64 = 1<<64 - 1
- )
- // go源碼位置: src/builtin/builtin.go
- //
- // uint8 is the set of all unsigned 8-bit integers.
- // Range: 0 through 255.
- type uint8 uint8
- // uint16 is the set of all unsigned 16-bit integers.
- // Range: 0 through 65535.
- type uint16 uint16
- // uint32 is the set of all unsigned 32-bit integers.
- // Range: 0 through 4294967295.
- type uint32 uint32
- // uint64 is the set of all unsigned 64-bit integers.
- // Range: 0 through 18446744073709551615.
- type uint64 uint64
- // int8 is the set of all signed 8-bit integers.
- // Range: -128 through 127.
- type int8 int8
- // int16 is the set of all signed 16-bit integers.
- // Range: -32768 through 32767.
- type int16 int16
- // int32 is the set of all signed 32-bit integers.
- // Range: -2147483648 through 2147483647.
- type int32 int32
- // int64 is the set of all signed 64-bit integers.
- // Range: -9223372036854775808 through 9223372036854775807.
- type int64 int64
- // float32 is the set of all IEEE-754 32-bit floating-point numbers.
- type float32 float32
- // float64 is the set of all IEEE-754 64-bit floating-point numbers.
- type float64 float64
從源碼中可以看出:
- 無符號(hào)類型只有正數(shù)值域(最小值為0),沒有負(fù)數(shù)值域
- 有符號(hào)類型有正、負(fù)數(shù)值域
- 無符號(hào)類型正數(shù)值域數(shù)值個(gè)數(shù)是有符號(hào)類型正數(shù)值域數(shù)值個(gè)數(shù)的2倍
以 uint8 與 int8 為例,無符號(hào)類型 uint8,正數(shù)值域 0 ~ 255 共 256個(gè)數(shù)值。有符號(hào)類型 int8,正數(shù)值域 0 ~ 127 共 128個(gè)數(shù)值。
2. 無符號(hào)類型與有符號(hào)類型的值域
可能你會(huì)問:相同長(zhǎng)度的無符號(hào)、有符號(hào)類型,值域?yàn)槭裁词沁@樣的分布?
看過計(jì)算機(jī)微機(jī)原理的同學(xué)大概都會(huì)略知一二,明白其緣由:
- 計(jì)算機(jī)只認(rèn)識(shí)0、1,每個(gè)0、1被稱為1個(gè)bit (bit是計(jì)算機(jī)中最小的單位)
- 計(jì)算機(jī)系統(tǒng)中所有的數(shù)值以及數(shù)據(jù)都使用0、1串組合存儲(chǔ)
- 不同的0、1組合,由于使用不同編碼、解碼方式才被賦予了不同的含義,進(jìn)而擁有了各種不同數(shù)據(jù)類型
就拿長(zhǎng)度都是8 bit的無符號(hào)類型uint8與有符號(hào)類型int8來說:
uint8無符號(hào)類型的8個(gè)bit位都用來表示數(shù)值
int8有符號(hào)類型的8個(gè)bit中,只有后7個(gè)bit位用來表示數(shù)值。剩余的一個(gè)bit用來表示符號(hào)位,為0表示正數(shù)值,為1表示負(fù)數(shù)值。
在二進(jìn)制中,1個(gè)bit長(zhǎng)度之差造成的表達(dá)值域就是2倍
3. 無符號(hào)類型與有符號(hào)類型的加減法
先看一段代碼:
- func demo() {
- var a uint8 = 1
- var b uint8 = 2
- v1 := a - b
- fmt.Println("uint8 1-2=", v1)
- var c int8 = 1
- var d int8 = 2
- v2 := c - d
- fmt.Println("int8 1-2=", v2)
- fmt.Println("---------------")
- var e uint8 = math.MaxUint8
- var f uint8 = 1
- v3 := e + f
- fmt.Printf("uint8 255+1=%d %T\n", v3, v3)
- var g int8 = math.MaxInt8
- var h int8 = 1
- v4 := g + h
- fmt.Printf("int8 127+1=%d %T\n", v4, v4)
- }
聰明的你,猜下執(zhí)行結(jié)果會(huì)是什么?
- uint8 - v1 1-2= 255
- int8 - v2 1-2= -1
- ---------------
- uint8 - v3 255+1=0 uint8
- int8 - v4 127+1=-128 int8
結(jié)果分析:
- v3、v4在進(jìn)行相加操作時(shí),由于運(yùn)算結(jié)果超出了對(duì)應(yīng)的數(shù)值位長(zhǎng)度而發(fā)生溢出,導(dǎo)致溢出的數(shù)據(jù)位無效
- v2結(jié)果正確
- v1不僅是本文重點(diǎn)之一,也會(huì)在很多場(chǎng)合中稍有不慎就導(dǎo)致嚴(yán)重bug
在網(wǎng)上看到的一個(gè)關(guān)于無符號(hào)整形減法產(chǎn)生的bug,如下圖所示:
4. 關(guān)于無符號(hào)整形加減法的一些結(jié)論
先說一些關(guān)于無符號(hào)整形加減法的結(jié)論:
1.無符號(hào)整形進(jìn)行加法操作時(shí)會(huì)像其他類型一樣,在運(yùn)算結(jié)果超出數(shù)值位時(shí)發(fā)生溢出
2.無符號(hào)整形進(jìn)行減法操作時(shí),運(yùn)算結(jié)果有兩種情況
2.1 減數(shù)>=被減數(shù),則最終結(jié)果大于等于0
2.2 減數(shù)<被減數(shù),最終結(jié)果也大于等于0
關(guān)于無符號(hào)整形進(jìn)行減法比較特殊,減數(shù)小于被減數(shù)時(shí)結(jié)果也大于等于0,是不是很意外。
總結(jié)一句話概括:無符號(hào)類型數(shù)值無論加減操作,其結(jié)果從不會(huì)小于0。
5. 無符號(hào)類型數(shù)值相減問題
- [root@localhost workspace]# cat -n t.go
- 1 package main
- 2
- 3 import"fmt"
- 4
- 5 func main (){
- 6 var a uint8 = 1
- 7 var b uint8 = 2
- 8 v1 := a - b
- 9
- 10 fmt.Println("uint8 - v1 1-2=", v1)
- 11 }
第8行代碼執(zhí)行了兩個(gè)uint8無符號(hào)類型減法操作,得到結(jié)果v1。
- [root@localhost workspace]# go build -gcflags="-N -l -S" t.go
- # command-line-arguments
- "".main STEXT size=222 args=0x0 locals=0x80 funcid=0x0
- 0x000000000 (/root/workspace/t.go:5) TEXT "".main(SB), ABIInternal, $128-0
- ......
- 0x002b00043 (/root/workspace/t.go:8) MOVBLZX "".a+54(SP), AX
- 0x003000048 (/root/workspace/t.go:8) ADDL $-2, AX // !!! 加 -2
- 0x003300051 (/root/workspace/t.go:8) MOVB AL, "".v1+52(SP)
- 0x003700055 (/root/workspace/t.go:10) MOVB AL, ""..autotmp_3+55(SP)
首先,要說明一點(diǎn):在計(jì)算機(jī)中沒有減法,只有加法操作(出乎你的意料)。
通過匯編代碼可以看出 a-b 被轉(zhuǎn)換成了a + (-b),即 1-2 = 1+(-2)。
按理說1-2應(yīng)該等于-1才對(duì),這其中又發(fā)生了什么呢?
6. 負(fù)數(shù)的表達(dá)形式——補(bǔ)碼
前面說過,計(jì)算機(jī)只認(rèn)識(shí)二進(jìn)制的0、1,2屬于10進(jìn)制的數(shù)值,10進(jìn)制則可以看做是一種計(jì)算機(jī)上的編解碼規(guī)則。那么,其對(duì)應(yīng)的二進(jìn)制又是什么呢?
- func demo2() {
- var a, b, c uint8
- a = 1
- b = 2
- c = a + (-b)
- fmt.Printf(
- "a的二進(jìn)制為:%08b \n"+
- "b的二進(jìn)制為:%08b \n"+
- "-b的二進(jìn)制為:%08b \n"+
- "c的二進(jìn)制為:%08b \n"+
- "c的十進(jìn)制為:%d", a, b, -b, c, c,
- )
- }
執(zhí)行結(jié)果為:
- a的二進(jìn)制為:00000001
- b的二進(jìn)制為:00000010
- -b的二進(jìn)制為:11111110
- c的二進(jìn)制為:11111111
- c的十進(jìn)制為:255
在計(jì)算機(jī)系統(tǒng)里面,數(shù)值有三種編碼:原碼、反碼、補(bǔ)碼。
- 反碼、補(bǔ)碼一般用于負(fù)數(shù),反碼=負(fù)數(shù)對(duì)應(yīng)正數(shù)的原碼取反,補(bǔ)碼=反碼+1
- 正數(shù)的原碼、反碼、補(bǔ)碼一樣
- 負(fù)數(shù)分兩種情況:3.1 對(duì)于有符號(hào)類型:負(fù)數(shù)的數(shù)值位使用補(bǔ)碼表示,同時(shí)設(shè)置符號(hào)位為13.2 對(duì)于無符號(hào)類型:負(fù)數(shù)的數(shù)值位使用補(bǔ)碼表示,由于無符號(hào)位,故無需設(shè)置符號(hào)位
由上文若干規(guī)則可知:
- uint8 類型的 -b 對(duì)應(yīng)的二進(jìn)制為 11111110,uint8 類型 a 對(duì)應(yīng)二進(jìn)制為00000001
- c=a+(-b),則對(duì)應(yīng)bit位相加為11111111
- 同類型相加結(jié)果還為同一類型,所以c仍然為uint8
- 由于無符號(hào)類型的值域不存在負(fù)數(shù)域,所以11111111轉(zhuǎn)換為十進(jìn)制為255
7. 一些疑惑
你是否跟我一樣,存在一些疑惑?
無符號(hào)類型可以賦值為負(fù)數(shù)嗎?
你可能會(huì)問:無符號(hào)類型既然永遠(yuǎn)不為負(fù)數(shù),那么可以賦值為負(fù)數(shù)嗎?
- func demo3() {
- var a uint8
- a = -2
- fmt.Println(a)
- }
執(zhí)行結(jié)果:
- # command-line-arguments
- ./main.go:59:4: constant -2 overflows uint8
通過報(bào)錯(cuò)信息可知,是無法給無符號(hào)類型賦值負(fù)數(shù)的。
無符號(hào)類型不可以賦值負(fù)數(shù),為什么可以進(jìn)行取負(fù)操作?
既然無符號(hào)類型不可以賦值為負(fù)數(shù),為什么無符號(hào)類型可以取負(fù)操作?
- func demo3() {
- var a uint8
- a = 2
- fmt.Println(-a)
- }
可能你又會(huì)問:-a需要跟a類型一致才對(duì),-a不能表示為無符號(hào)類型,為什么沒報(bào)錯(cuò)呢?
- [root@localhost workspace]# cat -n t.go
- 1 package main
- 2
- 3 import"fmt"
- 4
- 5 func main (){
- 6 var a1 uint8
- 7 a1 = 2
- 8
- 9 fmt.Printf("%b\n", -a1)
- 10 }
- [root@localhost workspace]# go build -gcflags="-N -l -S" t.go
- # command-line-arguments
- "".main STEXT size=197 args=0x0 locals=0x80 funcid=0x0
- 0x000000000 (/root/workspace/t.go:5) TEXT "".main(SB), ABIInternal, $128-0
- ......
- 0x002b00043 (/root/workspace/t.go:9) MOVB $-2, ""..autotmp_1+71(SP)
- 0x003000048 (/root/workspace/t.go:9) XORPS X0, X0
- 0x003300051 (/root/workspace/t.go:9) MOVUPS X0, ""..autotmp_2+80(SP)
- 0x003800056 (/root/workspace/t.go:9) LEAQ ""..autotmp_2+80(SP), AX
- 0x003d00061 (/root/workspace/t.go:9) MOVQ AX, ""..autotmp_4+72(SP)
- 0x004200066 (/root/workspace/t.go:9) TESTB AL, (AX)
- 0x004400068 (/root/workspace/t.go:9) MOVBLZX ""..autotmp_1+71(SP), CX
- 0x004900073 (/root/workspace/t.go:9) LEAQ type.uint8(SB), DX //!!! type.uint8對(duì)-2進(jìn)行類型轉(zhuǎn)換
- 0x005000080 (/root/workspace/t.go:9) MOVQ DX, ""..autotmp_2+80(SP)
- 0x005500085 (/root/workspace/t.go:9) LEAQ runtime.staticuint64s(SB), DX
- 0x005c00092 (/root/workspace/t.go:9) LEAQ (DX)(CX*8), CX
- 0x006000096 (/root/workspace/t.go:9) MOVQ CX, ""..autotmp_2+88(SP)
- 0x006500101 (/root/workspace/t.go:9) TESTB AL, (AX)
- 0x006700103 (/root/workspace/t.go:9) JMP 105
- 0x006900105 (/root/workspace/t.go:9) MOVQ AX, ""..autotmp_3+96(SP)
- 0x006e00110 (/root/workspace/t.go:9) MOVQ $1, ""..autotmp_3+104(SP)
- 0x007700119 (/root/workspace/t.go:9) MOVQ $1, ""..autotmp_3+112(SP)
- 0x008000128 (/root/workspace/t.go:9) LEAQ go.string."%b\n"(SB), CX
- 0x008700135 (/root/workspace/t.go:9) MOVQ CX, (SP)
- 0x008b00139 (/root/workspace/t.go:9) MOVQ $3, 8(SP)
- 0x009400148 (/root/workspace/t.go:9) MOVQ AX, 16(SP)
- 0x009900153 (/root/workspace/t.go:9) MOVQ $1, 24(SP)
- 0x00a200162 (/root/workspace/t.go:9) MOVQ $1, 32(SP)
- 0x00ab00171 (/root/workspace/t.go:9) PCDATA $1, $0
- 0x00ab00171 (/root/workspace/t.go:9) CALL fmt.Printf(SB)
- ......
通過匯編可以看到,通過type.uint8(SB), DX對(duì)運(yùn)算結(jié)果進(jìn)行了類型轉(zhuǎn)換。
因此,我們可以得出結(jié)論:-a是a與負(fù)號(hào)(-)的一種運(yùn)算,運(yùn)算結(jié)果的最終類型會(huì)被轉(zhuǎn)換為與a一致。
總結(jié)
本文通過若干示例,展示了無符號(hào)類型與有符號(hào)類型的差別和注意事項(xiàng)。
那么,什么時(shí)候用無符號(hào)類型,什么時(shí)候用有符號(hào)類型呢?
- 運(yùn)算結(jié)果期待包含負(fù)數(shù),則不能用無符號(hào)類型,此時(shí)最好使用有符號(hào)類型
- 運(yùn)算結(jié)果不需要包含負(fù)數(shù),并且希望類型的正數(shù)值域足夠大,此時(shí)最好使用無符號(hào)類型
- 能不用無符號(hào)類型就少用無符號(hào)類型,減少bug產(chǎn)生!!!
其他特殊場(chǎng)景,如:在go語(yǔ)言runtime中GPM的邏輯處理器P結(jié)構(gòu)上,P存儲(chǔ)goroutine的本地隊(duì)列頭尾位置使用了無符號(hào)類型。
- type p struct {
- ......
- // Queue of runnable goroutines. Accessed without lock.
- runqhead uint32// 本地運(yùn)行隊(duì)列 頭位置
- runqtail uint32// 本地運(yùn)行隊(duì)列 尾位置
- runq [256]guintptr // 每個(gè)P可以有256個(gè)G
- ......
- }
- // runqput tries to put g on the local runnable queue.
- // If next if false, runqput adds g to the tail of the runnable queue.
- // If next is true, runqput puts g in the _p_.runnext slot.
- // If the run queue is full, runnext puts g on the global queue.
- // Executed only by the owner P.
- // runqput把G放到p里。如果next為true,就放到下一個(gè)。否則就追加到隊(duì)尾。如果隊(duì)列滿了,就放到全局隊(duì)列。
- func runqput(_p_ *p, gp *g, next bool) {
- ......
- h := atomic.Load(&_p_.runqhead) // load-acquire, synchronize with consumers
- t := _p_.runqtail
- // 放本地隊(duì)列
- ift-h < uint32(len(_p_.runq)) {
- _p_.runq[t%uint32(len(_p_.runq))].set(gp)
- atomic.Store(&_p_.runqtail, t+1) // store-release, makes the item available for consumption
- return
- }
- ......
- }
由于t、h的數(shù)值是一直在進(jìn)行+1操作,會(huì)超過uint32的最大表示范圍。
思考當(dāng) t、h溢出之后會(huì)怎么樣?會(huì)有問題嗎?