浮點(diǎn)數(shù)的秘密
1 前言
我們在學(xué)習(xí) C 語言時,通常認(rèn)為浮點(diǎn)數(shù)和小數(shù)是等價的,并沒有嚴(yán)格區(qū)分它們的概念,這也并沒有影響到我們的學(xué)習(xí),原因就是浮點(diǎn)數(shù)和小數(shù)是綁定在一起的,只有小數(shù)才使用浮點(diǎn)格式來存儲。
其實,整數(shù)和小數(shù)可以都使用定點(diǎn)格式來存儲,也可以都使用浮點(diǎn)格式來存儲,但實際情況卻是,C 語言使用定點(diǎn)格式存儲整數(shù),使用浮點(diǎn)格式存儲小數(shù),這是在 “數(shù)值范圍” 和 “數(shù)值精度” 兩項重要指標(biāo)之間追求平衡的結(jié)果。
2 什么是浮點(diǎn)數(shù)?
浮點(diǎn)型簡單講就是實數(shù)的意思。浮點(diǎn)數(shù)在計算機(jī)中用以近似表示任意某個實數(shù)。具體的說,這個實數(shù)由一個整數(shù)或定點(diǎn)數(shù)(即尾數(shù))乘以某個基數(shù)(計算機(jī)中通常是 2)的整數(shù)次冪得到,這種表示方法類似于基數(shù)為 10 的科學(xué)記數(shù)法。
3 浮點(diǎn)數(shù)在內(nèi)存中的存儲
首先明確一點(diǎn),無論是整型、浮點(diǎn)型還是字符等等數(shù)據(jù)類型在計算機(jī)底層都是以二進(jìn)制的方式存儲的。
浮點(diǎn)數(shù)在內(nèi)存中的存儲和整數(shù)不同,因為整數(shù)都可以轉(zhuǎn)換為一一對應(yīng)的二進(jìn)制數(shù)據(jù)。而浮點(diǎn)數(shù)的存儲是由符號位 (sign) + 指數(shù)位 (exponent) + 小數(shù)位 (fraction) 組成。
- 類型 符號位 指數(shù) 尾數(shù)
- Float 1位(第31位) 8位(第23~30位) 23位(第0~22位)
- Double 1位(第63位) 11位(第52~62位) 52位(第0~51位)
int 和 float 同樣占據(jù)四個字節(jié)的內(nèi)存,但是 float 所能表示的最大值比 int 大得多,其根本原因是浮點(diǎn)數(shù)在內(nèi)存中是以指數(shù)的方式存儲。
浮點(diǎn)數(shù)轉(zhuǎn)換到內(nèi)存中存儲的步驟分為如下三步:
- 將浮點(diǎn)數(shù)轉(zhuǎn)換成二進(jìn)制
- 用科學(xué)計數(shù)法表示二進(jìn)制浮點(diǎn)數(shù)
- 計算指數(shù)偏移后的值
對于第3點(diǎn):計算指數(shù)時需要加上偏移量(后面有介紹為什么使用偏移量),而偏移量的值與浮點(diǎn)數(shù)的類型有關(guān)( float 偏移量值為 127 ,double 偏移量值為 1023)。比方對于指數(shù) 6,float 與 double 類型偏移后的值分別為:
- float : 127 + 6 = 133
- double:1023 + 6 = 1029
4 實例
浮點(diǎn)數(shù)19.625用float是如何存儲的:
- 將浮點(diǎn)數(shù)轉(zhuǎn)換成二進(jìn)制:10011.101(將 19.625 整數(shù)部分采用除 2 取余,小數(shù)部分采用乘 2 取整法);
- 用科學(xué)計數(shù)法表示二進(jìn)制浮點(diǎn)數(shù):1.0011101*2^4;
- 計算指數(shù)偏移后的值:127 + 4 = 131 (10000011);
- 拼接綜上所述,float 類型的 19.625 在內(nèi)存中的值為:0 - 10000011 - 001 1101 0000 0000 0000 0000。
5 float與double范圍和精度
范圍
float和double的范圍是由指數(shù)的位數(shù)來決定的。(因為表示的時候都是1.x * 2^Y的形式,所以忽略了1.x的效果,直接取指數(shù)表示浮點(diǎn)數(shù)的范圍)
- float:
1bit(符號位) 8bits(指數(shù)位) 23bits(尾數(shù)位)
- double:
1bit(符號位) 11bits(指數(shù)位) 52bits(尾數(shù)位)
于是,float的指數(shù)范圍為-127~+128,而double的指數(shù)范圍為-1023~+1024,并且指數(shù)位是按補(bǔ)碼的形式來劃分的。
其中負(fù)指數(shù)決定了浮點(diǎn)數(shù)所能表達(dá)的絕對值最小的非零數(shù);而正指數(shù)決定了浮點(diǎn)數(shù)所能表達(dá)的絕對值最大的數(shù),也即決定了浮點(diǎn)數(shù)的取值范圍。
float的范圍為-2^128 ~ +2^128,也即-3.40E+38 ~ +3.40E+38;
double的范圍為-2^1024 ~ +2^1024,也即-1.79E+308 ~ +1.79E+308。
精度
float和double的精度是由尾數(shù)的位數(shù)來決定的,尾數(shù)越多能表示的小數(shù)點(diǎn)后面有效數(shù)字就越多,因此精度就越高。浮點(diǎn)數(shù)在內(nèi)存中是按科學(xué)計數(shù)法來存儲的,其整數(shù)部分始終是一個隱含著的“1”,由于它是不變的,故不能對精度造成影響。
float:2^23 = 8388608,一共七位,這意味著最多能有 7 位有效數(shù)字,但絕對能保證的為 6 位,也即float的精度為 6~7 位有效數(shù)字;
double:2^52 = 4503599627370496,一共 16 位,同理,double的精度為 15~16 位。
6 解剖:為什么要用偏移量的方式來計算指數(shù)?
如果不采用偏移量的方式:
8 位 2 進(jìn)制數(shù)表示的有符號數(shù)范圍有兩個區(qū)間:0000 0000~0111 1111和1000 0000~1111 1111,分別為0~+127和-127~0。
大家看到這里的問題了吧,有兩個 0 ,一個正 0 和一個負(fù) 0。
如果采用偏移量的方式:
127 轉(zhuǎn)化為二進(jìn)制是:0111 1111
那么
- 當(dāng)我們要表示 -127,則有127-127即0111 1111 - 0111 1111 = 0000 0000
- 當(dāng)我們要表示 -126,則有127-126即0111 1111 - 0111 1110 = 0000 0001
- 當(dāng)我們要表示 -2,則有127-2即0111 1111 - 0000 0010 = 0111 1101
- 當(dāng)我們要表示 -1,則有127-1即0111 1111 - 0000 0001 = 0111 1110
- 當(dāng)我們要表示 0,則有0+127即0000 0000 + 0111 1111 = 0111 1111
- 當(dāng)我們要表示 1,則有1+127即0000 0001 + 0111 1111 = 1000 0000
- 當(dāng)我們要表示 2,則有1+127即0000 0010 + 0111 1111 = 1000 0001
- 當(dāng)我們要表示128,則有128+127即1000 0000 + 0111 1111 = 1111 1111
由上面的例子,我們可以得出規(guī)律,采用移位存儲技術(shù),我們可以使用 8 位二進(jìn)制來表示從-127~+128共計 127 個負(fù)數(shù)+零(0)+ 128 個正數(shù)總共 256 個數(shù),看來使用移位存儲既沒有 +0 和 -0 的問題,又能充分使用新生成的8位二進(jìn)制數(shù)最大限度的表示單精度浮點(diǎn)數(shù)的冪指數(shù),是非常合理的。
本文轉(zhuǎn)載自微信公眾號「C語言與CPP編程」,可以通過以下二維碼關(guān)注。轉(zhuǎn)載本文請聯(lián)系C語言與CPP編程公眾號。