CPU 是如何識(shí)數(shù)的?
先來(lái)看一個(gè)簡(jiǎn)單的問題:小孩子都知道數(shù)數(shù):1,2,3,4,5,6,7,8,9,10,可為什么要這樣數(shù)呢?為什么不是1,2,3,4,5,6,10呢?
一種比較流行的解釋是因?yàn)槿祟愑?0個(gè)手指:
所以人類的數(shù)字系統(tǒng)就是10進(jìn)制的,如果這個(gè)解釋成立,那么變色龍的數(shù)字系統(tǒng)應(yīng)該是4進(jìn)制圖片:
而計(jì)算機(jī)的手是單指,所以是2進(jìn)制:
哈哈,開個(gè)玩笑,其實(shí)計(jì)算機(jī)在最最最最底層就是一個(gè)個(gè)開關(guān),因此計(jì)算機(jī)系統(tǒng)是2進(jìn)制,關(guān)于CPU的構(gòu)造你可以參考《你管這破玩意叫 CPU?》:
數(shù)字 0 與正整數(shù)
0這個(gè)數(shù)字其實(shí)有非常重要的意義,可能大家都沒想過(guò)這個(gè)問題,沒關(guān)系,我們來(lái)看兩個(gè)不同的數(shù)字系統(tǒng):阿拉伯?dāng)?shù)字和羅馬數(shù)字:
注意,羅馬數(shù)字中沒有 “0” 這個(gè)概念,你可能會(huì)想,這有什么大不了的嗎?讓我們來(lái)看一個(gè)例子,數(shù)字205,分別在兩種系統(tǒng)的表示。
羅馬:CCV
阿拉伯:205
0的出現(xiàn)可以讓阿拉伯?dāng)?shù)字系統(tǒng)中205這樣寫:
可以看到,在阿拉伯系統(tǒng)中數(shù)值和數(shù)字所在的位置有直接關(guān)系,這就是進(jìn)位制,而在羅馬數(shù)字系統(tǒng)則沒有進(jìn)位制,這使得羅馬數(shù)字在表示大數(shù)值時(shí)非常困難。
計(jì)算機(jī)系統(tǒng)中的二進(jìn)制同樣是進(jìn)位制,數(shù)字5用二進(jìn)制表示就是101:
使用 k 個(gè)bit,那么可以表示 2^k 個(gè)整數(shù),范圍從 0 到 2^k - 1,假設(shè) k 有 8 位,那么表示范圍就是 0 到 255,當(dāng)然這里說(shuō)的是無(wú)符號(hào)正整數(shù)。
現(xiàn)在我們可以表示正整數(shù)了,但真正有用的計(jì)算不可避免會(huì)涉及到負(fù)數(shù),也就是帶符號(hào)整數(shù),而這也是真正有趣的地方。
有符號(hào)整數(shù)
正整數(shù)的表示非常簡(jiǎn)單,給定 k 個(gè)bit,那么我們可以表示 2^k 個(gè)數(shù),假設(shè)k為4,那么我們可以表示16個(gè)數(shù)字。
如果要考慮有符號(hào)整數(shù)呢?
你可能會(huì)想這還不簡(jiǎn)單,一半一半嘛!其中一半用來(lái)表示正數(shù),另一半用來(lái)表示負(fù)數(shù)!
假設(shè)有4個(gè)比特位,如果用來(lái)表示無(wú)符號(hào)正數(shù),就是0 ~ 15,而如果要表示有符號(hào)整數(shù),那么其中一半給到+1 ~ +7,另一半給到-1 ~ -7,
一切看最左邊的 bit 是 0,如果最左邊的 bit 位是 0 則表示正數(shù),否則表示負(fù)數(shù)。
現(xiàn)在我們已經(jīng)知道正負(fù)數(shù)是通過(guò)什么來(lái)決定的了,接下來(lái)的問題就是負(fù)數(shù)該怎么表示呢?也就是說(shuō)對(duì)于比如-2,現(xiàn)在我們只知道其最左邊的 bit 位是1,那么右邊的這些 bit 到底該是多少呢?
關(guān)于這一問題就三種設(shè)計(jì)方法。
方法1:正數(shù)加上負(fù)號(hào)即對(duì)應(yīng)負(fù)數(shù)
第一種設(shè)計(jì)方法很簡(jiǎn)單,既然0010表示+2,那么如果最左邊的bit位替換成1就表示對(duì)應(yīng)的負(fù)數(shù),即1010表示-2,這種設(shè)計(jì)方法簡(jiǎn)單直接,這是最符合人類的思維的設(shè)計(jì)(不一定最好)。
如果這樣設(shè)計(jì)的話,4個(gè) bit 位能表示的所有數(shù)字就是:
你給這種非常符合人類思維的數(shù)字表示方法起了個(gè)名字,原碼。
這種設(shè)計(jì)下會(huì)有一個(gè)奇怪的表示:0000表示0這沒什么問題,1000會(huì)表示 -0,這會(huì)導(dǎo)致出現(xiàn)-0這樣的數(shù)字,其實(shí) 0 和 -0 不應(yīng)該有什么區(qū)別。
身為設(shè)計(jì)天才的你顯然不滿足于此,是不是還有其它設(shè)計(jì)方法?
方法2:翻轉(zhuǎn)
你覺得第一種表示方法也就是原碼太原始,可以說(shuō)基本上沒什么設(shè)計(jì),你突發(fā)奇想,既然0010表示+2,那么將其全部翻轉(zhuǎn),即1101來(lái)表示-2好了,即:
你給這種表示方法也起了名字,反碼。
在反碼表示法下,也存在-0,0000表示0,全部翻轉(zhuǎn)也就是1111來(lái)表示-0,可以看到這和原碼表示方法差別沒那么大。
設(shè)計(jì)計(jì)算機(jī)很容易嗎?
到這里有的同學(xué)可能會(huì)想,計(jì)算機(jī)設(shè)計(jì)者其實(shí)怎么來(lái)表示有符號(hào)數(shù)其實(shí)都是可以的,原碼可以,反碼也可以,都能表示出來(lái),設(shè)計(jì)計(jì)算機(jī)太容易了吧!
你猜的沒錯(cuò),就是這么容易!如果你是計(jì)算機(jī)的創(chuàng)造者,怎么設(shè)計(jì)都可以!最初的計(jì)算機(jī)設(shè)計(jì)者真的可以有很多表示數(shù)字的方法,采用反碼表示數(shù)字的計(jì)算機(jī)系統(tǒng)在歷史上真的出現(xiàn)過(guò)!!!但這些表示方法不約而同都有一個(gè)問題,那就是兩數(shù)相加。
不簡(jiǎn)單的兩數(shù)相加
我們以2 + ( -2 )為例。
在原碼表示法下,2為0010,-2為1010,那么計(jì)算機(jī)該怎么做2 + ( -2 )加法呢?
可是1100在原碼表示法下是 -4,這與原碼表示法本身是矛盾的。
再來(lái)看看反碼,2為0010,-2為1101,兩數(shù)相加:
1111在反碼表示下為-0,雖然-0不夠優(yōu)雅,但好歹和反碼表示法本身沒有矛盾,這大概就是為什么早期會(huì)有計(jì)算機(jī)采用反碼表示數(shù)字的原因。
在《你管這破玩意叫CPU?》一文中我們知道,計(jì)算機(jī)加法是通過(guò)加法器組合電路實(shí)現(xiàn)的,而這里的不管是原碼還是反碼,要想計(jì)算加法都不可避免的要在前面提到的加法器之上額外添加組合電路來(lái)確保有符號(hào)數(shù)相加的正確性,這無(wú)疑會(huì)增加電路設(shè)計(jì)的復(fù)雜度。
人是懶惰的也是聰明的,我們就沒有一種2+-2就是0(0000)的數(shù)字表達(dá)方法嗎?
新的表示方法
現(xiàn)在,對(duì)于最左邊的bit位來(lái)說(shuō),0表示正數(shù),1表示負(fù)數(shù)是沒有什么異議的,這里的關(guān)鍵在于我們需要一種表示方法,可以讓A+(-A) = 0,而且這里0的二進(jìn)制也是0,如果是4個(gè)bit為的話就應(yīng)該是0000。
假設(shè)A=2,那么我們重點(diǎn)研究下2+-2 = 0(0000)的表示方法。
對(duì)于2來(lái)說(shuō),很簡(jiǎn)單就是0010,對(duì)于-2來(lái)說(shuō),現(xiàn)在我們只能確定最左邊的bit位是1,也就是說(shuō) :
顯然 -2 應(yīng)該用1110來(lái)表示,這樣2+-2就真的是0了,由此推斷:
從圖中可以看出這種表示方法下就沒有-0了。
注意看-1和0,分別是1111和0000,當(dāng)我們讓-1(1111)加上1(0001)時(shí),我們確實(shí)得到了0000,不過(guò)還有一個(gè)進(jìn)位,實(shí)際上我們得到的是10000,但我們可以放心的忽略掉該進(jìn)位。
這種表示方法最美妙的地方在于《你管這破玩意叫CPU》一文中提到的加法器不用修改就可以直接計(jì)算有符號(hào)數(shù)字的加法。
你可以自己試驗(yàn)幾個(gè)數(shù)字相加就能發(fā)下這種表示方法的奇妙之處,
你給這種數(shù)字表達(dá)方法起了名字,補(bǔ)碼,這現(xiàn)代計(jì)算機(jī)系統(tǒng)所采用的數(shù)字表示方法。
采用補(bǔ)碼,如果是4個(gè)bit位,那么我們可以表示的范圍是-8 ~ 7。
再來(lái)仔細(xì)看一下反碼和補(bǔ)碼:
因?yàn)檠a(bǔ)碼不需要表示 -0 這個(gè)奇葩,你會(huì)發(fā)現(xiàn)一個(gè)很有意思的規(guī)律,那就是負(fù)數(shù)的反碼加上1就是對(duì)應(yīng)的補(bǔ)碼,這是計(jì)算機(jī)教科書在講解補(bǔ)碼時(shí)很重要的一個(gè)知識(shí)點(diǎn),現(xiàn)在你應(yīng)該知道這個(gè)知識(shí)點(diǎn)是怎么來(lái)的了吧!
CPU真的識(shí)數(shù)嗎?
就像前面提到的,現(xiàn)代計(jì)算機(jī)采用補(bǔ)碼的根本原因在于這種表示方法可以簡(jiǎn)化電路設(shè)計(jì),盡管補(bǔ)碼對(duì)人類來(lái)說(shuō)不夠直觀。
到這里我們可以看到,在計(jì)算機(jī)科學(xué)中,最符合人類思維的設(shè)計(jì)并不一定對(duì)計(jì)算機(jī)最優(yōu),這也是最迷人的地方,人和機(jī)器畢竟不同嘛!
讓我們?cè)賮?lái)看下采用補(bǔ)碼時(shí)2+-2 的計(jì)算過(guò)程:
和十進(jìn)制加法一樣,從右到左,如果產(chǎn)生進(jìn)位,那么進(jìn)位就要參與左邊一列的計(jì)算。
注意,在這個(gè)過(guò)程中加法器關(guān)心這個(gè)數(shù)字是正數(shù)還是負(fù)數(shù)了嗎?
答案是沒有,加法器或者更具體是CPU中的ALU根本就不關(guān)心是正數(shù)還是負(fù)數(shù),它只知道我要進(jìn)行加法計(jì)算,除此之外不 CARE 任何其它信息,至于數(shù)字該采用反碼還是補(bǔ)碼這些是人類需要理解的,確切來(lái)說(shuō)是編譯器需要來(lái)理解的,程序員都無(wú)需關(guān)心,但程序員需要知道數(shù)據(jù)類型的表示范圍。
現(xiàn)在你能明白補(bǔ)碼以及 CPU 是如何識(shí)數(shù)的了吧。
總結(jié)
在本文我們?cè)敿?xì)講解了CPU是如何識(shí)數(shù)這一主題,正如本文所言,CPU其實(shí)本質(zhì)的上是不識(shí)數(shù)的,也不需要識(shí)數(shù),這正是補(bǔ)碼這一數(shù)字表示方法的優(yōu)點(diǎn)。
希望本文能對(duì)大家理解計(jì)算機(jī)系統(tǒng)的數(shù)字表示有所幫助。
本文轉(zhuǎn)載自微信公眾號(hào)「碼農(nóng)的荒島求生」,可以通過(guò)以下二維碼關(guān)注。轉(zhuǎn)載本文請(qǐng)聯(lián)系碼農(nóng)的荒島求生公眾號(hào)。