五分鐘掃盲:程序在計算機(jī)中是如何運(yùn)行起來的
本文并不會深入底層寄存器指令與硬件等內(nèi)容,只是借此主題為后續(xù)內(nèi)存管理章節(jié)作掃盲,并幫助各位對分層存儲體系有一個整體的把握,以及一個程序在這樣的存儲體系上,究竟是如何運(yùn)行起來的,這些存儲器在這個過程又分別扮演了什么角色。
為什么設(shè)計了分層存儲體系
其實(shí)早在操作系統(tǒng)系列開篇的那篇文章中,我就簡單介紹過分層存儲體系(Memory Hierarchy),先來回顧下(這里我參考的是《現(xiàn)代操作系統(tǒng) — 第三版》這本書,其他有些資料可能會劃分的更為細(xì)致,不過在理解本文的目的上,以下劃分已經(jīng)足夠清晰了):
各位不妨想一想,為什么需要設(shè)計出這樣一個分層的存儲體系來供計算機(jī)使用呢?
首先,有一個觀點(diǎn)不用多說,每個人都希望自己的計算機(jī)擁有這樣一個存儲器:它容量無限大,CPU 訪問它的速度無限快,并且能夠永久性的存儲數(shù)據(jù)(斷電不會丟失數(shù)據(jù)),而且價格不能太高昂。
But,遺憾的是,現(xiàn)階段的技術(shù)仍然滿足不了我們的幻想。
為此,經(jīng)過多年的探索,人們提出了分層存儲體系的概念,把我們的幻想一個一個拆開對應(yīng)到不同的存儲器上。
在這個體系中,計算機(jī)擁有若干 KB 超級快速、超級昂貴且易失性的寄存器;若干 MB 快速、昂貴且易失性的高速緩存(cache);若干 GB 的速度與價格都適中、且同樣易失性的內(nèi)存;以及若干 TB 低速、廉價、非易失性的磁盤存儲;另外還有諸如磁帶等可移動的存儲裝置。
至于為什么這些存儲器的造價不同,那就和它們的成本、材料、制作工藝等息息相關(guān)了。寄存器超級快速且超級昂貴的原因就是它和 CPU 的制作材料是相同的,所以 CPU 訪問起來幾乎是沒有時延的。
另外,這里多提一嘴內(nèi)存,關(guān)于內(nèi)存的分類眾說紛紜,我覺得各位對內(nèi)存的概念有大體的把握就行,不必過度死扣細(xì)節(jié)。
內(nèi)存也經(jīng)常被人們稱為主存和隨機(jī)訪問存儲器(Random Access Memory,RAM),還有我們上文說到內(nèi)存是易失性的,其實(shí)這都不是絕對正確的,只不過是通俗的說法并且被大眾所認(rèn)可。
現(xiàn)在許多計算機(jī)都已經(jīng)在使用少量的非易失性隨機(jī)訪問存儲器,也就是只讀存儲器(Read Only Memory,ROM),它在工廠中就被編程完畢,然后再也不能被修改。ROM 速度快并且造價低廉,很多開發(fā)商都會把用于啟動計算機(jī)的引導(dǎo)加載模塊存放在 ROM 中。
裝入內(nèi)存,讓程序跑起來
這里我先開門見山的總結(jié)一下內(nèi)存和磁盤的區(qū)別,也方便大家更好的理解下面的例子。通俗來說,內(nèi)存決定了你的計算機(jī)能夠同時流暢運(yùn)行多少個應(yīng)用程序,而磁盤決定了你的計算機(jī)能夠下載安裝多少個應(yīng)用程序。
舉個例子,這里面涉及到一個很重要的概念,各位認(rèn)真看哈:
比方說你的計算機(jī)上安裝了 WeChat,你雙擊了 WeChat 快捷方式,操作系統(tǒng)就會打開 WeChat 軟件。
那么,各位有沒有想過,在分層的存儲體系上,WeChat 或者各種應(yīng)用程序在你的計算機(jī)上究竟是怎么跑起來的呢?這些存儲器在這個過程又分別扮演了什么角色呢?
首先,有一點(diǎn)你要明確,你安裝的 WeChat 軟件是保存在磁盤中的。軟件安裝的本質(zhì)是什么?各位應(yīng)該也都明白,就是將很多數(shù)據(jù)的集合存儲到磁盤上。
雙擊 WeChat 快捷方式,操作系統(tǒng)就會知道你要運(yùn)行這個軟件,它會在磁盤中找到你安裝的 WeChat 軟件,將運(yùn)行所需要的數(shù)據(jù)從磁盤中復(fù)制到內(nèi)存里。注意這里!WeChat 不是直接磁盤中運(yùn)行的,而是在內(nèi)存中運(yùn)行的。
至于原因,那當(dāng)然是內(nèi)存的讀寫速度比磁盤快得多。
所以,為了緩和磁盤之間的速度不匹配問題,程序執(zhí)行前必須將硬盤上的數(shù)據(jù)復(fù)制到內(nèi)存,CPU 才能夠著手處理,這個過程就叫作載入內(nèi)存(Load into Memory),完成這個過程需要一個不可或缺的程序:載入器或者說加載器(Loader)。
CPU 直接與內(nèi)存進(jìn)行交互,它會讀取內(nèi)存中的數(shù)據(jù)進(jìn)行處理,并將結(jié)果返回并保存到內(nèi)存。當(dāng)然,如果你還需要將數(shù)據(jù)保存到磁盤,復(fù)制操作也會在內(nèi)存和磁盤直接發(fā)生一次。
比如說,我們打開了某個 Word 文檔,并輸入了一些文字,雖然我們直觀看到的已經(jīng)發(fā)生變化了,但是磁盤中存儲的文檔仍然沒有改變,它仍然是之前的數(shù)據(jù),新增的文字只是暫時保存到了內(nèi)存,只有我們手動保存了這篇文檔比如 Ctrl + s 才會將修改保存到磁盤中。
而由于內(nèi)存是易失性的,也就是說斷電后數(shù)據(jù)就丟失了,所以如果你編輯完 Word 文檔忘記保存或者斷電導(dǎo)致關(guān)機(jī)了,那么你將永遠(yuǎn)無法找回這些內(nèi)容(悲劇 ??)。
寄存器與高速緩存去哪里了
讀到這里,各位肯定會有所困惑,上面不是說了還有高速緩存嗎?還有寄存器嗎?它們不是也用來存儲的嗎,在這個過程中它們?nèi)ツ睦锪?
OK,從 CPU 的角度來說,內(nèi)存是什么?就是一個笨逼,它僅僅是一個存放指令和數(shù)據(jù)的地方,計算機(jī)并不能在內(nèi)存中完成計算功能。
若把 CPU 比作人類的靈魂,內(nèi)存和磁盤就是人類的軀體。沒有了 CPU,內(nèi)存和磁盤就淪為一具行尸走肉。當(dāng)然,沒有了內(nèi)存和磁盤也不行,畢竟 CPU 的存儲能力非??蓱z。
比如說我們要計算 a = b + c,必須將變量 a、b、c 從內(nèi)存中讀取到 CPU 內(nèi)部才能進(jìn)行加法運(yùn)算,而在 CPU 中執(zhí)行運(yùn)算工作的部件,就是運(yùn)算單元,可以說運(yùn)算單元就是 CPU 的大腦。
我們不妨來看一下 CPU 的結(jié)構(gòu):
可以看出,寄存器(Register)和高速緩存都直接內(nèi)嵌在 CPU 中。
先說寄存器,其造價高昂且容量有限,功能涵括數(shù)學(xué)運(yùn)算、控制程序的執(zhí)行流程、標(biāo)記 CPU 運(yùn)行狀態(tài)等。
有些同學(xué)可能認(rèn)為寄存器就是一個部件,其實(shí)不然,現(xiàn)代的 CPU 基本都內(nèi)置了幾十個甚至上百個寄存器,根據(jù)功能的不同,這些寄存器也擁有不同的名字。
例如,EAX 寄存器通常被用在加法運(yùn)算中,用來保存某個加數(shù)或運(yùn)算結(jié)果;EIP 寄存器中存儲的值是下一條指令的地址,CPU 執(zhí)行完當(dāng)前指令后,就會根據(jù) EIP 的值去尋找下一條指令,也就是說如果我們改變 EIP 寄存器的值,也就會相應(yīng)的改變程序的執(zhí)行流程。
另外,寄存器存放的是二進(jìn)制數(shù)據(jù),我們常常說 32 位或者 64 位的 CPU,其實(shí)指的就是寄存器的位數(shù)。
再來看緩存,為啥 CPU 里面還要弄個緩存呢?那當(dāng)然還是離不開讀寫速度的問題,雖然 CPU 訪問內(nèi)存的速度相比于磁盤來說已經(jīng)足夠快了,But,真要和高速緩存做個對比,那根本就不是一個數(shù)量級的,蚍蜉撼樹罷了。
如果 CPU 每次都從內(nèi)存中讀取數(shù)據(jù),會嚴(yán)重拖慢其運(yùn)行速度,CPU 不得不浪費(fèi)大量的時間來等待內(nèi)存中數(shù)據(jù)操作的結(jié)束。為此,我們在 CPU 內(nèi)部設(shè)置一個緩存,將使用頻繁的數(shù)據(jù)暫時從內(nèi)存中讀取到緩存里來,這樣,如果緩存命中,就直接從緩存中讀取即可,不必訪問內(nèi)存了。
所以很顯然,緩存容量越大的 CPU 其性能就越好。當(dāng)然,畢竟造價高昂,搞不起超大容量的緩存,大小有限,所以對于緩存中數(shù)據(jù)取舍的種種算法又是一門值得深究的話題。
另外,緩存的概念其實(shí)并不僅僅局限于此。只要存在大量的資源可以劃分成小的部分,那么,這些資源中的某些部分就會比其他部分更頻繁的得到使用,使用緩存就可以帶來性能上的改善。在操作系統(tǒng)中,除了 CPU 中的緩存,內(nèi)存和硬盤之間其實(shí)也有緩存的概念,也就是下面我們將要討論的虛擬內(nèi)存。
虛擬內(nèi)存和局部性原理
虛擬內(nèi)存(Virtual Memory)、虛擬存儲器,這倆其實(shí)是一個東西,只不過網(wǎng)絡(luò)上各種博客說法不一樣,沒有統(tǒng)一起來,容易讓萌新摸不著頭腦。
上文說的種種只是在運(yùn)行一個 WeChat 程序的情況下,各位不妨想一下,如果你的電腦內(nèi)存只有 4G,你同時運(yùn)行了 WeChat、QQ、網(wǎng)易云音樂、Chrome 等等很多應(yīng)用程序,假設(shè)它們加起來一共需要 5G 的內(nèi)存空間,也就意味著需要從磁盤復(fù)制 5G 的數(shù)據(jù)到只有 4G 存儲空間的內(nèi)存,顯然,這是不可能的。
為此,操作系統(tǒng)中引入了虛擬內(nèi)存的概念。當(dāng)程序運(yùn)行需要的存儲空間大于內(nèi)存的容量時,會將內(nèi)存中暫時不用的數(shù)據(jù)寫回磁盤,當(dāng)需要這些數(shù)據(jù)時再從磁盤中重新讀取,而內(nèi)存中存放的數(shù)據(jù)也就是所謂的熱點(diǎn)數(shù)據(jù)。這樣,磁盤中就會有一部分空間用來存放內(nèi)存中暫時不用的數(shù)據(jù),這一部分空間就叫做虛擬內(nèi)存。我們上面所說的情況就需要在磁盤上分配(5 - 4 = 1G)的虛擬內(nèi)存。
這樣,虛擬內(nèi)存中 "虛擬" 二字的含義也就不言而喻了。只有 4G 內(nèi)存,但是可以正常運(yùn)行占用內(nèi)存超過 4G 的應(yīng)用程序,在用戶看來他似乎擁有了一個比實(shí)際內(nèi)存大得多的內(nèi)存。當(dāng)然,實(shí)際的物理內(nèi)存大小并沒有發(fā)生改變,只是在邏輯上進(jìn)行了擴(kuò)充。
可以這么理解,引入虛擬內(nèi)存的概念后,在內(nèi)存和磁盤之間,內(nèi)存就充當(dāng)了緩存的作用。CPU 優(yōu)先從內(nèi)存中獲取數(shù)據(jù),如果命中,就不需要去訪問磁盤。這里和我們上文所說的 CPU 中的緩存和內(nèi)存之間的關(guān)系是不是一模一樣?
當(dāng)然,我們?yōu)槭裁纯梢赃@樣做?這些數(shù)據(jù)為啥就能被調(diào)入緩存/內(nèi)存呢?虛擬內(nèi)存存在的理論支撐是什么?這就是著名的局部性原理。局部性原理包含兩種,時間局部性和空間局部性:
1)時間局部性原理:如果 CPU 執(zhí)行了程序中的某條指令,那么不久后這條指令很有可能再次執(zhí)行;如果某個數(shù)據(jù)被訪問過,不久之后該數(shù)據(jù)很可能再次被訪問;
2)空間局部性原理:一旦程序訪問了某個存儲單元,在不久之后,其附近的存儲單元也很有可能被訪問,因?yàn)楹芏鄶?shù)據(jù)在內(nèi)存中都是連續(xù)存放的,并且程序的指令也是順序地在內(nèi)存中存放的。