虛擬映射和mmap()
虛存映射
我們知道,程序是存儲在磁盤上到靜態(tài)文件;進(jìn)程是對程序到一次運行過程。在進(jìn)程開始運行時,進(jìn)程的代碼和數(shù)據(jù)等內(nèi)容必須裝入到進(jìn)程用戶空間到適當(dāng)區(qū)域。這些區(qū)域也就是所謂的代碼段和數(shù)據(jù)段等,而被裝入的數(shù)據(jù)和代碼等內(nèi)容被稱為進(jìn)程的可執(zhí)行映像。從上面都描述中可以發(fā)現(xiàn),進(jìn)程在運行時并不是將程序一下子就裝入到物理內(nèi)存,而只是將程序裝入到進(jìn)程的用戶空間,這個裝入的過程稱為虛存映射。
一個源程序在成為可執(zhí)行文件的過程中會經(jīng)歷預(yù)處理、編譯、匯編和鏈接四個階段。因此,進(jìn)程要成功運行不僅要在其用戶空間裝入進(jìn)程映像,也要裝入該進(jìn)程所用到到函數(shù)庫以及鏈接程序等。所以,一個進(jìn)程到用戶空間就被分為若干個內(nèi)存區(qū)域。linux使用mm_struct結(jié)構(gòu)來描述一個進(jìn)程到用戶地址空間,使用vm_area_struct結(jié)構(gòu)來描述進(jìn)程地址空間中的一個內(nèi)存區(qū)域。因此,一個vm_area_struct結(jié)構(gòu)可能代表進(jìn)程到數(shù)據(jù)段,也可能代表鏈接程序到代碼段等。
進(jìn)程的虛存映射所做的只是將磁盤上到文件映射到該進(jìn)程的用戶地址空間,并沒有建立虛擬內(nèi)存到物理內(nèi)存的映射。當(dāng)某個可執(zhí)行映像映射到進(jìn)程用戶空間并開始執(zhí)行時,只有很少一部分虛擬頁被裝入了物理內(nèi)存。在進(jìn)程后續(xù)到執(zhí)行過程中,如果需要訪問到數(shù)據(jù)并不在物理內(nèi)存中,則產(chǎn)生一個缺頁中斷(其實是異常),將所需頁從交換區(qū)或磁盤中調(diào)入物理內(nèi)存,這個過程即虛擬內(nèi)存中到請頁機制。
進(jìn)程到虛存區(qū)
那么對于一個任意的進(jìn)程,我們可以通過下面到方法查看其地址空間中到內(nèi)存區(qū)域。
我們先看一個簡單的測試程序:
- #include < stdio.h >
- #include < stdlib.h >
- int main()
- {
- int i=1;
- char *str=NULL;
- printf("hello,world!\n");
- str=(char *)malloc(sizeof(char)*1119);
- sleep(1000);
- return 0;
- }
這個程序中使用到了malloc函數(shù),因此str變量存儲于堆中。我們通過打印/proc/3530/maps文件,即可看到該進(jìn)程的內(nèi)存空間劃分。其中3530是該進(jìn)程的id。
每一行信息依次顯示的內(nèi)容為內(nèi)存區(qū)域其實地址-終止地址,訪問權(quán)限,偏移量,主設(shè)備號:次設(shè)備號,inode,文件。
上面的信息不但包含了test可執(zhí)行對象的各內(nèi)存區(qū)域,而且還分別顯示了 /lib/ld-2.11.1.so(動態(tài)連接程序)文件和/lib/tls/i686/cmov/libc-2.11.1.so(C庫)文件的內(nèi)存區(qū)域信息。
我們從某個內(nèi)存區(qū)域的訪問權(quán)限上可以大致判斷該區(qū)域的類型。各個屬性符號的意義為:r-read,w-write,x-execute,s-shared,p-private。因此,r-x一般代表程序的代碼段,即可讀,可執(zhí)行。rw-可能代表數(shù)據(jù)段,BSS段和堆棧段等,即可讀,可寫。堆棧段從行信息的文件名就可以區(qū)分;如果某行信息的文件名為空,那么可能是BSS段。另外,上述test進(jìn)程共享了內(nèi)核動態(tài)庫,所以在00441000-00442000行處文件名顯示為vdso(Virtual Dynamic Shared Object)。
mmap系統(tǒng)調(diào)用
通過mmap系統(tǒng)調(diào)用可以在進(jìn)程到用戶空間中創(chuàng)建一個新到虛存區(qū)。該系統(tǒng)調(diào)用到原型如下:
該函數(shù)可以將以打開的文件映射到進(jìn)程用戶空間到一片內(nèi)存區(qū)上,執(zhí)行成功后,該函數(shù)返回這段映射區(qū)到首地址。用戶得到這片虛存的首地址后,就可以像訪問內(nèi)存那樣訪問文件。
該系統(tǒng)調(diào)用的參數(shù)說明如下:
addr:映射到用戶地址空間到起始地址;
length:映射區(qū)以字節(jié)為單位到長度;
prot:對映射區(qū)到訪問模式。包括PROT_EXEC(可執(zhí)行),PROT_READ (可讀),PROT_WRITE(可寫),PROT_NONE(文件不可訪問)。這個訪問模式不能超過所映射文件到打開模式。比如被映射的文件打開模式為只讀,那么此處到訪問模式不能是可讀寫的。
flags:這個字段比較靈活,不同到標(biāo)志有不同的功能,具體如下:
MAP_SHARED:創(chuàng)建一個可被子進(jìn)程共享的映射區(qū);
MAP_PRIVATE:創(chuàng)建一個“寫實復(fù)制”的映射區(qū);
MAP_ANONYMOUS:創(chuàng)建一個匿名到映射區(qū),該虛存區(qū)與進(jìn)程無關(guān);
fd:所要映射到進(jìn)程用戶空間的文件描述符,該文件必須為以打開的文件;
offset:文件的起始映射偏移量;
mmap()舉例
在該程序中,首先以只讀方式打開文件test.c,再通過該文件返回到文件描述符和mmap函數(shù)將test.c文件映射到當(dāng)前進(jìn)程到用戶地址空間中。成功執(zhí)行mmap函數(shù)后,buf被賦值為所映射的虛存區(qū)的首地址。注意,mmap函數(shù)返回的是void型指針,而buf是char型指針。將mmap返回值賦值給buf變量時,自動將void*轉(zhuǎn)化為char*型。
***,就像平常我們使用一個char型指針變量那樣,依次打印出buf中到數(shù)據(jù)。
try一下!