自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

Linux內(nèi)存點滴:用戶進程內(nèi)存空間

存儲 存儲軟件
正在運行的程序,叫進程。每個進程都有完全屬于自己的,獨立的,不被干擾的內(nèi)存空間。此空間,被分成幾個段(Segment),分別是Text, Data, BSS, Heap, Stack。

經(jīng)常使用 top 命令了解進程信息,其中包括內(nèi)存方面的信息。命令top幫助文檔是這么解釋各個字段的。

  1. VIRT , Virtual Image (kb) 
  2. RES, Resident size (kb) 
  3. SHR, Shared Mem size (kb) 
  4. %MEM, Memory usage(kb) 
  5. SWAP, Swapped size (kb) 
  6. CODE, Code size (kb) 
  7. DATA, Data+Stack size (kb) 
  8. nFLT, Page Fault count 
  9. nDRT, Dirty Pages count 

盡管有注釋,但依然感覺有些晦澀,不知所指何意?

進程內(nèi)存空間

正在運行的程序,叫進程。每個進程都有完全屬于自己的,獨立的,不被干擾的內(nèi)存空間。此空間,被分成幾個段(Segment),分別是Text, Data, BSS, Heap, Stack。用戶進程內(nèi)存空間,也是系統(tǒng)內(nèi)核分配給該進程的VM(虛擬內(nèi)存),但并不表示這個進程占用了這么多的RAM(物理內(nèi)存)。這個空間有多大?命令top輸出的VIRT值告訴了我們各個進程內(nèi)存空間的大?。ㄟM程內(nèi)存空間隨著程序的執(zhí)行會增大或者縮?。?。你還可以通過/proc//maps,或者pmap –d 了解某個進程內(nèi)存空間都分布。

比如:

  1. #cat /proc/1449/maps 
  2. … 
  3. 0012e000-002a4000 r-xp 00000000 08:07 3539877    /lib/i386-linux-gnu/libc-2.13.so 
  4. 002a4000-002a6000 r--p 00176000 08:07 3539877    /lib/i386-linux-gnu/libc-2.13.so 
  5. 002a6000-002a7000 rw-p 00178000 08:07 3539877   /lib/i386-linux-gnu/libc-2.13.so 
  6. 002a7000-002aa000 rw-p 00000000 00:00 0 
  7. … 
  8. 08048000-0875b000 r-xp 00000000 08:07 4072287    /usr/local/mysql/libexec/mysqld 
  9. 0875b000-0875d000 r--p 00712000 08:07 4072287    /usr/local/mysql/libexec/mysqld 
  10. 0875d000-087aa000 rw-p 00714000 08:07 4072287   /usr/local/mysql/libexec/mysqld 
  11. … 

PS:線性地址,訪問權(quán)限, offset, 設(shè)備號,inode,映射文件

[[229660]]

VM分配與釋放

“內(nèi)存總是被進程占用”,這句話換過來可以這么理解:進程總是需要內(nèi)存。當(dāng)fork()或者exec()一個進程的時候,系統(tǒng)內(nèi)核就會分配一定量的VM給進程,作為進程的內(nèi)存空間,大小由BSS段,Data段的已定義的全局變量、靜態(tài)變量、Text段中的字符直接量、程序本身的內(nèi)存映像等,還有Stack段的局部變量決定。當(dāng)然,還可以通過malloc()等函數(shù)動態(tài)分配內(nèi)存,向上擴大heap。

動態(tài)分配與靜態(tài)分配,二者***的區(qū)別在于:1. 直到Run-Time的時候,執(zhí)行動態(tài)分配,而在compile-time的時候,就已經(jīng)決定好了分配多少Text+Data+BSS+Stack。2.通過malloc()動態(tài)分配的內(nèi)存,需要程序員手工調(diào)用free()釋放內(nèi)存,否則容易導(dǎo)致內(nèi)存泄露,而靜態(tài)分配的內(nèi)存則在進程執(zhí)行結(jié)束后系統(tǒng)釋放(Text, Data), 但Stack段中的數(shù)據(jù)很短暫,函數(shù)退出立即被銷毀。

我們使用幾個示例小程序,加深理解

  1. /* @filename: example-2.c */ 
  2. #include <stdio.h> 
  3.   
  4. int main(int argc, char *argv[]) 
  5.     char arr[] = "hello world"; /* Stack段,rw--- */ 
  6.     char *p = "hello world";        /* Text段,字符串直接量, r-x--  */ 
  7.     arr[1] = 'l'
  8.     *(++p) = 'l';   /* 出錯了,Text段不能write */ 
  9.     return 0; 
  10. PS:變量p,它在Stack段,但它所指的”hello world”是一個字符串直接量,放在Text段。 
  11.   
  12. /* @filename:example_2_2.c */ 
  13. #include <stdio.h> 
  14. #include <stdlib.h> 
  15. #include <string.h> 
  16.   
  17. char *get_str_1() 
  18.     char str[] = "hello world"
  19.     return str; 
  20.   
  21. char *get_str_2() 
  22.     char *str = "hello world"
  23.     return str; 
  24.   
  25. char *get_str_3() 
  26.     char tmp[] = "hello world"
  27.     char *str; 
  28.     str = (char *)malloc(12 * sizeof(char)); 
  29.     memcpy(str, tmp, 12); 
  30.     return str; 
  31.   
  32. int main(int argc, char *argv[]) 
  33.     char *str_1 = get_str_1();  //出錯了,Stack段中的數(shù)據(jù)在函數(shù)退出時就銷毀了 
  34.     char *str_2 = get_str_2();  //正確,指向Text段中的字符直接量,退出程序后才會回收 
  35.     char *str_3 = get_str_3();  //正確,指向Heap段中的數(shù)據(jù),還沒free() 
  36.     printf("%s\n", str_1); 
  37.     printf("%s\n", str_2); 
  38.     printf("%s\n", str_3); 
  39.     if (str_3 != NULL
  40.     { 
  41.         free(str_3); 
  42.         str_3 = NULL
  43.     } 
  44.     return 0; 
  45. PS:函數(shù)get_str_1()返回Stack段數(shù)據(jù),編譯時會報錯。Heap中的數(shù)據(jù),如果不用了,應(yīng)該盡早釋放free()。 
  46.   
  47. #include <stdio.h> 
  48. #include <stdlib.h> 
  49. #include <string.h> 
  50. #include <unistd.h> 
  51.   
  52. char data_var  = '1'
  53. char *mem_killer() 
  54.    char *p; 
  55.    p = (char *)malloc(1024*1024*4); 
  56.    memset(p, '\0', 1024*1024*4); 
  57.    p = &data_var;   //危險,內(nèi)存泄露 
  58.    return p; 
  59.   
  60. int main(int argc, char *argv[]) 
  61.     char *p; 
  62.     for (;;) 
  63.     { 
  64.         p = mem_killer(); // 函數(shù)中malloc()分配的內(nèi)存沒辦法free() 
  65.         printf("%c\n", *p); 
  66.         sleep(20); 
  67.     } 
  68.     return 0; 

PS:使用malloc(),特別要留意heap段中的內(nèi)存不用時,盡早手工free()。通過top輸出的VIRT和RES兩值來觀察進程占用VM和RAM大小。

本節(jié)結(jié)束之前,介紹工具size。因為Text, BSS, Data段在編譯時已經(jīng)決定了進程將占用多少VM??梢酝ㄟ^size,知道這些信息。

  1. # gcc example_2_3.c -o example_2_3 
  2. size example_2_3 
  3. text data bss dec hex filename 
  4. 1403 272 8 1683 693 example_2_3 

malloc()

編碼人員在編寫程序之際,時常要處理變化數(shù)據(jù),無法預(yù)料要處理的數(shù)據(jù)集變化是否大(phper可能難以理解),所以除了變量之外,還需要動態(tài)分配內(nèi)存。GNU libc庫提供了二個內(nèi)存分配函數(shù),分別是malloc()和calloc()。調(diào)用malloc(size_t size)函數(shù)分配內(nèi)存成功,總會分配size字節(jié)VM(再次強調(diào)不是RAM),并返回一個指向剛才所分配內(nèi)存區(qū)域的開端地址。分配的內(nèi)存會為進程一直保留著,直到你顯示地調(diào)用free()釋放它(當(dāng)然,整個進程結(jié)束,靜態(tài)和動態(tài)分配的內(nèi)存都會被系統(tǒng)回收)。開發(fā)人員有責(zé)任盡早將動態(tài)分配的內(nèi)存釋放回系統(tǒng)。記住一句話:盡早free()!

我們來看看,malloc()小示例。

  1. /* @filename:example_2_4.c */ 
  2. #include <stdio.h> 
  3. #include <stdlib.h> 
  4.   
  5. int main(int argc, char *argv[]) 
  6.     char *p_4kb, *p_128kb, *p_300kb; 
  7.     if ((p_4kb = malloc(4*1024)) != NULL
  8.     { 
  9.         free(p_4kb); 
  10.     } 
  11.     if ((p_128kb = malloc(128*1024)) != NULL
  12.     { 
  13.         free(p_128kb); 
  14.     } 
  15.     if ((p_300kb = malloc(300*1024)) != NULL
  16.     { 
  17.         free(p_300kb); 
  18.     } 
  19.     return 0; 
  20. #gcc example_2_4.c –o example_2_4 
  21. #strace –t ./example_2_4 
  22. … 
  23. 00:02:53 brk(0)                         = 0x8f58000 
  24. 00:02:53 brk(0x8f7a000)                 = 0x8f7a000 
  25. 00:02:53 brk(0x8f79000)                 = 0x8f79000 
  26. 00:02:53 mmap2(NULL, 311296, PROT_READ|PROT_WRITE, MAP_PRIVATE|MAP_ANONYMOUS, -1, 0) = 0xb772d000 
  27. 00:02:53 munmap(0xb772d000, 311296)     = 0 
  28. … 

PS:系統(tǒng)調(diào)用brk(0)取得當(dāng)前堆的地址,也稱為斷點。

通過跟蹤系統(tǒng)內(nèi)核調(diào)用,可見glibc函數(shù)malloc()總是通過brk()或mmap()系統(tǒng)調(diào)用來滿足內(nèi)存分配需求。函數(shù)malloc(),根據(jù)不同大小內(nèi)存要求來選擇brk(),還是mmap(), 128Kbytes是臨界值。小塊內(nèi)存(<=128kbytes),會調(diào)用brk(),它將數(shù)據(jù)段的***地址往更高處推(堆從底部向上增長)。大塊內(nèi)存,則使用mmap()進行匿名映射(設(shè)置標志MAP_ANONYMOUS)來分配內(nèi)存,與堆無關(guān),在堆之外。這樣做是有道理的,試想:如果大塊內(nèi)存,也調(diào)用brk(),則容易被小塊內(nèi)存釘住,必竟用大塊內(nèi)存不是很頻繁;反過來,小塊內(nèi)存分配更為頻繁得多,如果也使用mmap(),頻繁的創(chuàng)建內(nèi)存映射會導(dǎo)致更多的開銷,還有一點就是,內(nèi)存映射的大小要求必須是“頁”(單位,內(nèi)存頁面大小,默認4Kbytes或8Kbytes)的倍數(shù),如果只是為了”hello world”這樣小數(shù)據(jù)就映射一“頁”內(nèi)存,那實在是太浪費了。

跟malloc()一樣,釋放內(nèi)存函數(shù)free(),也會根據(jù)內(nèi)存大小,選擇使用brk()將斷點

往低處回推,或者選擇調(diào)用munmap()解除映射。有一點需要注意:并不是每次調(diào)用free()小塊內(nèi)存,都會馬上調(diào)用brk(),即堆并不會在每次內(nèi)存被釋放后就被縮減,而是會被glibc保留給下次malloc()使用(必竟小塊內(nèi)存分配較為頻繁),直到glibc發(fā)現(xiàn)堆空閑大小顯著大于內(nèi)存分配所需數(shù)量時,則會調(diào)用brk()。但每次free()大塊內(nèi)存,都會調(diào)用munmap()解除映射。下面是二張malloc()小塊內(nèi)存和大塊內(nèi)存的示例圖。

示意圖:函數(shù)malloc(100000),小于128kbytes,往高處推(heap->)。留意紫圈標注

示意圖:函數(shù)malloc(1024*1024),大于128kbytes,在heap與stack之間。留意紫圈。PS:圖中的Data Segment泛指BSS, Data, Heap。有些文檔有說明:數(shù)據(jù)段有三個子區(qū)域,分別是BSS, Data, Heap。

缺頁異常(Fault Page)

每次調(diào)用malloc(),系統(tǒng)都只是給進程分配線性地址(VM),并沒有隨即分配頁框(RAM)。系統(tǒng)盡量將分配頁框的工作推遲到***一刻—用到時缺頁異常處理。這種頁框按需延遲分配策略***好處之一:充分有效地善用系統(tǒng)稀缺資源RAM。

當(dāng)指針引用的內(nèi)存頁沒有駐留在RAM中,即在RAM找不到與之對應(yīng)的頁框,則會發(fā)生缺頁異常(對進程來說是透明的),內(nèi)核便陷入缺頁異常處理。發(fā)生缺頁異常有幾種情況:1.只分配了線性地址,并沒有分配頁框,常發(fā)生在***次訪問某內(nèi)存頁。2.已經(jīng)分配了頁框,但頁框被回收,換出至磁盤(交換區(qū))。3.引用的內(nèi)存頁,在進程空間之外,不屬于該進程,可能已被free()。我們使用一段偽代碼來大致了解缺頁異常。

  1. /* @filename: example_2_5.c */ 
  2. … 
  3. demo() 
  4.     char *p; 
  5.     //分配了100Kbytes線性地址 
  6.     if ((p = malloc(1024*100)) != NULL)  // L0 
  7.     { 
  8.         *p = ‘t’;     // L1 
  9.     … //過去了很長一段時間,不管系統(tǒng)忙否,長久不用的頁框都有可能被回收 
  10.     *p = ‘m’;      // L2 
  11.     p[4096] = ‘p’;   // L3 
  12.     … 
  13.     free(p);  //L4 
  14.     if (p == NULL
  15.     { 
  16.         *p = ‘l’; // L5 
  17.     } 
  18.     } 
  19. … 
  • L0,函數(shù)malloc()通過brk()給進程分配了100Kbytes的線性地址區(qū)域(VM).然而,系統(tǒng)并沒有隨即分配頁框(RAM)。即此時,進程沒有占用100Kbytes的物理內(nèi)存。這也表明了,你時常在使用top的時候VIRT值增大,而RES值卻不變的原因。
  • L1,通過*p引用了100Kbytes的***頁(4Kbytes)。因為是***次引用此頁,在RAM中找不到與之相對應(yīng)的頁框。發(fā)生缺頁異常(對于進程而言缺頁異常是透明的),系統(tǒng)靈敏地捕獲這一異常,進入缺頁異常處理階段:接下來,系統(tǒng)會分配一個頁框(RAM)映射給它。我們把這種情況(被訪問的頁還沒有被放在任何一個頁框中,內(nèi)核分配一新的頁框并適當(dāng)初始化來滿足調(diào)用請求),也稱為Demand Paging。
  • L2,過了很長一段時間,通過*p再次引用100Kbytes的***頁。若系統(tǒng)在RAM找不到它映射的頁框(可能交換至磁盤了)。發(fā)生缺頁異常,并被系統(tǒng)捕獲進入缺頁異常處理。接下來,系統(tǒng)則會分配一頁頁框(RAM),找到備份在磁盤的那“頁”,并將它換入內(nèi)存(其實因為換入操作比較昂貴,所以不總是只換入一頁,而是預(yù)換入多頁。這也表明某些文檔說:”vmstat某時出現(xiàn)不少si并不能意味著物理內(nèi)存不足”)。凡是類似這種會迫使進程去睡眠(很可能是由于當(dāng)前磁盤數(shù)據(jù)填充至頁框(RAM)所花的時間),阻塞當(dāng)前進程的缺頁異常處理稱為主缺頁(major falut),也稱為大缺頁(參見下圖)。相反,不會阻塞進程的缺頁,稱為次缺頁(minor fault),也稱為小缺面。
  • L3,引用了100Kbytes的第二頁。參見***次訪問100Kbytes***頁, Demand Paging。
  • L4,釋放了內(nèi)存:線性地址區(qū)域被刪除,頁框也被釋放。
  • L5,再次通過*p引用內(nèi)存頁,已被free()了(用戶進程本身并不知道)。發(fā)生缺頁異常,缺面異常處理程序會檢查出這個缺頁不在進程內(nèi)存空間之內(nèi)。對待這種編程錯誤引起的缺頁異常,系統(tǒng)會殺掉這個進程,并且報告著名的段錯誤(Segmentation fault)。

主缺頁異常處理過程示意圖,參見Page Fault Handling

頁框回收PFRA

隨著網(wǎng)絡(luò)并發(fā)用戶數(shù)量增多,進程數(shù)量越來越多(比如一般守護進程會fork()子進程來處理用戶請求),缺頁異常也就更頻繁,需要緩存更多的磁盤數(shù)據(jù)(參考下篇OS Page Cache),RAM也就越來越緊少。為了保證有夠用的頁框供給缺頁異常處理,Linux有一套自己的做法,稱為PFRA。PFRA總會從用戶態(tài)進內(nèi)存程空間和頁面緩存中,“竊取”頁框滿足供給。所謂”竊取”,指的是:將用戶進程內(nèi)存空間對應(yīng)占用的頁框中的數(shù)據(jù)swap out至磁盤(稱為交換區(qū)),或者將OS頁面緩存中的內(nèi)存頁(還有用戶進程mmap()的內(nèi)存頁)flush(同步fsync())至磁盤設(shè)備。PS:如果你觀察到因為RAM不足導(dǎo)致系統(tǒng)病態(tài)式般慢,通常都是因為缺頁異常處理,以及PFRA在”盜頁”。我們從以下幾個方面了解PFRA。

候選頁框:找出哪些頁框是可以被回收?

  • 進程內(nèi)存空間占用的頁框,比如數(shù)據(jù)段中的頁(Heap, Data),還有在Heap與Stack之間的匿名映射頁(比如由malloc()分配的大內(nèi)存)。但不包括Stack段中的頁。
  • 進程空間mmap()的內(nèi)存頁,有映射文件,非匿名映射。
  • 緩存在頁面緩存中Buffer/Cache占用的頁框。也稱OS Page Cache。
  • 頁框回收策略:確定了要回收的頁框,就要進一步確定先回收哪些候選頁框
  • 盡量先回收頁面緩存中的Buffer/Cache。其次再回收內(nèi)存空間占用的頁框。
  • 進程空間占用的頁框,要是沒有被鎖定,都可以回收。所以,當(dāng)某進程睡眠久了,占用的頁框會逐漸地交換出去至交換區(qū)。
  • 使收LRU置換算法,將那些久而未用的頁框優(yōu)先被回收。這種被放在LRU的unused鏈表的頁,常被認為接下來也不太可能會被引用。
  • 相對回收Buffer/Cache而言,回收進程內(nèi)存頁,昂貴很多。所以,Linux默認只有swap_tendency(交換傾向值)值不小于100時,才會選擇換出進程占用的RES。其實交換傾向值描述的是:系統(tǒng)越忙,且RES都被進程占用了,Buffer/Cache只占了一點點的時候,才開始回收進程占用頁框。PS:這正表明了,某些DBA提議將MySQL InnoDB服務(wù)器vm.swappiness值設(shè)置為0,以此讓InnoDB Buffer Pool數(shù)據(jù)在RES呆得更久。
  • 如果實在是沒有頁框可回收,PFRA使出最狠一招,殺掉一個用戶態(tài)進程,并釋放這些被占的頁框。當(dāng)然,這個被殺的進程不是胡亂選的,至少應(yīng)該是占用較多頁框,運行優(yōu)選級低,且不是root用戶的進程。

激活回收頁框:什么時候會回收頁框?

  • 緊急回收。系統(tǒng)內(nèi)核發(fā)現(xiàn)沒有夠用的頁框分配,供給讀文件和內(nèi)存缺頁處理的時候,系統(tǒng)內(nèi)核開始”緊急回收頁框”。喚醒pdflush內(nèi)核線程,先將1024頁臟頁從頁面緩存寫回磁盤。然后開始回收32頁框,若反復(fù)回收13次,還收不齊32頁框,則發(fā)狠殺一個進程。
  • 周期性回收。在緊急回收之前,PFRA還會喚醒內(nèi)核線程kswapd。為了避免更多的“緊急回收”,當(dāng)發(fā)現(xiàn)空閑頁框數(shù)量低于設(shè)置的警告值時,內(nèi)核線程kswapd就會被喚醒,回收頁框。直到空閑的頁框的數(shù)量達到設(shè)定的安全值。PS:當(dāng)RES資源緊張的時候,你可以通過ps命令看到更多的kswapd線程被喚醒。
  • OOM。在高峰時期,RES高度緊張的時候,kswapd持續(xù)回收的頁框供不應(yīng)求,直到進入”緊急回收”,直到 OOM。

Paging 和Swapping

這二個關(guān)鍵字在很多地方出現(xiàn),譯過來應(yīng)該是Paging(調(diào)頁),Swapping(交換)。PS:英語里面用得多的動詞加上ing,就成了名詞,比如building。咬文嚼字,實在是太難??炊D

Swapping的大部分時間花在數(shù)據(jù)傳輸上,交換的數(shù)據(jù)也越多,意味時間開銷也隨之增加。對于進程而言,這個過程是透明的。由于RAM資源不足,PFRA會將部分匿名頁框的數(shù)據(jù)寫入到交換區(qū)(swap area),備份之,這個動作稱為so(swap out)。等到發(fā)生內(nèi)存缺頁異常的時候,缺頁異常處理程序會將交換區(qū)(磁盤)的頁面又讀回物理內(nèi)存,這個動作稱為si(swap in)。每次Swapping,都有可能不只是一頁數(shù)據(jù),不管是si,還是so。Swapping意味著磁盤操作,更新頁表等操作,這些操作開銷都不小,會阻塞用戶態(tài)進程。所以,持續(xù)飚高的si/so意味著物理內(nèi)存資源是性能瓶頸。

Paging,前文我們有說過Demand Paging。通過線性地址找到物理地址,找到頁框。這個過程,可以認為是Paging,對于進程來講,也是透明的。Paging意味著產(chǎn)生缺頁異常,也有可能是大缺頁,也就意味著浪費更多的CPU時間片資源。

總結(jié)

  1. 用戶進程內(nèi)存空間分為5段,Text, DATA, BSS, Heap, Stack。其中Text只讀可執(zhí)行,DATA全局變量和靜態(tài)變量,Heap用完就盡早free(),Stack里面的數(shù)據(jù)是臨時的,退出函數(shù)就沒了。
  2. glibc malloc()動態(tài)分配內(nèi)存。使用brk()或者mmap(),128Kbytes是一個臨界值。避免內(nèi)存泄露,避免野指針。
  3. 內(nèi)核會盡量延后Demand Paging。主缺頁是昂貴的。
  4. 先回收Buffer/Cache占用的頁框,然后程序占用的頁框,使用LRU置換算法。調(diào)小vm.swappiness值可以減少Swapping,減少大缺頁。
  5. 更少的Paging和Swapping
  6. fork()繼承父進程的地址空間,不過是只讀,使用cow技術(shù),fork()函數(shù)特殊在于它返回二次。
責(zé)任編輯:武曉燕 來源: Linux愛好者
相關(guān)推薦

2024-01-08 08:42:43

2019-01-29 10:10:09

Linux內(nèi)存進程堆

2013-10-12 15:07:17

UbuntuLinuxcache

2018-07-24 09:57:02

2021-03-17 21:34:44

Linux內(nèi)存管理

2010-02-04 09:26:34

Linux vmsta

2018-01-12 14:35:00

Linux進程共享內(nèi)存

2021-11-29 20:44:31

Linux內(nèi)存進程

2018-11-01 10:59:52

Linux內(nèi)存進程

2024-02-22 17:08:03

騰訊架構(gòu)RocketMQ

2020-02-04 13:50:09

Linux進程內(nèi)存使用

2010-08-18 15:51:17

安裝DB2 9數(shù)據(jù)庫

2017-01-18 21:57:14

2016-12-23 12:46:41

Linux命令進程與內(nèi)存

2013-11-06 15:01:51

Linux命令內(nèi)存

2013-10-11 17:32:18

Linux運維內(nèi)存管理

2022-02-17 08:57:18

內(nèi)存設(shè)計進程

2020-12-09 05:25:23

Linux內(nèi)存進程

2022-07-10 20:47:39

linux中虛擬內(nèi)存

2025-04-27 03:22:00

Linux共享內(nèi)存
點贊
收藏

51CTO技術(shù)棧公眾號