刷了這么多題,你了解自己代碼的內(nèi)存消耗么?
理解代碼的內(nèi)存消耗,最關(guān)鍵是要知道自己所用編程語言的內(nèi)存管理。
不同語言的內(nèi)存管理
不同的編程語言各自的內(nèi)存管理方式。
- C/C++這種內(nèi)存堆空間的申請和釋放完全靠自己管理
- Java 依賴JVM來做內(nèi)存管理,不了解jvm內(nèi)存管理的機(jī)制,很可能會因一些錯誤的代碼寫法而導(dǎo)致內(nèi)存泄漏或內(nèi)存溢出
- Python內(nèi)存管理是由私有堆空間管理的,所有的python對象和數(shù)據(jù)結(jié)構(gòu)都存儲在私有堆空間中。程序員沒有訪問堆的權(quán)限,只有解釋器才能操作。
例如Python萬物皆對象,并且將內(nèi)存操作封裝的很好,所以python的基本數(shù)據(jù)類型所用的內(nèi)存會要遠(yuǎn)大于存放純數(shù)據(jù)類型所占的內(nèi)存,例如,我們都知道存儲int型數(shù)據(jù)需要四個字節(jié),但是使用Python 申請一個對象來存放數(shù)據(jù)的話,所用空間要遠(yuǎn)大于四個字節(jié)。
C++的內(nèi)存管理
以C++為例來介紹一下編程語言的內(nèi)存管理。
如果我們寫C++的程序,就要知道棧和堆的概念,程序運(yùn)行時所需的內(nèi)存空間分為 固定部分,和可變部分,如下:
固定部分的內(nèi)存消耗 是不會隨著代碼運(yùn)行產(chǎn)生變化的, 可變部分則是會產(chǎn)生變化的
更具體一些,一個由C/C++編譯的程序占用的內(nèi)存分為以下幾個部分:
- 棧區(qū)(Stack) :由編譯器自動分配釋放,存放函數(shù)的參數(shù)值,局部變量的值等,其操作方式類似于數(shù)據(jù)結(jié)構(gòu)中的棧。
- 堆區(qū)(Heap) :一般由程序員分配釋放,若程序員不釋放,程序結(jié)束時可能由OS收回
- 未初始化數(shù)據(jù)區(qū)(Uninitialized Data):存放未初始化的全局變量和靜態(tài)變量
- 初始化數(shù)據(jù)區(qū)(Initialized Data):存放已經(jīng)初始化的全局變量和靜態(tài)變量
- 程序代碼區(qū)(Text):存放函數(shù)體的二進(jìn)制代碼
代碼區(qū)和數(shù)據(jù)區(qū)所占空間都是固定的,而且占用的空間非常小,那么看運(yùn)行時消耗的內(nèi)存主要看可變部分。
在可變部分中,棧區(qū)間的數(shù)據(jù)在代碼塊執(zhí)行結(jié)束之后,系統(tǒng)會自動回收,而堆區(qū)間數(shù)據(jù)是需要程序員自己回收,所以也就是造成內(nèi)存泄漏的發(fā)源地。
而Java、Python的話則不需要程序員去考慮內(nèi)存泄漏的問題,虛擬機(jī)都做了這些事情。
如何計算程序占用多大內(nèi)存
想要算出自己程序會占用多少內(nèi)存就一定要了解自己定義的數(shù)據(jù)類型的大小,如下:
注意圖中有兩個不一樣的地方,為什么64位的指針就占用了8個字節(jié),而32位的指針占用4個字節(jié)呢?
1個字節(jié)占8個比特,那么4個字節(jié)就是32個比特,可存放數(shù)據(jù)的大小為2^32,也就是4G空間的大小,即:可以尋找4G空間大小的內(nèi)存地址。
大家現(xiàn)在使用的計算機(jī)一般都是64位了,所以編譯器也都是64位的。
安裝64位的操作系統(tǒng)的計算機(jī)內(nèi)存都已經(jīng)超過了4G,也就是指針大小如果還是4個字節(jié)的話,就已經(jīng)不能尋址全部的內(nèi)存地址,所以64位編譯器使用8個字節(jié)的指針才能尋找所有的內(nèi)存地址。
注意2^64是一個非常巨大的數(shù),對于尋找地址來說已經(jīng)足夠用了。
內(nèi)存對齊
再介紹一下內(nèi)存管理中另一個重要的知識點(diǎn):內(nèi)存對齊。
不要以為只有C/C++才會有內(nèi)存對齊,只要可以跨平臺的編程語言都需要做內(nèi)存對齊,Java、Python都是一樣的。
而且這是面試中面試官非常喜歡問到的問題,就是:為什么會有內(nèi)存對齊?
主要是兩個原因
1. 平臺原因:不是所有的硬件平臺都能訪問任意內(nèi)存地址上的任意數(shù)據(jù),某些硬件平臺只能在某些地址處取某些特定類型的數(shù)據(jù),否則拋出硬件異常。為了同一個程序可以在多平臺運(yùn)行,需要內(nèi)存對齊。
2. 硬件原因:經(jīng)過內(nèi)存對齊后,CPU訪問內(nèi)存的速度大大提升。
可以看一下這段C++代碼輸出的各個數(shù)據(jù)類型大小是多少?
- struct node{
- int num;
- char cha;
- }st;
- int main() {
- int a[100];
- char b[100];
- cout << sizeof(int) << endl;
- cout << sizeof(char) << endl;
- cout << sizeof(a) << endl;
- cout << sizeof(b) << endl;
- cout << sizeof(st) << endl;
- }
看一下和自己想的結(jié)果一樣么, 我們來逐一分析一下。
其輸出的結(jié)果依次為:
- 4
- 1
- 400
- 100
- 8
此時會發(fā)現(xiàn),和單純計算字節(jié)數(shù)的話是有一些誤差的。
這就是因?yàn)閮?nèi)存對齊的原因。
來看一下內(nèi)存對齊和非內(nèi)存對齊產(chǎn)生的效果區(qū)別。
CPU讀取內(nèi)存不是一次讀取單個字節(jié),而是一塊一塊的來讀取內(nèi)存,塊的大小可以是2,4,8,16個字節(jié),具體取多少個字節(jié)取決于硬件。
假設(shè)CPU把內(nèi)存劃分為4字節(jié)大小的塊,要讀取一個4字節(jié)大小的int型數(shù)據(jù),來看一下這兩種情況下CPU的工作量:
第一種就是內(nèi)存對齊的情況,如圖:
內(nèi)存對齊
一字節(jié)的char占用了四個字節(jié),空了三個字節(jié)的內(nèi)存地址,int數(shù)據(jù)從地址4開始。
此時,直接將地址4,5,6,7處的四個字節(jié)數(shù)據(jù)讀取到即可。
第二種是沒有內(nèi)存對齊的情況如圖:
非內(nèi)存對齊
char型的數(shù)據(jù)和int型的數(shù)據(jù)挨在一起,該int數(shù)據(jù)從地址1開始,那么CPU想要讀這個數(shù)據(jù)的話來看看需要幾步操作:
- 因?yàn)镃PU是四個字節(jié)四個字節(jié)來尋址,首先CPU讀取0,1,2,3處的四個字節(jié)數(shù)據(jù)
- CPU讀取4,5,6,7處的四個字節(jié)數(shù)據(jù)
- 合并地址1,2,3,4處四個字節(jié)的數(shù)據(jù)才是本次操作需要的int數(shù)據(jù)
此時一共需要兩次尋址,一次合并的操作。
大家可能會發(fā)現(xiàn)內(nèi)存對齊豈不是浪費(fèi)的內(nèi)存資源么?
是這樣的,但事實(shí)上,相對來說計算機(jī)內(nèi)存資源一般都是充足的,我們更希望的是提高運(yùn)行速度。
編譯器一般都會做內(nèi)存對齊的優(yōu)化操作,也就是說當(dāng)考慮程序真正占用的內(nèi)存大小的時候,也需要認(rèn)識到內(nèi)存對齊的影響。
總結(jié)
不少同學(xué)對這方面的知識很欠缺,基本處于盲區(qū),通過這一篇大家可以初步補(bǔ)齊一下這塊。
之后也可以有意識的去學(xué)習(xí)自己所用的編程語言是如何管理內(nèi)存的,這些也是程序員的內(nèi)功。