詳細介紹JVM結(jié)構(gòu)基礎(chǔ)
JVM執(zhí)行的對象就是大家非常熟悉的class文件,我們也稱為類文件,JVM規(guī)范定義的這個編譯完成的代碼文件(雖然并非強制要求是實際的文件)的格式非常的詳實,但是我們這里只說一些宏觀的內(nèi)容,以后有機會再研究細節(jié)的內(nèi)容吧。JVM要求的類文件的格式是和硬件和操作系統(tǒng)無關(guān)的一種二進制格式,它精確定義了類或者接口的表示,它甚至包含了字節(jié)順序這樣的細節(jié),而字節(jié)順序在特定平臺的目標文件格式中一般都是固定的,不會進行說明。
JVM所支持的數(shù)據(jù)類型和Java語言規(guī)范中定義的幾乎一樣,請注意是幾乎一樣!也就是原始類型和引用類型,他們可以被存儲在變量表中,也可以作為參數(shù)傳遞、被方法返回,更通常的就是成為操作的對象。為什么和Java語言規(guī)范中定義的不完全一樣呢?因為JVM中有一種Java語言所沒有的原始類型:返回地址類型(returnAddress type)。該類型是jsr, ret以及jsr_w指令需要使用到的,它的值是JVM指令的操作碼的指針,并且它的值是不能被運行中的程序所修改的。
另外需要提到的就是布爾類型的值,雖然在Java語言中它是完全獨立的值,但是在JVM中只提供了對它的有限支持,表現(xiàn)在:
沒有單獨的操作布爾類型的指令,源代碼中的布爾類型的操作在編譯以后是作為int類型的值進行操作的。
JVM直接支持布爾數(shù)組,newarray指令可以創(chuàng)建布爾數(shù)組,而它的訪問和修改操作卻是使用byte類型的數(shù)組的操作指令進行的:baload,bastore。(在JDK1.0,1,1以及1.2中,布爾數(shù)組被編碼為byte數(shù)組,每個元素是8位)
JVM用1代表true,用0代表false,編譯器將源代碼中的布爾類型映射為JVM中的int類型,而且必須和JVM的要求一致。
另外JVM規(guī)范中對于浮點類型的數(shù)據(jù)有大段的說明,我沒有怎么看,主要是討論JVM的浮點型和IEEE 754的關(guān)系的。
關(guān)于類型的另外一個需要提一下的是類型檢查。JVM期望幾乎所有的類型檢查已經(jīng)在運行之前完成了(通常是由編譯器進行檢查的)而不用JVM自己來檢查。原始類型的值不需要被標記或者在運行時被檢查以確定他們的類型,同樣他們也不用和引用類型的值進行區(qū)分,區(qū)分工作是由JVM的指令集來完成的,JVM的指令集使用不同指令來區(qū)分它要操作的值的類型,例如iadd, ladd, fadd以及dadd是用于將兩個數(shù)字相加并產(chǎn)生數(shù)字類型結(jié)果的所有JVM指令,但是每個指令都是針對特定類型的,分別對應(yīng)int, long, float以及double。
JVM包含對對象的顯式支持。類是動態(tài)分配的類實例或者是一個數(shù)組,JVM中的引用類型就是對一個對象的引用,引用類型的值可以想象為對象的指針,一個對象同時可能存在多個對它的引用,對象總是通過引用被操作、傳遞或者測試的。
對于引用類型,需要提及的一點就是關(guān)于null,它最初是沒有運行時類型的,但是它可以被轉(zhuǎn)換為任何類型,而且對于null,JVM并沒有要求任何具體的值與之對應(yīng)。
說完上面這些,我們就開始進入我學(xué)習(xí)JVM時最想了解的部分了,大家可要打起精神哦。
JVM為運行一個程序定義了幾種數(shù)據(jù)區(qū)(Data Area),包括:pc寄存器、JVM堆棧、堆、方法區(qū)(Method Area)、運行時常量池(Runtime Constant Pool)以及本機方法堆棧(Native Method Stacks),這些數(shù)據(jù)區(qū)根據(jù)其生存期可以分為兩種,一種就是和JVM的生存期相同(包括堆和方法區(qū)),一種和線程的生存期相同(其它的),和JVM生存期相同的數(shù)據(jù)區(qū)在JVM啟動的時候被創(chuàng)建并在JVM退出的時候被銷毀,而和線程生存期相同的數(shù)據(jù)區(qū)是每個線程一個的,他們在線程創(chuàng)建的時候被創(chuàng)建,在線程被銷毀的時候被銷毀。
由于JVM可以同時支持運行多個線程,因此每個線程必然需要各自的PC(program counter)寄存器,無論從什么角度講,每個JVM線程只能在一個時間只能執(zhí)行一個方法,該方法也就是線程的當前方法,如果該方法不是本機方法,那么PC寄存器保存的就是當前指令(JVM的指令)的地址,如果是當前方法是本機方法,PC寄存器的值就沒有被定義。JVM的PC寄存器的大小足夠大,可以容納一個returnAddress類型或者特定平臺的本機指針。
每個JVM線程還擁有一個私有的JVM堆棧,它存儲幀(下一篇文章會講到)。JVM堆棧和像C這樣的傳統(tǒng)編程語言中的堆棧是類似的,它保存局部變量和部分結(jié)果,并且在方法調(diào)用和返回中也擔(dān)任一些職責(zé)。因為除了對幀的壓入和彈出操作外,對JVM堆棧不能直接進行操作,因此幀可能是在堆上分配的。如果一個線程中計算所需的JVM堆棧大于允許的大小,JVM會拋出StackOverflowError錯誤,如果JVM堆棧是可以動態(tài)伸縮的,如果需要擴展,但是又沒有足夠的內(nèi)存可用或者沒有足夠的內(nèi)存為一個新線程創(chuàng)建JVM堆棧,JVM會拋出OutOfMemoryError錯誤。
JVM只有一個為所有線程所共享的堆,所有的類實例和數(shù)組都是在堆中創(chuàng)建的。堆所存儲的對象被一個自動存儲管理系統(tǒng)回收(也就是我們所熟知的垃圾收集器(gc))。對象不能被顯式的釋放,JVM假設(shè)沒有特定類型的自動存儲管理系統(tǒng),存儲管理技術(shù)可以根據(jù)實現(xiàn)者的系統(tǒng)需求進行選擇。如果計算所需的內(nèi)存堆大于自動存儲管理系統(tǒng)可以使用的大小,JVM會拋出OutOfMemoryError錯誤。
JVM只有一個為所有的線程所共享的方法區(qū),方法區(qū)類似傳統(tǒng)語言的已編譯代碼的存儲區(qū)或者UNIX進程的“文本”段。它存儲類結(jié)構(gòu),例如運行時常量池,成員和方法數(shù)據(jù)以及方法、構(gòu)造方法的代碼(包括用于類和實例的初始化以及接口類型初始化的特定方法(這些特定方法以后會講到))。雖然從邏輯上講方法區(qū)是堆的一部分,但是JVM的簡單實現(xiàn)可以選擇不對方法區(qū)進行垃圾收集或者壓縮(以筆者的理解就是類不能進行卸載)。***版本(第二版)的JVM規(guī)范沒有要求方法區(qū)的位置或者管理已編譯代碼的策略。如果方法區(qū)的內(nèi)存不能滿足一個分配請求,JVM會拋出OutOfMemoryError。
運行時常量池是類文件中的常量池表的運行時表示,它包含幾種常量,范圍從編譯時就已知的數(shù)字常量到運行時必須進行解析的方法和成員引用。運行時常量池扮演的功能類似于傳統(tǒng)編程語言中的符號表(symbol table),但是它所包含的數(shù)據(jù)比典型的符號表更多。
每個運行時常量池時從JVM的方法區(qū)中分配的,對于特定方法或者接口的運行時常量池是JVM在創(chuàng)建類或者接口的時候創(chuàng)建的。
當創(chuàng)建一個類或者接口時,如果創(chuàng)建運行時常量池需要的內(nèi)存比方法區(qū)中的可用內(nèi)容更多的內(nèi)存,JVM會拋出OutOfMemoryError。
關(guān)于常量池創(chuàng)建的更多內(nèi)容以后可能會更詳細的講解。
JVM的實現(xiàn)可能使用傳統(tǒng)的堆棧(更通常的講就是C棧)以支持本機方法(不是使用JAVA語言編寫的方法),本機方法堆棧也可以用于在像C語言這樣的語言中為JVM指令集實現(xiàn)解析器,對于不能加載本機方法以及自身不依賴傳統(tǒng)堆棧的JVM實現(xiàn)而言,它可以不提供本機方法堆棧,如果提供,本機方法堆棧通常在線程創(chuàng)建的時候為每個線程分配(以筆者的理解應(yīng)該是需要使用本機方法的線程)。如果線程計算所需的內(nèi)存比本機方法堆棧所允許的大,JVM會拋出StackOverflowError錯誤,如果本機方法堆棧可以動態(tài)伸縮,而當需要擴展的時候又沒有足夠的內(nèi)存時,或者沒有足夠的內(nèi)容用于創(chuàng)建一個本機方法堆棧,JVM會拋出OutOfMemoryError。
對于上面的這些數(shù)據(jù)區(qū),JVM規(guī)范允許它們的大小是固定尺寸的,也可以是根據(jù)計算的需要動態(tài)伸縮的,如果是固定尺寸的,其尺寸可以在創(chuàng)建時自主選擇。JVM的實現(xiàn)可以給程序員或者用戶提供控制JVM堆棧的初始大小的方法,同樣,在動態(tài)伸縮的情況下可以控制***大小和最小大小,并且它們所使用的內(nèi)存空間可以不是連續(xù)的。
【編輯推薦】