深入理解Java虛擬機(jī):程序計(jì)數(shù)器與虛擬機(jī)棧詳解
前言
本節(jié)主要講的是運(yùn)行時數(shù)據(jù)區(qū)(程序計(jì)數(shù)器與虛擬機(jī)棧),也就是下圖這部分,它是在類加載完成后的階段:
圖片
- 每個線程:獨(dú)立包括程序計(jì)數(shù)器、棧、本地棧
- 線程間共享:堆、堆外內(nèi)存(永久代或元空間、代碼緩存)
當(dāng)我們通過前面的:類的加載-> 驗(yàn)證 -> 準(zhǔn)備 -> 解析 -> 初始化 這幾個階段完成后,就會用到執(zhí)行引擎對我們的類進(jìn)行使用,同時執(zhí)行引擎將會使用到我們運(yùn)行時數(shù)據(jù)區(qū)。
內(nèi)存是非常重要的系統(tǒng)資源,是硬盤和CPU的中間倉庫及橋梁,承載著操作系統(tǒng)和應(yīng)用程序的實(shí)時運(yùn)行JVM內(nèi)存布局規(guī)定了Java在運(yùn)行過程中內(nèi)存申請、分配、管理的策略,保證了JVM的高效穩(wěn)定運(yùn)行。不同的JVM對于內(nèi)存的劃分方式和管理機(jī)制存在著部分差異。
正文
我們通過磁盤或者網(wǎng)絡(luò)IO得到的數(shù)據(jù),都需要先加載到內(nèi)存中,然后CPU從內(nèi)存中獲取數(shù)據(jù)進(jìn)行讀取,也就是說內(nèi)存充當(dāng)了CPU和磁盤之間的橋梁。
圖片
線程
線程是一個程序里的運(yùn)行單元。JVM允許一個應(yīng)用有多個線程并行的執(zhí)行。在Hotspot JVM里,每個線程都與操作系統(tǒng)的本地線程直接映射。
當(dāng)一個Java線程準(zhǔn)備好執(zhí)行以后,此時一個操作系統(tǒng)的本地線程也同時創(chuàng)建。Java線程執(zhí)行終止后,本地線程也會回收。
操作系統(tǒng)負(fù)責(zé)所有線程的安排調(diào)度到任何一個可用的CPU上。一旦本地線程初始化成功,它就會調(diào)用Java線程中的run()方法。
JVM系統(tǒng)線程:
- 虛擬機(jī)線程:需要JVM達(dá)到安全點(diǎn)才會出現(xiàn)。這些操作必須在不同的線程中發(fā)生的,原因是他們都需要JVM達(dá)到安全點(diǎn),這樣堆才不會變化。這種線程的執(zhí)行類型包括stop-the-world的垃圾收集,線程棧收集,線程掛起以及偏向鎖撤銷。
- 周期任務(wù)線程:這種線程是時間周期事件的體現(xiàn)(比如中斷),他們一般用于周期性操作的調(diào)度執(zhí)行。
- GC線程:這種線程對在JVM里不同種類的垃圾收集行為提供了支持。
- 編譯線程:這種線程在運(yùn)行時會將字節(jié)碼編譯成到本地代碼。
- 信號調(diào)度線程:這種線程接收信號并發(fā)送給JVM,在它內(nèi)部通過調(diào)用適當(dāng)?shù)姆椒ㄟM(jìn)行處理。
程序計(jì)數(shù)器(PC寄存器)
圖片
- CPU只有把數(shù)據(jù)裝載到寄存器才能夠運(yùn)行,JVM中的PC寄存器是對物理PC寄存器的一種抽象模擬。
- PC寄存器用來存儲指向下一條指令的地址,也即將要執(zhí)行的指令代碼,由執(zhí)行引擎讀取下一條指令。
案例
圖片
- 在JVM規(guī)范中,每個線程都有它自己的程序計(jì)數(shù)器,是線程私有的,生命周期與線程的生命周期保持一致。
- 任何時間一個線程都只有一個方法在執(zhí)行(當(dāng)前方法)。程序計(jì)數(shù)器會存儲當(dāng)前線程正在執(zhí)行的Java方法的JVM指令地址;如果是在執(zhí)行native方法,則是未指定值(undefined)。
- 字節(jié)碼解釋器工作時就是通過改變這個計(jì)數(shù)器的值來選取下一條需要執(zhí)行的字節(jié)碼指令。
虛擬機(jī)棧
由于跨平臺性的設(shè)計(jì),Java的指令都是根據(jù)棧來設(shè)計(jì)的。不同平臺CPU架構(gòu)不同,所以不能設(shè)計(jì)為基于寄存器的
每個線程在創(chuàng)建時都會創(chuàng)建一個虛擬機(jī)棧,其內(nèi)部保存一個個的棧幀(Stack Frame),對應(yīng)著一次次的Java方法調(diào)用,是線程私有的。
內(nèi)存中的棧與堆
圖片
棧是運(yùn)行時的單位,而堆是存儲的單位。
- 棧解決程序的運(yùn)行問題,即程序如何執(zhí)行,或者說如何處理數(shù)據(jù)。
- 堆解決的是數(shù)據(jù)存儲的問題,即數(shù)據(jù)怎么放,放哪里。
棧運(yùn)行原理
- JVM直接對Java棧的操作只有兩個,就是對棧幀的壓棧和出棧,遵循先進(jìn)后出/后進(jìn)先出原則。
- 如果當(dāng)前方法調(diào)用了其他方法,方法返回之際,當(dāng)前棧幀會傳回此方法的執(zhí)行結(jié)果給前一個棧幀,接著,虛擬機(jī)會丟棄當(dāng)前棧幀,使得前一個棧幀重新成為當(dāng)前棧幀。
棧幀內(nèi)部結(jié)構(gòu)
圖片
- 局部變量表是存放方法參數(shù)和局部變量的區(qū)域。局部變量沒有準(zhǔn)備階段,必須顯式初始化。如果是非靜態(tài)方法,則在index[0]位置上存儲的是方法所屬對象的實(shí)例引用,一個引用變量占4個字節(jié),隨后存儲的是參數(shù)和局部變量,32位以內(nèi)的類型只占用一個slot(包括returnAddress類型),64位的類型(long和double)占用兩個slot。
- 操作數(shù)棧是個初始狀態(tài)為空的桶式結(jié)構(gòu)棧。在方法執(zhí)行過程中,會有各種指令往棧中寫入和提取信息。JVM 的執(zhí)行引擎是基于棧的執(zhí)行引擎,其中的棧指的就是操作數(shù)棧。字節(jié)碼指令集的定義都是基于棧類型的,棧的深度在方法元信息的stack屬性中。
- 動態(tài)連接是支持方法調(diào)用過程的動態(tài)連接,每個棧幀中包含一個在常量池中對當(dāng)前方法的引用。
- 方法返回地址(Return Address)(或方法正常退出或者異常退出的定義)。
圖片
并行每個線程下的棧都是私有的,因此每個線程都有自己各自的棧,并且每個棧里面都有很多棧幀,棧幀的大小主要由局部變量表 和 操作數(shù)棧決定的。
案例
圖片
代碼跟蹤:
圖片
棧頂緩存技術(shù)
基于棧式架構(gòu)的虛擬機(jī)所使用的零地址指令更加緊湊,但完成一項(xiàng)操作的時候必然需要使用更多的入棧和出棧指令,這同時也就意味著將需要更多的指令分派(instruction dispatch)次數(shù)和內(nèi)存讀/寫次數(shù)。
由于操作數(shù)是存儲在內(nèi)存中的,因此頻繁地執(zhí)行內(nèi)存讀/寫操作必然會影響執(zhí)行速度。為了解決這個問題,HotSpot JVM的設(shè)計(jì)者們提出了棧頂緩存(Tos,Top-of-Stack Cashing)技術(shù),將棧頂元素全部緩存在物理CPU的寄存器中,以此降低對內(nèi)存的讀/寫次數(shù),提升執(zhí)行引擎的執(zhí)行效率。
動態(tài)鏈接
每一個棧幀內(nèi)部都包含一個指向運(yùn)行時常量池中該棧幀所屬方法的引用,包含這個引用的目的就是為了支持當(dāng)前方法的代碼能夠?qū)崿F(xiàn)動態(tài)鏈接(Dynamic Linking)。比如:invokedynamic指令。
在Java源文件被編譯到字節(jié)碼文件中時,所有的變量和方法引用都作為符號引用(Symbolic Reference)保存在class文件的常量池里。比如:描述一個方法調(diào)用了另外的其他方法時,就是通過常量池中指向方法的符號引用來表示的,那么動態(tài)鏈接的作用就是為了將這些符號引用轉(zhuǎn)換為調(diào)用方法的直接引用。
方法的調(diào)用:解析與分配
在 JVM 中,將符號引用轉(zhuǎn)換為調(diào)用方法的直接引用與方法的綁定機(jī)制有關(guān)
- 靜態(tài)鏈接:當(dāng)一個字節(jié)碼文件被裝載進(jìn) JVM 內(nèi)部時,如果被調(diào)用的目標(biāo)方法在編譯期可知,且運(yùn)行期保持不變時。這種情況下將調(diào)用方法的符號引用轉(zhuǎn)換為直接引用的過程稱之為靜態(tài)鏈接
- 動態(tài)鏈接:如果被調(diào)用的方法在編譯期無法被確定下來,也就是說,只能在程序運(yùn)行期將調(diào)用方法的符號引用轉(zhuǎn)換為直接引用,由于這種引用轉(zhuǎn)換過程具備動態(tài)性,因此也就被稱之為動態(tài)鏈接
對應(yīng)的方法的綁定機(jī)制為:早期綁定(Early Binding)和晚期綁定(Late Binding)。綁定是一個字段、方法或者類在符號引用被替換為直接引用的過程,這僅僅發(fā)生一次
- 早期綁定就是指被調(diào)用的目標(biāo)方法如果在編譯期可知,且運(yùn)行期保持不變時,即可將這個方法與所屬的類型進(jìn)行綁定,這樣一來,由于明確了被調(diào)用的目標(biāo)方法究竟是哪一個,因此也就可以使用靜態(tài)鏈接的方式將符號引用轉(zhuǎn)換為直接引用。
- 如果被調(diào)用的方法在編譯期無法被確定下來,只能夠在程序運(yùn)行期根據(jù)實(shí)際的類型綁定相關(guān)的方法,這種綁定方式也就被稱之為晚期綁定。
虛方法和非虛方法
- 如果方法在編譯期就確定了具體的調(diào)用版本,這個版本在運(yùn)行時是不可變的,這樣的方法稱為非虛方法,比如靜態(tài)方法、私有方法、final方法、實(shí)例構(gòu)造器、父類方法都是非虛方法
- 其他方法稱為虛方法。
方法的調(diào)用:虛方法表
在面向?qū)ο蟮木幊讨校瑫茴l繁的使用到動態(tài)分派,如果在每次動態(tài)分派的過程中都要重新在類的方法元數(shù)據(jù)中搜索合適的目標(biāo)的話就可能影響到執(zhí)行效率。
因此,為了提高性能,JVM采用在類的方法區(qū)建立一個虛方法表 (virtual method table)(非虛方法不會出現(xiàn)在表中)來實(shí)現(xiàn),使用索引表來代替查找,每個類中都有一個虛方法表,表中存放著各個方法的實(shí)際入口。
虛方法表會在類加載的鏈接階段被創(chuàng)建并開始初始化,類的變量初始值準(zhǔn)備完成之后,JVM會把該類的方法表也初始化完畢。
方法返回地址
執(zhí)行引擎遇到任意一個方法返回的字節(jié)碼指令(return),會有返回值傳遞給上層的方法調(diào)用者,簡稱正常完成出口;
- 一個方法在正常調(diào)用完成之后,究竟需要使用哪一個返回指令,還需要根據(jù)方法返回值的實(shí)際數(shù)據(jù)類型而定。
- 在字節(jié)碼指令中,返回指令包含ireturn(當(dāng)返回值是boolean,byte,char,short,int類型時使用),lreturn(Long類型),freturn(Float類型),dreturn(Double類型),areturn,另外還有一個return指令聲明為void的方法,實(shí)例初始化方法,類和接口的初始化方法使用。
在方法執(zhí)行過程中遇到異常(Exception),并且這個異常沒有在方法內(nèi)進(jìn)行處理,也就是只要在本方法的異常表中沒有搜索到匹配的異常處理器,就會導(dǎo)致方法退出,簡稱異常完成出口。
附加信息
棧幀中還允許攜帶與Java虛擬機(jī)實(shí)現(xiàn)相關(guān)的一些附加信息。例如:對程序調(diào)試提供支持的信息。