深入理解Java虛擬機(jī)：程序計(jì)數(shù)器與虛擬機(jī)棧詳解

作者：一安 2024-03-26 07:30:07

在Java?源文件被編譯到字節(jié)碼文件中時，所有的變量和方法引用都作為符號引用（Symbolic Reference?）保存在class文件的常量池里。

前言

本節(jié)主要講的是運(yùn)行時數(shù)據(jù)區(qū)（程序計(jì)數(shù)器與虛擬機(jī)棧），也就是下圖這部分，它是在類加載完成后的階段：

圖片

每個線程：獨(dú)立包括程序計(jì)數(shù)器、棧、本地棧
線程間共享：堆、堆外內(nèi)存（永久代或元空間、代碼緩存）

當(dāng)我們通過前面的：類的加載-> 驗(yàn)證 -> 準(zhǔn)備 -> 解析 -> 初始化這幾個階段完成后，就會用到執(zhí)行引擎對我們的類進(jìn)行使用，同時執(zhí)行引擎將會使用到我們運(yùn)行時數(shù)據(jù)區(qū)。

內(nèi)存是非常重要的系統(tǒng)資源，是硬盤和CPU的中間倉庫及橋梁，承載著操作系統(tǒng)和應(yīng)用程序的實(shí)時運(yùn)行JVM內(nèi)存布局規(guī)定了Java在運(yùn)行過程中內(nèi)存申請、分配、管理的策略，保證了JVM的高效穩(wěn)定運(yùn)行。不同的JVM對于內(nèi)存的劃分方式和管理機(jī)制存在著部分差異。

正文

我們通過磁盤或者網(wǎng)絡(luò)IO得到的數(shù)據(jù)，都需要先加載到內(nèi)存中，然后CPU從內(nèi)存中獲取數(shù)據(jù)進(jìn)行讀取，也就是說內(nèi)存充當(dāng)了CPU和磁盤之間的橋梁。

圖片

線程

線程是一個程序里的運(yùn)行單元。JVM允許一個應(yīng)用有多個線程并行的執(zhí)行。在Hotspot JVM里，每個線程都與操作系統(tǒng)的本地線程直接映射。

當(dāng)一個Java線程準(zhǔn)備好執(zhí)行以后，此時一個操作系統(tǒng)的本地線程也同時創(chuàng)建。Java線程執(zhí)行終止后，本地線程也會回收。

操作系統(tǒng)負(fù)責(zé)所有線程的安排調(diào)度到任何一個可用的CPU上。一旦本地線程初始化成功，它就會調(diào)用Java線程中的run()方法。

JVM系統(tǒng)線程:
虛擬機(jī)線程：需要JVM達(dá)到安全點(diǎn)才會出現(xiàn)。這些操作必須在不同的線程中發(fā)生的,原因是他們都需要JVM達(dá)到安全點(diǎn)，這樣堆才不會變化。這種線程的執(zhí)行類型包括stop-the-world的垃圾收集，線程棧收集，線程掛起以及偏向鎖撤銷。
周期任務(wù)線程：這種線程是時間周期事件的體現(xiàn)（比如中斷），他們一般用于周期性操作的調(diào)度執(zhí)行。
GC線程：這種線程對在JVM里不同種類的垃圾收集行為提供了支持。
編譯線程：這種線程在運(yùn)行時會將字節(jié)碼編譯成到本地代碼。
信號調(diào)度線程：這種線程接收信號并發(fā)送給JVM，在它內(nèi)部通過調(diào)用適當(dāng)?shù)姆椒ㄟM(jìn)行處理。

程序計(jì)數(shù)器(PC寄存器)

圖片

CPU只有把數(shù)據(jù)裝載到寄存器才能夠運(yùn)行，JVM中的PC寄存器是對物理PC寄存器的一種抽象模擬。
PC寄存器用來存儲指向下一條指令的地址，也即將要執(zhí)行的指令代碼，由執(zhí)行引擎讀取下一條指令。

案例

圖片

在JVM規(guī)范中，每個線程都有它自己的程序計(jì)數(shù)器，是線程私有的，生命周期與線程的生命周期保持一致。
任何時間一個線程都只有一個方法在執(zhí)行（當(dāng)前方法）。程序計(jì)數(shù)器會存儲當(dāng)前線程正在執(zhí)行的Java方法的JVM指令地址；如果是在執(zhí)行native方法，則是未指定值（undefined）。
字節(jié)碼解釋器工作時就是通過改變這個計(jì)數(shù)器的值來選取下一條需要執(zhí)行的字節(jié)碼指令。

虛擬機(jī)棧

由于跨平臺性的設(shè)計(jì)，Java的指令都是根據(jù)棧來設(shè)計(jì)的。不同平臺CPU架構(gòu)不同，所以不能設(shè)計(jì)為基于寄存器的

每個線程在創(chuàng)建時都會創(chuàng)建一個虛擬機(jī)棧，其內(nèi)部保存一個個的棧幀（Stack Frame），對應(yīng)著一次次的Java方法調(diào)用，是線程私有的。

內(nèi)存中的棧與堆

圖片

棧是運(yùn)行時的單位，而堆是存儲的單位。

棧解決程序的運(yùn)行問題，即程序如何執(zhí)行，或者說如何處理數(shù)據(jù)。
堆解決的是數(shù)據(jù)存儲的問題，即數(shù)據(jù)怎么放，放哪里。

棧運(yùn)行原理

JVM直接對Java棧的操作只有兩個，就是對棧幀的壓棧和出棧，遵循先進(jìn)后出/后進(jìn)先出原則。
如果當(dāng)前方法調(diào)用了其他方法，方法返回之際，當(dāng)前棧幀會傳回此方法的執(zhí)行結(jié)果給前一個棧幀，接著，虛擬機(jī)會丟棄當(dāng)前棧幀，使得前一個棧幀重新成為當(dāng)前棧幀。

棧幀內(nèi)部結(jié)構(gòu)

圖片

局部變量表是存放方法參數(shù)和局部變量的區(qū)域。局部變量沒有準(zhǔn)備階段，必須顯式初始化。如果是非靜態(tài)方法，則在index[0]位置上存儲的是方法所屬對象的實(shí)例引用，一個引用變量占4個字節(jié)，隨后存儲的是參數(shù)和局部變量，32位以內(nèi)的類型只占用一個slot（包括returnAddress類型），64位的類型（long和double）占用兩個slot。
操作數(shù)棧是個初始狀態(tài)為空的桶式結(jié)構(gòu)棧。在方法執(zhí)行過程中，會有各種指令往棧中寫入和提取信息。JVM 的執(zhí)行引擎是基于棧的執(zhí)行引擎，其中的棧指的就是操作數(shù)棧。字節(jié)碼指令集的定義都是基于棧類型的，棧的深度在方法元信息的stack屬性中。
動態(tài)連接是支持方法調(diào)用過程的動態(tài)連接，每個棧幀中包含一個在常量池中對當(dāng)前方法的引用。
方法返回地址（Return Address）（或方法正常退出或者異常退出的定義）。

圖片

并行每個線程下的棧都是私有的，因此每個線程都有自己各自的棧，并且每個棧里面都有很多棧幀，棧幀的大小主要由局部變量表和操作數(shù)棧決定的。

案例

圖片

代碼跟蹤：

圖片

棧頂緩存技術(shù)

基于棧式架構(gòu)的虛擬機(jī)所使用的零地址指令更加緊湊，但完成一項(xiàng)操作的時候必然需要使用更多的入棧和出棧指令，這同時也就意味著將需要更多的指令分派（instruction dispatch）次數(shù)和內(nèi)存讀/寫次數(shù)。

由于操作數(shù)是存儲在內(nèi)存中的，因此頻繁地執(zhí)行內(nèi)存讀/寫操作必然會影響執(zhí)行速度。為了解決這個問題，HotSpot JVM的設(shè)計(jì)者們提出了棧頂緩存（Tos，Top-of-Stack Cashing）技術(shù)，將棧頂元素全部緩存在物理CPU的寄存器中，以此降低對內(nèi)存的讀/寫次數(shù)，提升執(zhí)行引擎的執(zhí)行效率。

動態(tài)鏈接

每一個棧幀內(nèi)部都包含一個指向運(yùn)行時常量池中該棧幀所屬方法的引用，包含這個引用的目的就是為了支持當(dāng)前方法的代碼能夠?qū)崿F(xiàn)動態(tài)鏈接（Dynamic Linking）。比如：invokedynamic指令。

在Java源文件被編譯到字節(jié)碼文件中時，所有的變量和方法引用都作為符號引用（Symbolic Reference）保存在class文件的常量池里。比如：描述一個方法調(diào)用了另外的其他方法時，就是通過常量池中指向方法的符號引用來表示的，那么動態(tài)鏈接的作用就是為了將這些符號引用轉(zhuǎn)換為調(diào)用方法的直接引用。

方法的調(diào)用：解析與分配

在 JVM 中，將符號引用轉(zhuǎn)換為調(diào)用方法的直接引用與方法的綁定機(jī)制有關(guān)
靜態(tài)鏈接：當(dāng)一個字節(jié)碼文件被裝載進(jìn) JVM 內(nèi)部時，如果被調(diào)用的目標(biāo)方法在編譯期可知，且運(yùn)行期保持不變時。這種情況下將調(diào)用方法的符號引用轉(zhuǎn)換為直接引用的過程稱之為靜態(tài)鏈接
動態(tài)鏈接：如果被調(diào)用的方法在編譯期無法被確定下來，也就是說，只能在程序運(yùn)行期將調(diào)用方法的符號引用轉(zhuǎn)換為直接引用，由于這種引用轉(zhuǎn)換過程具備動態(tài)性，因此也就被稱之為動態(tài)鏈接
對應(yīng)的方法的綁定機(jī)制為：早期綁定（Early Binding）和晚期綁定（Late Binding）。綁定是一個字段、方法或者類在符號引用被替換為直接引用的過程，這僅僅發(fā)生一次
早期綁定就是指被調(diào)用的目標(biāo)方法如果在編譯期可知，且運(yùn)行期保持不變時，即可將這個方法與所屬的類型進(jìn)行綁定，這樣一來，由于明確了被調(diào)用的目標(biāo)方法究竟是哪一個，因此也就可以使用靜態(tài)鏈接的方式將符號引用轉(zhuǎn)換為直接引用。
如果被調(diào)用的方法在編譯期無法被確定下來，只能夠在程序運(yùn)行期根據(jù)實(shí)際的類型綁定相關(guān)的方法，這種綁定方式也就被稱之為晚期綁定。
虛方法和非虛方法
如果方法在編譯期就確定了具體的調(diào)用版本，這個版本在運(yùn)行時是不可變的，這樣的方法稱為非虛方法，比如靜態(tài)方法、私有方法、final方法、實(shí)例構(gòu)造器、父類方法都是非虛方法
其他方法稱為虛方法。

方法的調(diào)用：虛方法表

在面向?qū)ο蟮木幊讨校瑫茴l繁的使用到動態(tài)分派，如果在每次動態(tài)分派的過程中都要重新在類的方法元數(shù)據(jù)中搜索合適的目標(biāo)的話就可能影響到執(zhí)行效率。

因此，為了提高性能，JVM采用在類的方法區(qū)建立一個虛方法表（virtual method table）（非虛方法不會出現(xiàn)在表中）來實(shí)現(xiàn)，使用索引表來代替查找，每個類中都有一個虛方法表，表中存放著各個方法的實(shí)際入口。

虛方法表會在類加載的鏈接階段被創(chuàng)建并開始初始化，類的變量初始值準(zhǔn)備完成之后，JVM會把該類的方法表也初始化完畢。

方法返回地址

執(zhí)行引擎遇到任意一個方法返回的字節(jié)碼指令（return），會有返回值傳遞給上層的方法調(diào)用者，簡稱正常完成出口；

一個方法在正常調(diào)用完成之后，究竟需要使用哪一個返回指令，還需要根據(jù)方法返回值的實(shí)際數(shù)據(jù)類型而定。
在字節(jié)碼指令中，返回指令包含ireturn（當(dāng)返回值是boolean，byte，char，short，int類型時使用），lreturn（Long類型），freturn（Float類型），dreturn（Double類型），areturn，另外還有一個return指令聲明為void的方法，實(shí)例初始化方法，類和接口的初始化方法使用。

在方法執(zhí)行過程中遇到異常（Exception），并且這個異常沒有在方法內(nèi)進(jìn)行處理，也就是只要在本方法的異常表中沒有搜索到匹配的異常處理器，就會導(dǎo)致方法退出，簡稱異常完成出口。