攜程面試官竟然問我 Java 虛擬機(jī)棧!
大家好,我是那個永遠(yuǎn) 18 歲的老妖怪~噓
從《JVM 內(nèi)存區(qū)域劃分》這篇文章中,大家應(yīng)該 get 到了,Java 虛擬機(jī)內(nèi)存區(qū)域可以劃分為程序計(jì)數(shù)器、Java 虛擬機(jī)棧、本地方法棧和堆。今天,我們來圍繞其中的一個區(qū)域——Java 虛擬機(jī)棧,深入地展開下。
先說明一下哈。這篇文章的標(biāo)題里帶了一個“攜程面試官”,有標(biāo)題黨的嫌疑。但有一說一,確實(shí)有讀者在上一篇文章里留言說,攜程面試官問他了 Java 虛擬機(jī)內(nèi)存方面的知識點(diǎn),所以今天的標(biāo)題我就“借題發(fā)揮”了。
從“相見恨晚”這個詞中,我估摸著這名讀者在這道面試題前面折戟沉沙了。這么說吧,面試官確實(shí)喜歡問 Java 虛擬機(jī)方面的知識點(diǎn),因?yàn)楹苣芸疾斐鲆幻麘?yīng)聘者的真實(shí)功底,所以我打算多寫幾篇這方面的文章,希望能給大家多一點(diǎn)點(diǎn)幫助~
Java 虛擬機(jī)以方法作為基本的執(zhí)行單元,“棧幀(Stack Frame)”則是用于支持 Java 虛擬機(jī)進(jìn)行方法調(diào)用和方法執(zhí)行的基本數(shù)據(jù)結(jié)構(gòu)。每一個棧幀中都包含了局部變量表、操作數(shù)棧、動態(tài)鏈接、方法返回地址和一些額外的附加信息(比如與調(diào)試、性能手機(jī)相關(guān)的信息)。之前的文章里有提到過這些概念,并做了一些簡單扼要的介紹,但我覺得還不夠詳細(xì),所以這篇重點(diǎn)要來介紹一下棧幀中的這些概念。
1)局部變量表
局部變量表(Local Variables Table)用來保存方法中的局部變量,以及方法參數(shù)。當(dāng) Java 源代碼文件被編譯成 class 文件的時候,局部變量表的最大容量就已經(jīng)確定了。
我們來看這樣一段代碼。
- public class LocalVaraiablesTable {
- private void write(int age) {
- String name = "沉默王二";
- }
- }
write() 方法有一個參數(shù) age,一個局部變量 name。
然后用 Intellij IDEA 的 jclasslib 查看一下編譯后的字節(jié)碼文件 LocalVaraiablesTable.class??梢钥吹? write() 方法的 Code 屬性中,Maximum local variables(局部變量表的最大容量)的值為 3。
按理說,局部變量表的最大容量應(yīng)該為 2 才對,一個 age,一個 name,為什么是 3 呢?
當(dāng)一個成員方法(非靜態(tài)方法)被調(diào)用時,第 0 個變量其實(shí)是調(diào)用這個成員方法的對象引用,也就是那個大名鼎鼎的 this。調(diào)用方法 write(18),實(shí)際上是調(diào)用 write(this, 18)。
點(diǎn)開 Code 屬性,查看 LocalVaraiableTable 就可以看到詳細(xì)的信息了。
第 0 個是 this,類型為 LocalVaraiablesTable 對象;第 1 個是方法參數(shù) age,類型為整形 int;第 2 個是方法內(nèi)部的局部變量 name,類型為字符串 String。
當(dāng)然了,局部變量表的大小并不是方法中所有局部變量的數(shù)量之和,它與變量的類型和變量的作用域有關(guān)。當(dāng)一個局部變量的作用域結(jié)束了,它占用的局部變量表中的位置就被接下來的局部變量取代了。
來看下面這段代碼。
- public static void method() {
- // ①
- if (true) {
- // ②
- String name = "沉默王二";
- }
- // ③
- if(true) {
- // ④
- int age = 18;
- }
- // ⑤
- }
- method() 方法的局部變量表大小為 1,因?yàn)槭庆o態(tài)方法,所以不需要添加 this 作為局部變量表的第一個元素;
- ②的時候局部變量有一個 name,局部變量表的大小變?yōu)?1;
- ③的時候 name 變量的作用域結(jié)束;
- ④的時候局部變量有一個 age,局部變量表的大小為 1;
- ⑤的時候局 age 變量的作用域結(jié)束;
關(guān)于局部變量的作用域,《Effective Java》 中的第 57 條建議:
將局部變量的作用域最小化,可以增強(qiáng)代碼的可讀性和可維護(hù)性,并降低出錯的可能性。
在此,我還有一點(diǎn)要提醒大家。為了盡可能節(jié)省棧幀耗用的內(nèi)存空間,局部變量表中的槽是可以重用的,就像 method() 方法演示的那樣,這就意味著,合理的作用域有助于提高程序的性能。
局部變量表的容量以槽(slot)為最小單位,一個槽可以容納一個 32 位的數(shù)據(jù)類型(比如說 int,當(dāng)然了,《Java 虛擬機(jī)規(guī)范》中沒有明確指出一個槽應(yīng)該占用的內(nèi)存空間大小,但我認(rèn)為這樣更容易理解),像 float 和 double 這種明確占用 64 位的數(shù)據(jù)類型會占用兩個緊挨著的槽。
來看下面的代碼。
- public void solt() {
- double d = 1.0;
- int i = 1;
- }
用 jclasslib 可以查看到,solt() 方法的 Maximum local variables 的值為 4。
為什么等于 4 呢?帶上 this 也就 3 個呀?
查看 LocalVaraiableTable 就明白了,變量 i 的下標(biāo)為 3,也就意味著變量 d 占了兩個槽。
2)操作數(shù)棧
同局部變量表一樣,操作數(shù)棧(Operand Stack)的最大深度也在編譯的時候就確定了,被寫入到了 Code 屬性的 maximum stack size 中。當(dāng)一個方法剛開始執(zhí)行的時候,操作數(shù)棧是空的,在方法執(zhí)行過程中,會有各種字節(jié)碼指令往操作數(shù)棧中寫入和取出數(shù)據(jù),也就是入棧和出棧操作。
來看下面這段代碼。
- public class OperandStack {
- public void test() {
- add(1,2);
- }
- private int add(int a, int b) {
- return a + b;
- }
- }
OperandStack 類共有 2 個方法,test() 方法中調(diào)用了 add() 方法,傳遞了 2 個參數(shù)。用 jclasslib 可以看到,test() 方法的 maximum stack size 的值為 3。
這是因?yàn)檎{(diào)用成員方法的時候會將 this 和所有參數(shù)壓入棧中,調(diào)用完畢后 this 和參數(shù)都會一一出棧。通過 「Bytecode」 面板可以查看到對應(yīng)的字節(jié)碼指令。
aload_0 用于將局部變量表中下標(biāo)為 0 的引用類型的變量,也就是 this 加載到操作數(shù)棧中;
- iconst_1 用于將整數(shù) 1 加載到操作數(shù)棧中;
- iconst_2 用于將整數(shù) 2 加載到操作數(shù)棧中;
- invokevirtual 用于調(diào)用對象的成員方法;
- pop 用于將棧頂?shù)闹党鰲?
- return 為 void 方法的返回指令。
再來看一下 add() 方法的字節(jié)碼指令。
- iload_1 用于將局部變量表中下標(biāo)為 1 的 int 類型變量加載到操作數(shù)棧上(下標(biāo)為 0 的是 this);
- iload_2 用于將局部變量表中下標(biāo)為 2 的 int 類型變量加載到操作數(shù)棧上;
- iadd 用于 int 類型的加法運(yùn)算;
- ireturn 為返回值為 int 的方法返回指令。
操作數(shù)中的數(shù)據(jù)類型必須與字節(jié)碼指令匹配,以上面的 iadd 指令為例,該指令只能用于整形數(shù)據(jù)的加法運(yùn)算,它在執(zhí)行的時候,棧頂?shù)膬蓚€數(shù)據(jù)必須是 int 類型的,不能出現(xiàn)一個 long 型和一個 double 型的數(shù)據(jù)進(jìn)行 iadd 命令相加的情況。
3)動態(tài)鏈接
每個棧幀都包含了一個指向運(yùn)行時常量池中該棧幀所屬方法的引用,持有這個引用是為了支持方法調(diào)用過程中的動態(tài)鏈接(Dynamic Linking)。
來看下面這段代碼。
- public class DynamicLinking {
- static abstract class Human {
- protected abstract void sayHello();
- }
- static class Man extends Human {
- @Override
- protected void sayHello() {
- System.out.println("男人哭吧哭吧不是罪");
- }
- }
- static class Woman extends Human {
- @Override
- protected void sayHello() {
- System.out.println("山下的女人是老虎");
- }
- }
- public static void main(String[] args) {
- Human man = new Man();
- Human woman = new Woman();
- man.sayHello();
- woman.sayHello();
- man = new Woman();
- man.sayHello();
- }
- }
大家對 Java 重寫有了解的話,應(yīng)該能看懂這段代碼的意思。Man 類和 Woman 類繼承了 Human 類,并且重寫了 sayHello() 方法。來看一下運(yùn)行結(jié)果:
- 男人哭吧哭吧不是罪
- 山下的女人是老虎
- 山下的女人是老虎
這個運(yùn)行結(jié)果很好理解,man 的引用類型為 Human,但指向的是 Man 對象,woman 的引用類型也為 Human,但指向的是 Woman 對象;之后,man 又指向了新的 Woman 對象。
從面向?qū)ο缶幊痰慕嵌?,從多態(tài)的角度,我們對運(yùn)行結(jié)果是很好理解的,但站在 Java 虛擬機(jī)的角度,它是如何判斷 man 和 woman 該調(diào)用哪個方法的呢?
用 jclasslib 看一下 main 方法的字節(jié)碼指令。
- 第 1 行:new 指令創(chuàng)建了一個 Man 對象,并將對象的內(nèi)存地址壓入棧中。
- 第 2 行:dup 指令將棧頂?shù)闹祻?fù)制一份并壓入棧頂。因?yàn)榻酉聛淼闹噶?invokespecial 會消耗掉一個當(dāng)前類的引用,所以需要復(fù)制一份。
- 第 3 行:invokespecial 指令用于調(diào)用構(gòu)造方法進(jìn)行初始化。
- 第 4 行:astore_1,Java 虛擬機(jī)從棧頂彈出 Man 對象的引用,然后將其存入下標(biāo)為 1 局部變量 man 中。
- 第 5、6、7、8 行的指令和第 1、2、3、4 行類似,不同的是 Woman 對象。
- 第 9 行:aload_1 指令將第局部變量 man 壓入操作數(shù)棧中。
- 第 10 行:invokevirtual 指令調(diào)用對象的成員方法 sayHello(),注意此時的對象類型為 com/itwanger/jvm/DynamicLinking$Human。
- 第 11 行:aload_2 指令將第局部變量 woman 壓入操作數(shù)棧中。
- 第 12 行同第 10 行。
注意,從字節(jié)碼的角度來看,man.sayHello()(第 10 行)和 woman.sayHello()(第 12 行)的字節(jié)碼是完全相同的,但我們都知道,這兩句指令最終執(zhí)行的目標(biāo)方法并不相同。
究竟發(fā)生了什么呢?
還得從 invokevirtual 這個指令著手,看它是如何實(shí)現(xiàn)多態(tài)的。根據(jù)《Java 虛擬機(jī)規(guī)范》,invokevirtual 指令在運(yùn)行時的解析過程可以分為以下幾步:
①、找到操作數(shù)棧頂?shù)脑厮赶虻膶ο蟮膶?shí)際類型,記作 C。
②、如果在類型 C 中找到與常量池中的描述符匹配的方法,則進(jìn)行訪問權(quán)限校驗(yàn),如果通過則返回這個方法的直接引用,查找結(jié)束;否則返回 java.lang.IllegalAccessError 異常。
③、否則,按照繼承關(guān)系從下往上一次對 C 的各個父類進(jìn)行第二步的搜索和驗(yàn)證。
④、如果始終沒有找到合適的方法,則拋出 java.lang.AbstractMethodError 異常。
也就是說,invokevirtual 指令在第一步的時候就確定了運(yùn)行時的實(shí)際類型,所以兩次調(diào)用中的 invokevirtual 指令并不是把常量池中方法的符號引用解析到直接引用上就結(jié)束了,還會根據(jù)方法接受者的實(shí)際類型來選擇方法版本,這個過程就是 Java 重寫的本質(zhì)。我們把這種在運(yùn)行期根據(jù)實(shí)際類型確定方法執(zhí)行版本的過程稱為動態(tài)鏈接。
4)方法返回地址
當(dāng)一個方法開始執(zhí)行后,只有兩種方式可以退出這個方法:
正常退出,可能會有返回值傳遞給上層的方法調(diào)用者,方法是否有返回值以及返回值的類型根據(jù)方法返回的指令來決定,像之前提到的 ireturn 用于返回 int 類型,return 用于 void 方法;還有其他的一些,lreturn 用于 long 型,freturn 用于 float,dreturn 用于 double,areturn 用于引用類型。
異常退出,方法在執(zhí)行的過程中遇到了異常,并且沒有得到妥善的處理,這種情況下,是不會給它的上層調(diào)用者返回任何值的。
無論是哪種方式退出,在方法退出后,都必須返回到方法最初被調(diào)用時的位置,程序才能繼續(xù)執(zhí)行。一般來說,方法正常退出的時候,PC 計(jì)數(shù)器的值會作為返回地址,棧幀中很可能會保存這個計(jì)數(shù)器的值,異常退出時則不會。
方法退出的過程實(shí)際上等同于把當(dāng)前棧幀出棧,因此接下來可能執(zhí)行的操作有:恢復(fù)上層方法的局部變量表和操作數(shù)棧,把返回值(如果有的話)壓入調(diào)用者棧幀的操作數(shù)棧中,調(diào)整 PC 計(jì)數(shù)器的值,找到下一條要執(zhí)行的指令等。
本文轉(zhuǎn)載自微信公眾號「沉默王二」,可以通過以下二維碼關(guān)注。轉(zhuǎn)載本文請聯(lián)系沉默王二公眾號。