Java 的多態(tài)在 JVM 里原來是這樣的
多態(tài)
面向?qū)ο蟮木幊陶Z言里,「多態(tài)」是一個(gè)至關(guān)重要的概念。我們常說,面向?qū)ο蟮谋举|(zhì),是方法與數(shù)據(jù)的綁定。那對(duì)于一個(gè)擁有繼承關(guān)系的類之間,方法的綁定,是終是子類「重寫」父類的方法,通過父類的引用指向子類的對(duì)象,實(shí)現(xiàn)運(yùn)行時(shí)的多態(tài)。
說起來比較繞,我們先以僅次于Hello World 著名的 「動(dòng)物 - 狗」代碼來說明多態(tài),然后再來分析在 JVM 層面,多態(tài)是怎樣實(shí)現(xiàn)的。
- package com.example.demo;
- public class Demo {
- public static void main(String[] args) {
- Animal a = new Animal();
- a.say();
- Dog d = new Dog();
- d.say();
- Animal ad = new Dog();
- ad.say();
- }
- }
- class Animal {
- public void say() {
- System.out.println("Animal say");
- }
- public void play() {
- System.out.println("play...");
- }
- }
- class Dog extends Animal {
- public void say() {
- System.out.println("Dog say");
- }
- }
輸出的內(nèi)容對(duì)于習(xí)慣了面向?qū)ο蟮?Java 開發(fā)者來說都比較熟悉
- Animal say
- Dog say
- Dog say
那虛擬機(jī)是怎樣知道到底要調(diào)用 Animal 的 say 還是 Dog 的say呢?
咱們從字節(jié)碼的層面來看一下。
- 0 new #2 <com/example/demo/Animal>
- 3 dup
- 4 invokespecial #3 <com/example/demo/Animal.<init>>
- 7 astore_1
- 8 aload_1
- 9 invokevirtual #4 <com/example/demo/Animal.say>
- 12 new #5 <com/example/demo/Dog>
- 15 dup
- 16 invokespecial #6 <com/example/demo/Dog.<init>>
- 19 astore_2
- 20 aload_2
- 21 invokevirtual #7 <com/example/demo/Dog.say>
- 24 new #5 <com/example/demo/Dog>
- 27 dup
- 28 invokespecial #6 <com/example/demo/Dog.<init>>
- 31 astore_3
- 32 aload_3
- 33 invokevirtual #4 <com/example/demo/Animal.say>
- 36 return
你發(fā)現(xiàn)沒有,在字節(jié)碼的第9行,和第33行,分別對(duì)應(yīng)到 d.say() 和 ad.say() ,但指令內(nèi)容其實(shí)是一樣的。這就神奇了。
在這兩個(gè)方法執(zhí)行前,第8行和第32行,會(huì)有一個(gè)aload的操作,是把這兩個(gè)對(duì)象的引用 壓到棧頂,給后面的操作用。這兩個(gè)對(duì)象,一般也被稱為方法的接收者(Receiver),如果熟悉 Golang等語言的朋友,對(duì)這個(gè)概念也不陌生。
從9行和第33行看,無論是方法調(diào)用的字節(jié)碼指令還是參數(shù),都指向了常量池的第4項(xiàng)。都是一樣的,但最終結(jié)果并不相同。這里的重點(diǎn)在于 invokevirtual 這個(gè)指令的多態(tài)指行查找過程,即根據(jù)對(duì)象的 vtable 在運(yùn)行時(shí)定位方法。
啥是 vtable?
前面的內(nèi)容提到指令執(zhí)行時(shí)從棧頂獲取當(dāng)前方法的「接收者」,通過invokerirtual 來執(zhí)行這個(gè)接者者對(duì)應(yīng)的方法。 注意這里的 virtual,和C++的虛方法類似。這個(gè)咱們不提,只說Java 的。
對(duì)象都有一個(gè)自己的「方法表」,這個(gè)表里除了自己的方法,還有從父類繼承來的方法,甚至重寫的父類的方法。所以,對(duì)應(yīng)于重寫與重載,體現(xiàn)在方法表里也有所區(qū)別。每個(gè)子類繼承父類的時(shí)候,都將直接復(fù)制一份父類的方法表,而對(duì)于父類方法的重寫,會(huì)直接更新方法表里相同順序的這個(gè)方法。
而重載,本質(zhì)上由于簽名及參數(shù)的區(qū)別,是一個(gè)新的方法,在方法表里會(huì)是新增一個(gè)元素。
這里的這個(gè)方法表,就是咱們說的 vtable(Virtual Method Table),表里的每個(gè)方法,對(duì)應(yīng)的是它的實(shí)際執(zhí)行入口地址。如果沒有重寫,那父類和子類的地址是一樣的,都指向父類的實(shí)現(xiàn)。
如果子類重寫之后,子類方法表里的這個(gè)方法的地址就指向了自己實(shí)現(xiàn)的版本。
而我們上面字節(jié)碼處觀察到的,兩個(gè) invokevirtual 對(duì)應(yīng)的常量池索引序號(hào)是一樣的,這樣實(shí)現(xiàn)對(duì)于變換實(shí)現(xiàn)類型時(shí),查找方法表只需要換個(gè)對(duì)象,索引依舊相同。
觀察
為了便于 Attach 到 Java 進(jìn)程,可以在代碼里加下 latch 進(jìn)行 awiat 阻塞,啟動(dòng) SA 就能觀察了。
選擇 ClassBrowser
在 Class列表里就能找到咱們上面創(chuàng)建的對(duì)象。@ 符號(hào)后面是這個(gè)對(duì)象對(duì)應(yīng)的內(nèi)存地址。復(fù)制上Dog的地址,再從菜單里選擇Inspector,
你看 _vtable_len: 7
這是告訴我們 vtable 長(zhǎng)度是7,里面有7個(gè)方法。
實(shí)際上咱們?cè)谶@個(gè)類里只重寫了父類 Animal 的 say方法,其它的是從 Animal 繼承來的 play方法,以及超類 Object 里的 5個(gè)方法,大概這個(gè)樣子
JVM 在首次加載類的時(shí)候,會(huì)解析類內(nèi)包含的方法,方法解析之后就會(huì)計(jì)算當(dāng)前類 vtable的大小。
可能你會(huì)問,Object 類內(nèi)不止5個(gè)方法,為什么只算5個(gè)呢?而且我們新增其它static、 final 這一類的方法呢?
這里 vtable 只計(jì)算非static final 的,全部計(jì)算完就得出了vtable_len這個(gè)值。
每個(gè) Java 的 Class 在 JVM 內(nèi)部都會(huì)有一個(gè)自己的instanceKlass, vtable就分配在這個(gè)的最后。
整個(gè)instanceKlass的大小,在64位系統(tǒng)里大小是 0x1b8,記住它,后面用的著。 所以咱們上面看到了Dog 類的內(nèi)存地址,繼續(xù)找就能看到他其它方法對(duì)應(yīng)的內(nèi)存地址。
在Windows -> console 里執(zhí)行這個(gè):
- mem 0x7C0060DD0 7
這個(gè)值怎么來的呢?是從對(duì)象的內(nèi)存地址開始,加上 instanceKlass的大小。
- 0x7C0060DD0 = 0x00000007c0060c18 + 0x1b8
由于我們有7個(gè)方法,所以順序查找7個(gè)地址。
所以你應(yīng)該也發(fā)現(xiàn)了,Java 里對(duì)應(yīng)這種重寫的方法,是在類加載的時(shí)候,才能知道具體對(duì)應(yīng)的是哪個(gè)方法,因此也被稱為動(dòng)態(tài)綁定或者遲綁定。
總結(jié)起來,這里的 vtable,相當(dāng)于你的工具清單,有什么能力都做了羅列,像鋼鐵俠的各項(xiàng)技能,每個(gè)功能指向具體的超能力,在我們代碼里可以把它理解成一個(gè)數(shù)組,數(shù)組的每個(gè)元素指向一個(gè)方法地址。
感興趣的話,你加個(gè)static 的方法自己找找,看看在不在這里面呢?畢竟static方法執(zhí)行不是有 invokestatic 指令嘛。
本文轉(zhuǎn)載自微信公眾號(hào)「 Tomcat那些事兒」,可以通過以下二維碼關(guān)注。轉(zhuǎn)載本文請(qǐng)聯(lián)系 Tomcat那些事兒公眾號(hào)。