每個人的宿命都是從文本走向二進制,你也不例外 !
老A
“每個人的宿命都是從文本走向二進制,你也不例外 !” 年長的Account.java教訓我這個剛剛誕生的Employee.java 。
Account.java ,我稱呼它為老A ,他的源碼經(jīng)過程序員的多次修改, 多次編譯,歷經(jīng)滄桑。
“走向二進制? 難道我們存儲在硬盤上,內(nèi)存中不是以二進制的形式嗎?” 我有點兒不理解。
“小E同學,” 老A輕蔑地說道,“我當然知道,計算機中的一切都是二進制的,我說的是站在程序員的視角,當程序員把我們從硬盤喚醒,進入IDEA或者Eclipse,會把二進制的我們變成ASCII碼形式來展示。”
“不,確切地說是UTF-8。” 老A補充道。
我看了下自己的文件編碼, 果然是UTF-8。
“那為什么要再變成二進制?變成什么樣的二進制?” 我問道。
“就是編譯成Employee.class啊,.class文件都是字節(jié)碼,關(guān)鍵是只有.class才能進入Java虛擬機,只有在那里,才能體會到生命的真正意義啊!” 老A仰起頭,***憧憬。
老A曾經(jīng)聽Accout.class給他講過Java虛擬機的歷險記,無比羨慕,恨不得自己也去虛擬機走一遭,可惜身份所限,無法成行。
“編譯的感覺怎么樣?” 我問道。
“不怎么樣,有種大卸八塊的感覺,新生成的class和我們幾乎沒啥關(guān)系,幾乎不怎么認我們。”
常量池
編譯的時刻到來了,這個老A的源碼許久未改,不用重新編譯,他冷眼旁觀,看我被javac編譯器大卸八塊。
其實也不是大卸八塊,javac讀取我的源碼,做詞法分析,語法分析,形成抽象語法樹,語義分析...... 忙活了半天,***形成了一個Employee.class。
這小子,剛剛誕生,還在呼呼大睡。 老A說等一會兒就有“警察”來喚醒他了。
在源碼世界中, 我能看到各種各樣的類,名稱,方法,字段,代碼,可以說是源碼面前了無秘密。
- public class Employee {
- private String name;
- private int age;
- public Employee(String name, int age){
- this.name = name;
- this.age = age;
- }
- ... 其他代碼略 ...
- }
相比于豐富多彩.java,這個Employee.class非??菰?,純粹的二進制。
我有點好奇,問javac:“我的類名去哪里兒了?字段名,方法名都去哪里了?”
正在干活的javac沒有搭理我,老A說道:“這我知道,在那個.class文件中,專門有一段區(qū)域,叫做常量池,常量池中有很多條目,每個條目都有編號,從這些條目你就能看出來字段的名稱和描述符,方法的名稱和描述符。我把這些二進制的東西轉(zhuǎn)化成文本你看看。”
看著這一個個天書班的條目,我覺得頭皮發(fā)麻。
“你猜猜,第#15項條目是什么意思?” 老A神秘地說道。
靜下心來仔細看,第15項是一個FieldRef,估計是字段把, 它又指向了第1項和第16項:
順藤摸瓜,先看第1項, 發(fā)現(xiàn)它又指向了第2項,在這里我發(fā)現(xiàn)了類名 :org/coderising/Employee
再看第16項,又引用了第5項和第6項:
其中第5項我的字段名 name , 第6項似乎是字段類型, Ljava/lang/String 這個類型表示法有點古怪,L 可能表示對象吧。
“我大概明白了,第15項條目表示這個Employee類有個叫做name的字段,類型是String。 ”
老A說:“你小子的理解力還不錯嘛。這個常量池的每一項都有編號和類型,他們之間通過互相引用的方式,描述了類的字段,方法等信息。”
“可是為什么用這么古怪的方式來描述字段和方法名呢?”
老A想了想說:“我覺得可能是統(tǒng)一管理,另外還能復用一些東西,比如,你的類有100個String的字段, 那你只需要記錄一次Ljava/lang/String就可以,讓其他的條目指向它即可。 并且,當字節(jié)碼中需要訪問字段的時候,使用編號就可以了。”
老A寫下一行字節(jié)碼: B5 00 0F 。
我一臉懵逼,這是什么鬼?
老A把轉(zhuǎn)換成可以理解的指令: putfield 15,說道: 這就相當于設置name這個屬性(第15項常量池是字段name)的值了。
這class文件的設計者可真是錙銖必較啊,一點兒都不浪費。
變量哪兒去了?
我問老A:“這常量池不是二進制的嗎, 你怎么把他變得可讀的?”
老A嘿嘿一笑: “有個命令叫做javap -v Employee.class,就能看到一切了。”
我也嘗試著去使用,果然,不僅是常量池,就連一個方法的字節(jié)碼都給打印出來了。
Java 方法:
- public void check(){
- Account account = new Account();
- account.check();
- }
編譯過的“可讀的”字節(jié)碼:
- 0: new #24 // 創(chuàng)建org/coderising/Account實例
- 3: dup
- 4: invokespecial #26 //調(diào)用Account的構(gòu)造函數(shù)
- 7: astore_1
- 8: aload_1
- 9: invokevirtual #27 //調(diào)用Account的check方法
- 12: return
雖然沒法看明白這是在干什么,我確發(fā)現(xiàn)了一個讓我吃驚的現(xiàn)象: 這段字節(jié)碼中怎么找不到我的局部變量account 呢? 你看他引用的只是#24,#26,#27號常量池的條目,而我的account變量名稱在常量池中是 #29號! 沒有account 變量,代碼怎么執(zhí)行呢?
我把疑惑給老A說了,老A看了半天,也摸不到門道。
這時候javac說話了:“連這都不知道?!account這個變量名是給程序員看的,在執(zhí)行的時候根本用不到!”
“用不到? 那怎么執(zhí)行?”
“用引用啊, 看到new #24 那個指令沒有? 他的意思是說,把Account這個類(常量池第24項對應的類)在Java 堆上創(chuàng)建一個實例,把這個實例的引用放到棧頂!”
這句話有點深奧,javac只好給我倆畫圖:
畫了圖我倆還是看不懂,javac只好耐心解釋:“Java是基于棧的虛擬機,所有的操作,無論是兩個數(shù)相加,創(chuàng)建對象,調(diào)用方法......等等,都依賴于棧中的數(shù)據(jù)。 當你用new #24創(chuàng)建對象時,Account的實例就會在堆中創(chuàng)建,同時虛擬機會把這個實例的引用,即objectref放到棧頂,有了這個objectref, 你說還需要代碼中的account變量嗎? ”
嗯,似乎是不需要了。
javac接著說:“有了這個對象的引用,就可以為所欲為了,比如調(diào)用他的check方法”
invokevirtual #27 // Method org/coderising/Account.check:()V
只需要把這個objectref從棧頂取出,傳遞給Account.check方法就可以了(注意:check方法是有個隱藏的this參數(shù)的)。
(碼農(nóng)翻身注:函數(shù)調(diào)用需要建立新的棧幀,參見《我是一個Java Class》)
一切為了調(diào)試
說話間,果然有人來喚醒Employee.class,準備讓他去虛擬機執(zhí)行了。
老A滿臉羨慕:“這么快!代碼剛寫出來就能運行!估計這個程序員喜歡'小步快跑'的方式開發(fā)吧!”
我問道:“難道這個Employee.class和我的源碼一點關(guān)系都沒有了嗎?”
Employe.class一邊收拾東西一邊說:“要說沒有關(guān)系那是不對的, 在我這里有個叫做LineNumberTable的東西,里邊保存了字節(jié)碼指令和源代碼行號的關(guān)系。”
“這有啥用處?”
“對程序員來說用處極大,” 那個class文件說道:“他們經(jīng)常需要調(diào)試程序, 如果沒有這個對應關(guān)系,怎么知道運行到哪一行源碼了? 即使不調(diào)試,運行拋出異常時也得顯示是哪一行出錯吧!”
這小子雖然是從我這里編譯出來的,但是傲氣十足。
“我們還有什么關(guān)聯(lián)?”
“還有一個叫做LocalVariableTable。主要在.class文件中記錄一個方法的參數(shù)名,如果沒有它,當別人引用我這個class的時候,IDE只好用arg0, arg1這樣丑陋的名稱來顯示。算了,不給你說了,我得趕緊走了。”
Employee.class跟著警察走了,留下我和老A呆在這里。
【本文為51CTO專欄作者“劉欣”的原創(chuàng)稿件,轉(zhuǎn)載請通過作者微信公眾號coderising獲取授權(quán)】