Java類加載及對(duì)象創(chuàng)建過程詳解
類加載過程
類加載的五個(gè)過程:加載、驗(yàn)證、準(zhǔn)備、解析、初始化。

加載
在加載階段,虛擬機(jī)主要完成三件事:
- 通過一個(gè)類的全限定名來獲取定義此類的二進(jìn)制字節(jié)流。
- 將這個(gè)字節(jié)流所代表的靜態(tài)存儲(chǔ)結(jié)構(gòu)轉(zhuǎn)化為方法區(qū)域的運(yùn)行時(shí)數(shù)據(jù)結(jié)構(gòu)。
- 在Java堆中生成一個(gè)代表這個(gè)類的java.lang.Class對(duì)象,作為方法區(qū)域數(shù)據(jù)的訪問入口。
驗(yàn)證
驗(yàn)證階段作用是保證Class文件的字節(jié)流包含的信息符合JVM規(guī)范,不會(huì)給JVM造成危害。如果驗(yàn)證失敗,就會(huì)拋出一個(gè)java.lang.VerifyError異?;蚱渥宇惍惓!r?yàn)證過程分為四個(gè)階段:
- 文件格式驗(yàn)證:驗(yàn)證字節(jié)流文件是否符合Class文件格式的規(guī)范,并且能被當(dāng)前虛擬機(jī)正確的處理。
- 元數(shù)據(jù)驗(yàn)證:是對(duì)字節(jié)碼描述的信息進(jìn)行語義分析,以保證其描述的信息符合Java語言的規(guī)范要求
- 字節(jié)碼驗(yàn)證:主要是進(jìn)行數(shù)據(jù)流和控制流的分析,保證被校驗(yàn)類的方法在運(yùn)行時(shí)不會(huì)危害虛擬機(jī)。
- 符號(hào)引用驗(yàn)證:符號(hào)引用驗(yàn)證發(fā)生在虛擬機(jī)將符號(hào)引用轉(zhuǎn)化為直接引用的時(shí)候,這個(gè)轉(zhuǎn)化動(dòng)作將在解析階段中發(fā)生。
準(zhǔn)備
準(zhǔn)備階段為變量分配內(nèi)存并設(shè)置類變量的初始化。在這個(gè)階段分配的僅為類的變量(static修飾的變量),而不包括類的實(shí)例變量。對(duì)已非final的變量,JVM會(huì)將其設(shè)置成“零值”,而不是其賦值語句的值:pirvate static int size = 12;。那么在這個(gè)階段,size的值為0,而不是12。但final修飾的類變量將會(huì)賦值成真實(shí)的值。
解析
解析過程是將常量池內(nèi)的符號(hào)引用替換成直接引用。主要包括四種類型引用的解析。類或接口的解析、字段解析、方法解析、接口方法解析。
初始化
在準(zhǔn)備階段,類變量已經(jīng)經(jīng)過一次初始化了,在這個(gè)階段,則是通過程序制定的計(jì)劃去初始化類的變量和其他資源。這些資源有static{}塊,構(gòu)造函數(shù),父類的初始化等。
至于使用和卸載階段階段,這里不再過多說明,使用過程就是根據(jù)程序定義的行為執(zhí)行,卸載由GC完成。
雙親委派模型
類加載器按照層次,從頂層到底層,分為以下三種:
- 啟動(dòng)類加載器(BootstrapClassLoader)
- 這個(gè)類加載器負(fù)責(zé)加載%JRE_HOME%\lib下的rt.jar、resources.jar、charsets.jar和class等??梢酝⊿ystem.getProperty("sun.boot.class.path")查看加載的路徑。
- 擴(kuò)展類加載器(ExtensionClassLoader)
- 負(fù)責(zé)加載目錄%JRE_HOME%\lib\ext目錄下的jar包和class文件。也可以通過System.out.println(System.getProperty("java.ext.dirs"))查看加載類文件的路徑。
- 應(yīng)用程序類加載器(ApplicationClassLoader)
- 這個(gè)加載器是ClassLoader中g(shù)etSystemClassLoader()方法的返回值,所以一般也稱它為系統(tǒng)類加載器。它負(fù)責(zé)加載用戶類路徑(Classpath)上所指定的類庫,可直接使用這個(gè)加載器,如果應(yīng)用程序沒有自定義自己的類加載器,一般情況下這個(gè)就是程序中默認(rèn)的類加載。

上圖只是類加載的順序,和類繼承無關(guān)。ExtClassLoader,AppClassLoder繼承URLClassLoader,而URLClassLoader繼承ClassLoader。BoopStrap ClassLoder是由C/C++編寫的,它本身是虛擬機(jī)的一部分,并不是一個(gè)java類。
AppClassLoader的父加載器為ExtClassLoader,ExtClassLoader的父加載器為null,BoopStrap ClassLoader為頂級(jí)加載器
工作過程
如果一個(gè)類加載器收到了類加載的請(qǐng)求,它首先不會(huì)自己去嘗試加載這個(gè)類,而是把這個(gè)請(qǐng)求委派給父類加載器去完成,每一個(gè)層次的類加載器都是如此,因此所有的加載請(qǐng)求最終都應(yīng)該傳遞到頂層的啟動(dòng)類加載器中,只有當(dāng)父類加載器反饋?zhàn)约簾o法完成這個(gè)請(qǐng)求(它的搜索范圍中沒有找到所需的類)時(shí),子加載器才會(huì)嘗試自己去加載。
相對(duì)應(yīng)的實(shí)現(xiàn)邏輯:先檢查類是否被加載過,若沒有就調(diào)用父加載器的loadClass方法,若父加載器為空則默認(rèn)使用啟動(dòng)類加載器作為父加載器。如果父加載器加載失敗,拋出異常,再調(diào)用自己的findClass方法進(jìn)行加載。
具體示例:
假如我們自定義Test class文件,jvm要加載Test.class的時(shí)候:
- 首先會(huì)到自定義加載器中查找,看是否已經(jīng)加載過,如果已經(jīng)加載過,則返回字節(jié)碼。
- 如果自定義加載器沒有加載過,則詢問上一層加載器(即AppClassLoader)是否已經(jīng)加載過Test.class。
- 如果沒有加載過,則詢問上一層加載器(ExtClassLoader)是否已經(jīng)加載過。
- 如果沒有加載過,則繼續(xù)詢問上一層加載(BoopStrap ClassLoader)是否已經(jīng)加載過。
- 如果BoopStrap ClassLoader依然沒有加載過,則到自己指定類加載路徑下("sun.boot.class.path")查看是否有Test.class字節(jié)碼,有則返回,沒有通知下一層加載器ExtClassLoader到自己指定的類加載路徑下(java.ext.dirs)查看。
- 依次類推,最后到自定義類加載器指定的路徑還沒有找到Test.class字節(jié)碼,則拋出異常ClassNotFoundException。
雙親委派的好處
Java類隨著它的類加載器一起具備了一種帶有優(yōu)先級(jí)的層次關(guān)系。例如類Object,它放在rt.jar中,無論哪一個(gè)類加載器要加載這個(gè)類,最終都是委派給啟動(dòng)類加載器進(jìn)行加載,因此Object類在程序的各種類加載器環(huán)境中都是同一個(gè)類。
判斷兩個(gè)類是否相同是通過classloader.class這種方式進(jìn)行的,所以哪怕是同一個(gè)class文件如果被兩個(gè)classloader加載,那么他們也是不同的類。
實(shí)現(xiàn)自己的加載器,只需要繼承ClassLoader,并覆蓋findClass方法。
對(duì)象創(chuàng)建過程

對(duì)象的流程
1. 類加載檢查
JVM遇到一條new指令時(shí),首先檢查這個(gè)指令的參數(shù)是否能在常量池中定位到一個(gè)類的符號(hào)引用,并且檢查這個(gè)符號(hào)引用代表的類是否已被加載、解析和初始化過。
如果沒有,那必須先執(zhí)行相應(yīng)的類的加載過程。
2. 對(duì)象分配內(nèi)存
對(duì)象所需內(nèi)存的大小在類加載完成后便完全確定(對(duì)象內(nèi)存布局),為對(duì)象分配空間的任務(wù)等同于把一塊確定大小的內(nèi)存從Java堆中劃分出來。
根據(jù)Java堆中是否規(guī)整有兩種內(nèi)存的分配方式:(Java堆是否規(guī)整由所采用的垃圾收集器是否帶有壓縮整理功能決定)。
指針碰撞(Bump the pointer)
Java堆中的內(nèi)存是規(guī)整的,所有用過的內(nèi)存都放在一邊,空閑的內(nèi)存放在另一邊,中間放著一個(gè)指針作為分界點(diǎn)的指示器,分配內(nèi)存也就是把指針向空閑空間那邊移動(dòng)一段與內(nèi)存大小相等的距離。例如:Serial、ParNew等收集器。
空閑列表(Free List)
Java堆中的內(nèi)存不是規(guī)整的,已使用的內(nèi)存和空閑的內(nèi)存相互交錯(cuò),就沒有辦法簡單的進(jìn)行指針碰撞了。虛擬機(jī)必須維護(hù)一張列表,記錄哪些內(nèi)存塊是可用的,在分配的時(shí)候從列表中找到一塊足夠大的空間劃分給對(duì)象實(shí)例,并更新列表上的記錄。例如:CMS這種基于Mark-Sweep算法的收集器。
3. 并發(fā)處理
對(duì)象創(chuàng)建在虛擬機(jī)中時(shí)非常頻繁的行為,即使是僅僅修改一個(gè)指針指向的位置,在并發(fā)情況下也并不是線程安全的,可能出現(xiàn)正在給對(duì)象A分配內(nèi)存,指針還沒來得及修改,對(duì)象B又同時(shí)使用了原來的指針來分配內(nèi)存的情況。解決這個(gè)問題有兩種方案:
同步
虛擬機(jī)采用CAS配上失敗重試的方式保證更新操作的原子性
本地線程分配緩沖(Thread Local Allocation Buffer, TLAB)
把內(nèi)存分配的動(dòng)作按照線程劃分為在不同的空間之中進(jìn)行,即每個(gè)線程在Java堆中預(yù)先分配一小塊內(nèi)存(TLAB)。哪個(gè)線程要分配內(nèi)存,就在哪個(gè)線程的TLAB上分配。只有TLAB用完并分配新的TLAB時(shí),才需要同步鎖定。
虛擬機(jī)是否使用TLAB,可以通過-XX:+/-UseTLAB參數(shù)來設(shè)定。
4. 內(nèi)存空間初始化
虛擬機(jī)將分配到的內(nèi)存空間都初始化為零值(不包括對(duì)象頭),如果使用了TLAB,這一工作過程也可以提前至TLAB分配時(shí)進(jìn)行。
內(nèi)存空間初始化保證了對(duì)象的實(shí)例字段在Java代碼中可以不賦初始值就直接使用,程序能訪問到這些字段的數(shù)據(jù)類型所對(duì)應(yīng)的零值。
注意:類的成員變量可以不顯示地初始化(Java虛擬機(jī)都會(huì)先自動(dòng)給它初始化為默認(rèn)值)。方法中的局部變量如果只負(fù)責(zé)接收一個(gè)表達(dá)式的值,可以不初始化,但是參與運(yùn)算和直接輸出等其它情況的局部變量需要初始化。
5. 對(duì)象設(shè)置
虛擬機(jī)對(duì)對(duì)象進(jìn)行必要的設(shè)置,例如這個(gè)對(duì)象是哪個(gè)類的實(shí)例、如何才能找到類的元數(shù)據(jù)信息、對(duì)象的哈希碼、對(duì)象的GC分代年齡等信息。這些信息存放在對(duì)象的對(duì)象頭之中。
6. 執(zhí)行init()
在上面的工作都完成之后,從虛擬機(jī)的角度看,一個(gè)新的對(duì)象已經(jīng)產(chǎn)生了。但是從Java程序的角度看,對(duì)象的創(chuàng)建才剛剛開始init()方法還沒有執(zhí)行,所有的字段都還是零。
所以,一般來說(由字節(jié)碼中是否跟隨invokespecial指令所決定),執(zhí)行new指令之后會(huì)接著執(zhí)行init()方法,把對(duì)象按照程序員的意愿進(jìn)行初始化,這樣一個(gè)真正可用的對(duì)象才算產(chǎn)生出來。
對(duì)象的內(nèi)存布局
在HotSpot虛擬機(jī)中。對(duì)象在內(nèi)存中存儲(chǔ)的布局分為:
- 對(duì)象頭
- 實(shí)例數(shù)據(jù)
- 對(duì)齊填充
對(duì)象頭
HotSpot虛擬機(jī)的對(duì)象頭包括兩部分信息:運(yùn)行時(shí)數(shù)據(jù)和類型指針。
- 運(yùn)行時(shí)數(shù)據(jù):用于存儲(chǔ)對(duì)象自身的運(yùn)行時(shí)數(shù)據(jù),如哈希碼(HashCode)、GC分代年齡、鎖狀態(tài)標(biāo)志、線程持有的鎖、偏向線程ID、偏向時(shí)間戳等。
- 類型指針:對(duì)象指向它的類元數(shù)據(jù)的指針,虛擬機(jī)通過這個(gè)指針來確定這個(gè)對(duì)象是哪個(gè)類的實(shí)例。

如果對(duì)象是一個(gè)Java數(shù)組,那在對(duì)象頭中還必須有一塊用于記錄數(shù)組長度的數(shù)據(jù),因?yàn)樘摂M機(jī)可以通過普通Java對(duì)象的元數(shù)據(jù)信息確定Java對(duì)象的大小,但是從數(shù)組的元數(shù)據(jù)中無法確定數(shù)組的大小。
(并不是所有的虛擬機(jī)實(shí)現(xiàn)都必須在對(duì)象數(shù)據(jù)上保留類型指針,換句話說,查找對(duì)象的元數(shù)據(jù)并不一定要經(jīng)過對(duì)象本身,可參考對(duì)象的訪問定位)
HotSpot底層通過markOop實(shí)現(xiàn)Mark Word,具體實(shí)現(xiàn)位于markOop.hpp文件。markOop中提供了大量方法用于查看當(dāng)前對(duì)象頭的狀態(tài),以及更新對(duì)象頭的數(shù)據(jù),為synchronized鎖的實(shí)現(xiàn)提供了基礎(chǔ)。[比如說我們知道synchronized鎖的是對(duì)象而不是代碼,而鎖的狀態(tài)保存在對(duì)象頭中,進(jìn)而實(shí)現(xiàn)鎖住對(duì)象]。
有關(guān)synchronized的進(jìn)一步介紹,可以點(diǎn)擊查看:詳解Java多線程鎖之synchronized
實(shí)例數(shù)據(jù)
實(shí)例數(shù)據(jù)部分是對(duì)象真正存儲(chǔ)的有效信息,也是在程序代碼中所定義的各種類型的字段內(nèi)容。無論是從父類中繼承下來的,還是在子類中定義的,都需要記錄下來。HotSpot虛擬機(jī)默認(rèn)的分配策略為longs/doubles、ints、shorts/chars、bytes/booleans、oop,從分配策略中可以看出,相同寬度的字段總是分配到一起。
對(duì)齊填充
HotSpot虛擬機(jī)要求對(duì)象的起始地址必須是8字節(jié)的整數(shù)倍,也就是對(duì)象的大小必須是8字節(jié)的整數(shù)倍。而對(duì)象頭部分正好是8字節(jié)的倍數(shù)(1倍或者2倍),因此,當(dāng)對(duì)象實(shí)例數(shù)據(jù)部分沒有對(duì)齊的時(shí)候,就需要通過對(duì)齊填充來補(bǔ)全。
對(duì)象的訪問定位
java程序需要通過引用(ref)數(shù)據(jù)來操作堆上面的對(duì)象,那么如何通過引用定位、訪問到對(duì)象的具體位置。
對(duì)象的訪問方式由虛擬機(jī)決定,java虛擬機(jī)提供兩種主流的方式
1.句柄訪問對(duì)象
2.直接指針訪問對(duì)象。(Sun HotSpot使用這種方式)
句柄訪問
簡單來說就是java堆劃出一塊內(nèi)存作為句柄池,引用中存儲(chǔ)對(duì)象的句柄地址,句柄中包含對(duì)象實(shí)例數(shù)據(jù)、類型數(shù)據(jù)的地址信息。
優(yōu)點(diǎn):引用中存儲(chǔ)的是穩(wěn)定的句柄地址,在對(duì)象被移動(dòng)【垃圾收集時(shí)移動(dòng)對(duì)象是常態(tài)】只需改變句柄中實(shí)例數(shù)據(jù)的指針,不需要改動(dòng)引用【ref】本身。

直接指針
在這種方式中,JVM棧中的棧幀中的本地變量表中所存儲(chǔ)的引用地址就是實(shí)例數(shù)據(jù)的地址。通過這個(gè)引用就能直接獲取到實(shí)例數(shù)據(jù)的地址。
其實(shí)引用所指向的對(duì)內(nèi)存中的對(duì)象數(shù)據(jù)有兩部分組成,一部分就是這個(gè)對(duì)象實(shí)例本身,另一部分是對(duì)象類型在方法區(qū)中的地址。
優(yōu)點(diǎn):優(yōu)勢很明顯,就是速度快,相比于句柄訪問少了一次指針定位的開銷時(shí)間。由于對(duì)象的訪問在Java中非常頻繁,因此這類開銷積少成多后也是一項(xiàng)非??捎^的執(zhí)行成本。虛擬機(jī)Sun HotSpot而言,它是使用第二種方式進(jìn)行對(duì)象訪問的,但從整個(gè)軟件開發(fā)的范圍來看,各種語言和框架使用句柄來訪問的情況也十分常見。







