講透JVM類(lèi)加載機(jī)制,向高手進(jìn)階
1、前言
先來(lái)看一下JVM整體的一個(gè)運(yùn)行原理。
我們首先從“.java”代碼文件,編譯成“.class”字節(jié)碼文件,然后類(lèi)加載器把“.class”字節(jié)碼文件中的類(lèi)給加載到JVM中,接著是JVM來(lái)執(zhí)行我們寫(xiě)好的那些類(lèi)中的代碼,整體是這么個(gè)順序。
我們看看下圖,感受一下這個(gè)過(guò)程:
那么今天,我們就來(lái)仔細(xì)看看上圖中的“類(lèi)加載”這個(gè)過(guò)程,看看JVM的類(lèi)加載機(jī)制到底是怎么樣的?
搞清楚這個(gè)過(guò)程了,那么以后在面試時(shí),對(duì)面試官常問(wèn)的JVM類(lèi)加載機(jī)制,就能把一些核心概念說(shuō)清楚了。
2、JVM在什么情況下會(huì)加載一個(gè)類(lèi)?
其實(shí)類(lèi)加載過(guò)程非常的瑣碎復(fù)雜,但是對(duì)于我們平時(shí)從工作中實(shí)用的角度來(lái)說(shuō),主要是把握他的核心工作原理就可以。
一個(gè)類(lèi)從加載到使用,一般會(huì)經(jīng)歷下面的這個(gè)過(guò)程:
加載 -> 驗(yàn)證 -> 準(zhǔn)備 -> 解析 -> 初始化 -> 使用 -> 卸載
所以首先要搞明白的第一個(gè)問(wèn)題,就是JVM在執(zhí)行我們寫(xiě)好的代碼的過(guò)程中,一般在什么情況下會(huì)去加載一個(gè)類(lèi)呢?
也就是說(shuō),啥時(shí)候會(huì)從“.class”字節(jié)碼文件中加載這個(gè)類(lèi)到JVM內(nèi)存里來(lái)。
其實(shí)答案非常簡(jiǎn)單,就是在你的代碼中用到這個(gè)類(lèi)的時(shí)候
舉個(gè)簡(jiǎn)單的例子,比如下面你有一個(gè)類(lèi)(Kafka.class),里面有一個(gè)“main()”方法作為主入口。
那么一旦你的JVM進(jìn)程啟動(dòng)之后,它一定會(huì)先把你的這個(gè)類(lèi)(Kafka.cass)加載到內(nèi)存里,然后從“main()”方法的入口代碼開(kāi)始執(zhí)行。
我們還是堅(jiān)持一步一圖,大家先看看下圖,感受一下:
接著假設(shè)上面的代碼中,出現(xiàn)了如下的這么一行代碼:
這時(shí)可能大家就想了,你的代碼中明顯需要使用“ReplicaManager”這個(gè)類(lèi)去實(shí)例化一個(gè)對(duì)象,此時(shí)必須得把“ReplicaManager.class”字節(jié)碼文件中的這個(gè)類(lèi)加載到內(nèi)存里來(lái)??!是不是?
所以這個(gè)時(shí)候就會(huì)觸發(fā)JVM通過(guò)類(lèi)加載器,從“ReplicaManager.class”字節(jié)碼文件中加載對(duì)應(yīng)的類(lèi)到內(nèi)存里來(lái)使用,這樣代碼才能跑起來(lái)。
我們來(lái)看下面的圖:
上面就是給大家舉的一個(gè)例子,相信非常的通俗易懂。
簡(jiǎn)單概括一下:首先你的代碼中包含“main()”方法的主類(lèi)一定會(huì)在JVM進(jìn)程啟動(dòng)之后被加載到內(nèi)存,開(kāi)始執(zhí)行你的“main()”方法中的代碼
接著遇到你使用了別的類(lèi),比如“ReplicaManager”,此時(shí)就會(huì)從對(duì)應(yīng)的“.class”字節(jié)碼文件加載對(duì)應(yīng)的類(lèi)到內(nèi)存里來(lái)。
3、從實(shí)用角度出發(fā),來(lái)看看驗(yàn)證、準(zhǔn)備和初始化的過(guò)程
其實(shí)上面的類(lèi)加載時(shí)機(jī)的問(wèn)題,對(duì)于很多有經(jīng)驗(yàn)的同學(xué)來(lái)說(shuō)不是什么問(wèn)題。但是對(duì)于很多初學(xué)者來(lái)說(shuō),是一個(gè)非常重要的需要捋清的概念。
接下來(lái)就來(lái)簡(jiǎn)單帶著大家,從實(shí)用的角度出發(fā),過(guò)一下另外三個(gè)概念:
驗(yàn)證、準(zhǔn)備、初始化
其實(shí)對(duì)于這三個(gè)概念,沒(méi)太大的必要去深究里面的細(xì)節(jié),這里的細(xì)節(jié)很多很繁瑣,對(duì)于大部分同學(xué)而言,只要腦子里有下面的幾個(gè)概念就可以了:
(1)驗(yàn)證階段
簡(jiǎn)單來(lái)說(shuō),這一步就是根據(jù)Java虛擬機(jī)規(guī)范,來(lái)校驗(yàn)?zāi)慵虞d進(jìn)來(lái)的“.class”文件中的內(nèi)容,是否符合指定的規(guī)范。
這個(gè)相信很好理解,假如說(shuō),你的“.class”文件被人篡改了,里面的字節(jié)碼壓根兒不符合規(guī)范,那么JVM是沒(méi)法去執(zhí)行這個(gè)字節(jié)碼的!
所以把“.class”加載到內(nèi)存里之后,必須先驗(yàn)證一下,校驗(yàn)他必須完全符合JVM規(guī)范,后續(xù)才能交給JVM來(lái)運(yùn)行。
下面用一張圖,展示了這個(gè)過(guò)程:
(2)準(zhǔn)備階段
這個(gè)階段其實(shí)也很好理解,咱們都知道,我們寫(xiě)好的那些類(lèi),其實(shí)都有一些類(lèi)變量,比如下面的這個(gè)“ReplicaManager”類(lèi):
假設(shè)你有這么一個(gè)“ReplicaManager”類(lèi),他的“ReplicaManager.class”文件內(nèi)容剛剛被加載到內(nèi)存之后,會(huì)進(jìn)行驗(yàn)證,確認(rèn)這個(gè)字節(jié)碼文件的內(nèi)容是規(guī)范的。
接著,就會(huì)進(jìn)行準(zhǔn)備工作,這個(gè)準(zhǔn)備工作,其實(shí)就是給這個(gè)“ReplicaManager”類(lèi)分配一定的內(nèi)存空間。
然后給他里面的類(lèi)變量(也就是static修飾的變量)分配內(nèi)存空間,來(lái)一個(gè)默認(rèn)的初始值。
比如上面的示例里,就會(huì)給“flushInterval”這個(gè)類(lèi)變量分配內(nèi)容空間,給一個(gè)“0”這個(gè)初始值。
整個(gè)過(guò)程,如下圖所示:
(3)解析階段
這個(gè)階段干的事兒,實(shí)際上是把符號(hào)引用替換為直接引用的過(guò)程,其實(shí)這個(gè)部分的內(nèi)容很復(fù)雜,涉及到JVM的底層
但是注意,同學(xué)們,就我本意而言,希望第一周的文章,絕對(duì)是淺顯易懂的,循序漸進(jìn),要保證每個(gè)同學(xué)都能絕對(duì)看懂。
所以針對(duì)這個(gè)階段,現(xiàn)在不打算做過(guò)深的解讀,因?yàn)閺膶?shí)用角度而言,對(duì)很多同學(xué)在工作中實(shí)踐JVM技術(shù)其實(shí)也用不到,所以這里大家就暫時(shí)知道有這么一個(gè)階段就可以了。
同樣,我還是給大家畫(huà)圖展示一下:
(4)三個(gè)階段的小結(jié)
其實(shí)這三個(gè)階段里,最核心的大家務(wù)必關(guān)注的,就是“準(zhǔn)備階段”
因?yàn)檫@個(gè)階段是給加載進(jìn)來(lái)的類(lèi)分配好了內(nèi)存空間,類(lèi)變量也分配好了內(nèi)存空間,并且給了默認(rèn)的初始值,這個(gè)概念,大家心里一定要有。
4、核心階段:初始化
之前說(shuō)過(guò),在準(zhǔn)備階段時(shí),就會(huì)把我們的“ReplicaManager”類(lèi)給分配好內(nèi)存空間
另外他的一個(gè)類(lèi)變量“flushInterval”也會(huì)給一個(gè)默認(rèn)的初始值“0”,那么接下來(lái),在初始化階段,就會(huì)正式執(zhí)行我們的類(lèi)初始化的代碼了。
那么什么是類(lèi)初始化的代碼呢?我們來(lái)看看下面這段代碼:
大家可以看到,對(duì)于“flushInterval”這個(gè)類(lèi)變量,我們是打算通過(guò)Configuration.getInt("replica.flush.interval")這段代碼來(lái)獲取一個(gè)值,并且賦值給他的
但是在準(zhǔn)備階段會(huì)執(zhí)行這個(gè)賦值邏輯嗎?
NO!在準(zhǔn)備階段,僅僅是給“flushInterval”類(lèi)變量開(kāi)辟一個(gè)內(nèi)存空間,然后給個(gè)初始值“0”罷了。
那么這段賦值的代碼什么時(shí)候執(zhí)行呢?答案是在“初始化”階段來(lái)執(zhí)行。
在這個(gè)階段,就會(huì)執(zhí)行類(lèi)的初始化代碼,比如上面的 Configuration.getInt("replica.flush.interval") 代碼就會(huì)在這里執(zhí)行,完成一個(gè)配置項(xiàng)的讀取,然后賦值給這個(gè)類(lèi)變量“flushInterval”。
另外比如下圖的static靜態(tài)代碼塊,也會(huì)在這個(gè)階段來(lái)執(zhí)行。
類(lèi)似下面的代碼語(yǔ)義,可以理解為類(lèi)初始化的時(shí)候,調(diào)用“l(fā)oadReplicaFromDish()”方法從磁盤(pán)中加載數(shù)據(jù)副本,并且放在靜態(tài)變量“replicas”中:
那么搞明白了類(lèi)的初始化是什么,就得來(lái)看看類(lèi)的初始化的規(guī)則了。
什么時(shí)候會(huì)初始化一個(gè)類(lèi)?
一般來(lái)說(shuō)有以下一些時(shí)機(jī):比如“new ReplicaManager()”來(lái)實(shí)例化類(lèi)的對(duì)象了,此時(shí)就會(huì)觸發(fā)類(lèi)的加載到初始化的全過(guò)程,把這個(gè)類(lèi)準(zhǔn)備好,然后再實(shí)例化一個(gè)對(duì)象出來(lái);
或者是包含“main()”方法的主類(lèi),必須是立馬初始化的。
此外,這里還有一個(gè)非常重要的規(guī)則,就是如果初始化一個(gè)類(lèi)的時(shí)候,發(fā)現(xiàn)他的父類(lèi)還沒(méi)初始化,那么必須先初始化他的父類(lèi)
比如下面的代碼:
如果你要“new ReplicaManager()”初始化這個(gè)類(lèi)的實(shí)例,那么會(huì)加載這個(gè)類(lèi),然后初始化這個(gè)類(lèi)
但是初始化這個(gè)類(lèi)之前,發(fā)現(xiàn)AbstractDataManager作為父類(lèi)還沒(méi)加載和初始化,那么必須先加載這個(gè)父類(lèi),并且初始化這個(gè)父類(lèi)。
這個(gè)規(guī)則,大家必須得牢記,再來(lái)一張圖,借助圖片來(lái)進(jìn)行理解:
5、類(lèi)加載器和雙親委派機(jī)制
現(xiàn)在相信大家都搞明白了整個(gè)類(lèi)加載從觸發(fā)時(shí)機(jī)到初始化的過(guò)程了,接著給大家說(shuō)一下類(lèi)加載器的概念。因?yàn)閷?shí)現(xiàn)上述過(guò)程,那必須是依靠類(lèi)加載器來(lái)實(shí)現(xiàn)的。
那么Java里有哪些類(lèi)加載器呢?簡(jiǎn)單來(lái)說(shuō)有下面幾種:
(1)啟動(dòng)類(lèi)加載器
Bootstrap ClassLoader,他主要是負(fù)責(zé)加載我們?cè)跈C(jī)器上安裝的Java目錄下的核心類(lèi)的
相信大家都知道,如果你要在一個(gè)機(jī)器上運(yùn)行自己寫(xiě)好的Java系統(tǒng),無(wú)論是windows筆記本,還是linux服務(wù)器,是不是都得裝一下JDK?
那么在你的Java安裝目錄下,就有一個(gè)“l(fā)ib”目錄,大家可以自己去找找看,這里就有Java最核心的一些類(lèi)庫(kù),支撐你的Java系統(tǒng)的運(yùn)行。
所以一旦你的JVM啟動(dòng),那么首先就會(huì)依托啟動(dòng)類(lèi)加載器,去加載你的Java安裝目錄下的“l(fā)ib”目錄中的核心類(lèi)庫(kù)。
(2)擴(kuò)展類(lèi)加載器
Extension ClassLoader,這個(gè)類(lèi)加載器其實(shí)也是類(lèi)似的,就是你的Java安裝目錄下,有一個(gè)“l(fā)ib\ext”目錄
這里面有一些類(lèi),就是需要使用這個(gè)類(lèi)加載器來(lái)加載的,支撐你的系統(tǒng)的運(yùn)行。
那么你的JVM一旦啟動(dòng),是不是也得從Java安裝目錄下,加載這個(gè)“l(fā)ib\ext”目錄中的類(lèi)?
(3)應(yīng)用程序類(lèi)加載器
Application ClassLoader,這類(lèi)加載器就負(fù)責(zé)去加載“ClassPath”環(huán)境變量所指定的路徑中的類(lèi)
其實(shí)你大致就理解為去加載你寫(xiě)好的Java代碼吧,這個(gè)類(lèi)加載器就負(fù)責(zé)加載你寫(xiě)好的那些類(lèi)到內(nèi)存里。
(4)自定義類(lèi)加載器
除了上面那幾種之外,還可以自定義類(lèi)加載器,去根據(jù)你自己的需求加載你的類(lèi)。
(5)雙親委派機(jī)制
JVM的類(lèi)加載器是有親子層級(jí)結(jié)構(gòu)的,就是說(shuō)啟動(dòng)類(lèi)加載器是最上層的,擴(kuò)展類(lèi)加載器在第二層,第三層是應(yīng)用程序類(lèi)加載器,最后一層是自定義類(lèi)加載器。
大家看下圖:
然后,基于這個(gè)親子層級(jí)結(jié)構(gòu),就有一個(gè)雙親委派的機(jī)制
什么意思呢?
就是假設(shè)你的應(yīng)用程序類(lèi)加載器需要加載一個(gè)類(lèi),他首先會(huì)委派給自己的父類(lèi)加載器去加載,最終傳導(dǎo)到頂層的類(lèi)加載器去加載
但是如果父類(lèi)加載器在自己負(fù)責(zé)加載的范圍內(nèi),沒(méi)找到這個(gè)類(lèi),那么就會(huì)下推加載權(quán)利給自己的子類(lèi)加載器。
聽(tīng)完了上面一大堆繞口令,是不是很迷茫?別著急,咱們用一個(gè)例子來(lái)說(shuō)明一下。
比如你的JVM現(xiàn)在需要加載“ReplicaManager”類(lèi),此時(shí)應(yīng)用程序類(lèi)加載器會(huì)問(wèn)問(wèn)自己的爸爸,也就是擴(kuò)展類(lèi)加載器,你能加載到這個(gè)類(lèi)嗎?
然后擴(kuò)展類(lèi)加載器直接問(wèn)自己的爸爸,啟動(dòng)類(lèi)加載器,你能加載到這個(gè)類(lèi)嗎?
啟動(dòng)類(lèi)加載器心想,我在Java安裝目錄下,沒(méi)找到這個(gè)類(lèi)啊,自己找去!
然后,就下推加載權(quán)利給擴(kuò)展類(lèi)加載器這個(gè)兒子,結(jié)果擴(kuò)展類(lèi)加載器找了半天,也沒(méi)找到自己負(fù)責(zé)的目錄中有這個(gè)類(lèi)。
這時(shí)他很生氣,說(shuō):明明就是你應(yīng)用程序加載器自己負(fù)責(zé)的,你自己找去。
然后應(yīng)用程序類(lèi)加載器在自己負(fù)責(zé)的范圍內(nèi),比如就是你寫(xiě)好的那個(gè)系統(tǒng)打包成的jar包吧,一下子發(fā)現(xiàn),就在這里!然后就自己把這個(gè)類(lèi)加載到內(nèi)存里去了。
這就是所謂的雙親委派模型:先找父親去加載,不行的話再由兒子來(lái)加載。
這樣的話,可以避免多層級(jí)的加載器結(jié)構(gòu)重復(fù)加載某些類(lèi)。
最后,給大家來(lái)一張圖,感受一下類(lèi)加載器的雙親委派模型。