面試官:講講類的加載、鏈接和初始化?
作者個人研發(fā)的在高并發(fā)場景下,提供的簡單、穩(wěn)定、可擴展的延遲消息隊列框架,具有精準(zhǔn)的定時任務(wù)和延遲隊列處理功能。自開源半年多以來,已成功為十幾家中小型企業(yè)提供了精準(zhǔn)定時調(diào)度方案,經(jīng)受住了生產(chǎn)環(huán)境的考驗。為使更多童鞋受益,現(xiàn)給出開源框架地址:
https://github.com/sunshinelyz/mykit-delay
寫在前面
在前幾年面試Java高級程序員的時候,只要是會一點JVM的基礎(chǔ)知識,基本就都能夠面試通過了。最近幾年,對Java工程師的要求越來越嚴(yán)格,對于中級Java工程師來說,也需要掌握JVM相關(guān)的知識了。這不,一名讀者出去面試Java中級崗位,就被問及了JVM相關(guān)的類的加載、鏈接和初始化的問題。
概述
本文我們一起討論Java類的加載、鏈接和初始化。Java字節(jié)代碼的表現(xiàn)形式是字節(jié)數(shù)組(byte[]),而Java類在JVM中的表現(xiàn)形式是 java.lang.Class類 的對象。一個Java類從字節(jié)代碼到能夠在JVM中被使用,需要經(jīng)過加載、鏈接和初始化這三個步驟。這三個步驟中,對開發(fā)人員直接可見的是Java類的加 載,通過使用Java類加載器(class loader)可以在運行時刻動態(tài)的加載一個Java類;而鏈接和初始化則是在使用Java類之前會發(fā)生的動作。本文會詳細介紹Java類的加載、鏈接和 初始化的過程。
Java 類的加載
Java類的加載是由類加載器來完成的。
一般來說,類加載器分成兩類:啟動類加載器(bootstrap)和用戶自定義的類加載器(user-defined)。
兩者的區(qū)別在于啟動類加載器是由JVM的原生代碼實現(xiàn)的,而用戶自定義的類加載器都繼承自Java中的 java.lang.ClassLoader類。在用戶自定義類加載器的部分,一般JVM都會提供一些基本實現(xiàn)。應(yīng)用程序的開發(fā)人員也可以根據(jù)需要編寫自己的類加載器。JVM中最常使用的是系統(tǒng)類加載器(system),它用來啟動 Java應(yīng)用程序的加載。通過java.lang.ClassLoader的 getSystemClassLoader()方法可以獲取到該類加載器對象。
類加載器需要完成的最終功能是定義一個Java類,即把Java字節(jié)代碼轉(zhuǎn)換成JVM中的java.lang.Class類的對象。但是類加載的過程并不是這么簡單。
Java類加載器有兩個比較重要的特征:層次組織結(jié)構(gòu)和代理模式。
層次組織結(jié)構(gòu)指的是每個類加載器都有一個父類加載器,通過 getParent()方法可以獲取到。類加載器通過這種父親-后代的方式組織在一起,形成樹狀層次結(jié)構(gòu)。代理模式則指的是一個類加載器既可以自己完成Java類的定義工作,也可以代理給其它的類加載器來完成。由于代理模式的存在,啟動一個類的加載過程的類加載器和最終定義這個類的類加載器可能并不是一個。前者稱為初始類加載器, 而后者稱為定義類加載器。
兩者的關(guān)聯(lián)在于:一個Java類的定義類加載器是該類所導(dǎo)入的其它Java類的初始類加載器。比如類A通過import導(dǎo)入了類 B,那么由類A的定義類加載器負責(zé)啟動類B的加載過程。一般的類加載器在嘗試自己去加載某個Java類之前,會首先代理給其父類加載器。當(dāng)父類加載器找不到的時候,才會嘗試自己加載。這個邏輯是封裝在java.lang.ClassLoader類的 loadClass()方法中的。一般來說,父類優(yōu)先的策略就足夠好了。在某些情況下,可能需要采取相反的策略,即先嘗試自己加載,找不到的時候再代理給父類加載器。這種做法在Java的Web容器中比較常見,也是 Servlet規(guī)范推薦的做法。比如,Apache Tomcat為每個Web應(yīng)用都提供一個獨立的類加載器,使用的就是自己優(yōu)先加載的策略。IBM WebSphere Application Server則允許Web應(yīng)用選擇。
類加載器使用的策略
類加載器的一個重要用途是在JVM中為相同名稱的Java類創(chuàng)建隔離空間。在JVM中,判斷兩個類是否相同,不僅是根據(jù)該類的二進制名稱 ,還需要根據(jù)兩個類的定義類加載器。只有兩者完全一樣,才認為兩個類是相同的。因此,即便是同樣的Java字節(jié)代碼,被兩個不同的類加載器定義之后,所得到的Java類也是不同的。如果試圖在兩個類的對象之間進行賦值操作,會拋出 java.lang.ClassCastException。這個特性為同樣名稱的Java類在JVM中共存創(chuàng)造了條件。在實際的應(yīng)用中,可能會要求同一名稱的Java類的不同版本在JVM中可以同時存在。通過類加載器就可以滿足這種需求。這種技術(shù)在 OSGi中得到了廣泛的應(yīng)用
Java 類的鏈接
Java類的鏈接指的是將Java類的二進制代碼合并到JVM的運行狀態(tài)之中的過程。在鏈接之前,這個類必須被成功加載。類的鏈接包括驗證、準(zhǔn)備和解析等幾個步驟。驗證是用來確保Java類的二進制表示在結(jié)構(gòu)上是完全正確的。如果驗證過程出現(xiàn)錯誤的話,會拋出 java.lang.VerifyError錯誤。
準(zhǔn)備過程則是創(chuàng)建Java類中的靜態(tài)域,并將這些域的值設(shè)為默認值。準(zhǔn)備過程并不會執(zhí)行代碼。在一個Java類中會包含對其它類或接口的形式引用,包括它的父類、所實現(xiàn)的接口、方法的形式參數(shù)和返回值的Java類等。解析的過程就是確保這些被引用的類能被正確的找到。解析的過程可能會導(dǎo)致其它的 Java類被加載。不同的 JVM 實現(xiàn)可能選擇不同的解析策略。
一種做法是在鏈接的時候,就遞歸的把所有依賴的形式引用都進行解析。而另外的做法則可能是只在一個形式引用真正需要的時候才進行解析。也就是說如果一個 Java 類只是被引用了,但是并沒有被真正用到,那么這個類有可能就不會被解析??紤]下面的代碼:
- public class LinkTest {
- public static void main(String[] args) {
- ToBeLinked toBeLinked = null;
- System.out.println("Test link.");
- }
- }
類LinkTest 引用了類 ToBeLinked,但是并沒有真正使用它,只是聲明了一個變量,并沒有創(chuàng)建該類的實例或是訪問其中的靜態(tài)域。
在 Oracle 的 JDK 6 中,如果把編譯好的 ToBeLinked 的 Java 字節(jié)代碼刪除之后,再運行 LinkTest,程序不會拋出錯誤。這是因為 ToBeLinked 類沒有被真正用到,而 Oracle 的 JDK 6 所采用的鏈接策略使得ToBeLinked 類不會被加載,因此也不會發(fā)現(xiàn) ToBeLinked 的 Java 字節(jié)代碼實際上是不存在的。如果把代碼改成 ToBeLinked toBeLinked = new ToBeLinked();之后,再按照相同的方法運行,就會拋出異常了。因為這個時候 ToBeLinked 這個類被真正使用到了,會需要加載這個類。
Java 類的初始化
當(dāng)一個 Java 類第一次被真正使用到的時候,JVM 會進行該類的初始化操作。初始化過程的主要操作是執(zhí)行靜態(tài)代碼塊和初始化靜態(tài)域。在一個類被初始化之前,它的直接父類也需要被初始化。但是,一個接口的初始化,不會引起其父接口的初始化。在初始化的時候,會按照源代碼中從上到下的順序依次執(zhí)行靜態(tài)代碼塊和初始化靜態(tài)域??紤]下面的代碼:
- public class StaticTest {
- public static int X = 10;
- public static void main(String[] args) {
- System.out.println(Y); //輸出60
- }
- static {
- X = 30;
- }
- public static int Y = X * 2;
- }
在上面的代碼中,在初始化的時候,靜態(tài)域的初始化和靜態(tài)代碼塊的執(zhí)行會從上到下依次執(zhí)行。因此變量 X 的值首先初始化成 10,后來又被賦值成 30;而變量 Y 的值則被初始化成 60。
Java類和接口的初始化時機
Java 類和接口的初始化只有在特定的時機才會發(fā)生,這些時機包括:
創(chuàng)建一個 Java 類的實例。如
- MyClass obj = new MyClass()
調(diào)用一個 Java 類中的靜態(tài)方法。如
- MyClass.sayHello()
給 Java 類或接口中聲明的靜態(tài)域賦值。如
- MyClass.value = 10
訪問 Java 類或接口中聲明的靜態(tài)域,并且該域不是常值變量。如
- int value = MyClass.value
在頂層 Java 類中執(zhí)行 assert 語句。
- assert true;
通過 Java 反射 API 也可能造成類和接口的初始化。需要注意的是,當(dāng)訪問一個 Java類或接口中的靜態(tài)域的時候,只有真正聲明這個域的類或接口才會被初始化。如下面的代碼所示。
- package io.mykit.binghe.test;
- class B {
- static int value = 100;
- static {
- System.out.println("Class B is initialized."); // 輸出
- }
- }
- class A extends B {
- static {
- System.out.println("Class A is initialized."); // 不會輸出
- }
- }
- public class InitTest {
- public static void main(String[] args) {
- System.out.println(A.value); // 輸出100
- }
- }
在上述代碼中,類 InitTest 通過 A.value 引用了類 B 中聲明的靜態(tài)域 value。由于 value是在類 B 中聲明的,只有類 B 會被初始化,而類 A 則不會被初始化。
創(chuàng)建自己的類加載器
在 Java 應(yīng)用開發(fā)過程中,可能會需要創(chuàng)建應(yīng)用自己的類加載器。典型的場景包括實現(xiàn)特定的 Java 字節(jié)代碼查找方式、對字節(jié)代碼進行加密/解密以及實現(xiàn)同名 Java 類的隔離等 。創(chuàng)建 自己的 類加載 器并不 是 一件復(fù)雜 的事情 ,只需要繼承自java.lang.ClassLoader 類并覆寫對應(yīng)的方法即可。java.lang.ClassLoader 中提供的方法有不少,下面介紹幾個創(chuàng)建類加載器時需要考慮的:
- defineClass():這個方法用來完成從Java字節(jié)代碼的字節(jié)數(shù)組到j(luò)ava.lang.Class的轉(zhuǎn)換。這個方法是不能被覆寫的,一般是用原生代碼來實現(xiàn)的。
- findLoadedClass():這個方法用來根據(jù)名稱查找已經(jīng)加載過的Java類。一個類加載器不會重復(fù)加載同一名稱的類。
- findClass():這個方法用來根據(jù)名稱查找并加載Java類。
- loadClass():這個方法用來根據(jù)名稱加載Java類。
- resolveClass():這個方法用來鏈接一個Java類。
這里比較 容易混淆的是 findClass()方法和 loadClass()方法的作用。前面提到過,在Java 類的鏈接過程中,會需要對 Java 類進行解析,而解析可能會導(dǎo)致當(dāng)前 Java 類所引用的其它 Java 類被加載。在這個時候,JVM 就是通過調(diào)用當(dāng)前類的定義類加載器的 loadClass()方法來加載其它類的。findClass()方法則是應(yīng)用創(chuàng)建的類加載器的擴展點。應(yīng)用自己的類加載器應(yīng)該覆寫 findClass()方法來添加自定義的類加載邏輯。loadClass()方法的默認實現(xiàn)會負責(zé)調(diào)用 findClass()方法。前面提到,類加載器的代理模式默認使用的是父類優(yōu)先的策略。這個策略的實現(xiàn)是封裝在 loadClass()方法中的。如果希望修改此策略,就需要覆寫 loadClass()方法。
下面的代碼給出了自定義的類加載的常見實現(xiàn)模式
- public class MyClassLoader extends ClassLoader {
- protected Class<?> findClass(String name) throws ClassNotFoundException {
- byte[] b = null; //查找或生成Java類的字節(jié)代碼
- return defineClass(name, b, 0, b.length);
- }
- }
本文轉(zhuǎn)載自微信公眾號「冰河技術(shù)」,可以通過以下二維碼關(guān)注。轉(zhuǎn)載本文請聯(lián)系冰河技術(shù)公眾號。