面試官:說說Volatile底層實(shí)現(xiàn)原理?
在 Java 并發(fā)編程中,有 3 個(gè)最常用的關(guān)鍵字:synchronized、ReentrantLock 和 volatile。
雖然 volatile 并不像其他兩個(gè)關(guān)鍵字一樣,能保證線程安全,但 volatile 也是并發(fā)編程中最常見的關(guān)鍵字之一。例如,單例模式、CopyOnWriteArrayList 和 ConcurrentHashMap 中都離不開 volatile。
那么,問題來了,我們知道 synchronized 底層是通過監(jiān)視器 Monitor 實(shí)現(xiàn)的,ReentrantLock 底層是通過 AQS 的 CAS 實(shí)現(xiàn)的,那 volatile 的底層是如何實(shí)現(xiàn)的?
1.volatile 作用
在了解 volatile 的底層實(shí)現(xiàn)之前,我們需要先了解 volatile 的作用,因?yàn)?volatile 的底層實(shí)現(xiàn)和它的作用息息相關(guān)。
volatile 作用有兩個(gè):保證內(nèi)存可見性和有序性(禁止指令重排序)。
(1)內(nèi)存可見性
說到內(nèi)存可見性問題就不得不提 Java 內(nèi)存模型,Java 內(nèi)存模型(Java Memory Model)簡稱為 JMM,主要是用來屏蔽不同硬件和操作系統(tǒng)的內(nèi)存訪問差異的,因?yàn)樵诓煌挠布筒煌牟僮飨到y(tǒng)下,內(nèi)存的訪問是有一定的差異得,這種差異會(huì)導(dǎo)致相同的代碼在不同的硬件和不同的操作系統(tǒng)下有著不一樣的行為,而 Java 內(nèi)存模型就是解決這個(gè)差異,統(tǒng)一相同代碼在不同硬件和不同操作系統(tǒng)下的差異的。
Java 內(nèi)存模型規(guī)定:所有的變量(實(shí)例變量和靜態(tài)變量)都必須存儲(chǔ)在主內(nèi)存中,每個(gè)線程也會(huì)有自己的工作內(nèi)存,線程的工作內(nèi)存保存了該線程用到的變量和主內(nèi)存的副本拷貝,線程對(duì)變量的操作都在工作內(nèi)存中進(jìn)行。線程不能直接讀寫主內(nèi)存中的變量,如下圖所示:
然而,Java 內(nèi)存模型會(huì)帶來一個(gè)新的問題,那就是內(nèi)存可見性問題,也就是當(dāng)某個(gè)線程修改了主內(nèi)存中共享變量的值之后,其他線程不能感知到此值被修改了,它會(huì)一直使用自己工作內(nèi)存中的“舊值”,這樣程序的執(zhí)行結(jié)果就不符合我們的預(yù)期了,這就是內(nèi)存可見性問題,我們用以下代碼來演示一下這個(gè)問題:
private static boolean flag = false;
public static void main(String[] args) {
Thread t1 = new Thread(new Runnable() {
@Override
public void run() {
while (!flag) {
}
System.out.println("終止執(zhí)行");
}
});
t1.start();
Thread t2 = new Thread(new Runnable() {
@Override
public void run() {
try {
Thread.sleep(1000);
} catch (InterruptedException e) {
e.printStackTrace();
}
System.out.println("設(shè)置 flag=true");
flag = true;
}
});
t2.start();
}
以上代碼我們預(yù)期的結(jié)果是,在線程 1 執(zhí)行了 1s 之后,線程 2 將 flag 變量修改為 true,之后線程 1 終止執(zhí)行,然而,因?yàn)榫€程 1 感知不到 flag 變量發(fā)生了修改,也就是內(nèi)存可見性問題,所以會(huì)導(dǎo)致線程 1 會(huì)永遠(yuǎn)的執(zhí)行下去,最終我們看到的結(jié)果是這樣的:
如何解決以上問題呢?只需要給變量 flag 加上 volatile 修飾即可,具體的實(shí)現(xiàn)代碼如下:
private volatile static boolean flag = false;
public static void main(String[] args) {
Thread t1 = new Thread(new Runnable() {
@Override
public void run() {
while (!flag) {
}
System.out.println("終止執(zhí)行");
}
});
t1.start();
Thread t2 = new Thread(new Runnable() {
@Override
public void run() {
try {
Thread.sleep(1000);
} catch (InterruptedException e) {
e.printStackTrace();
}
System.out.println("設(shè)置 flag=true");
flag = true;
}
});
t2.start();
}
以上程序的執(zhí)行結(jié)果如下圖所示:
(2)有序性
有序性也叫做禁止指令重排序。
指令重排序是指編譯器或 CPU 為了優(yōu)化程序的執(zhí)行性能,而對(duì)指令進(jìn)行重新排序的一種手段。
指令重排序的實(shí)現(xiàn)初衷是好的,但是在多線程執(zhí)行中,如果執(zhí)行了指令重排序可能會(huì)導(dǎo)致程序執(zhí)行出錯(cuò)。指令重排序最典型的一個(gè)問題就發(fā)生在單例模式中,比如以下問題代碼:
public class Singleton {
private Singleton() {}
private static Singleton instance = null;
public static Singleton getInstance() {
if (instance == null) { // ①
synchronized (Singleton.class) {
if (instance == null) {
instance = new Singleton(); // ②
}
}
}
return instance;
}
}
以上問題發(fā)生在代碼 ② 這一行“instance = new Singleton();”,這行代碼看似只是一個(gè)創(chuàng)建對(duì)象的過程,然而它的實(shí)際執(zhí)行卻分為以下 3 步:
- 創(chuàng)建內(nèi)存空間。
- 在內(nèi)存空間中初始化對(duì)象 Singleton。
- 將內(nèi)存地址賦值給 instance 對(duì)象(執(zhí)行了此步驟,instance 就不等于 null 了)。
如果此變量不加 volatile,那么線程 1 在執(zhí)行到上述代碼的第 ② 處時(shí)就可能會(huì)執(zhí)行指令重排序,將原本是 1、2、3 的執(zhí)行順序,重排為 1、3、2。但是特殊情況下,線程 1 在執(zhí)行完第 3 步之后,如果來了線程 2 執(zhí)行到上述代碼的第 ① 處,判斷 instance 對(duì)象已經(jīng)不為 null,但此時(shí)線程 1 還未將對(duì)象實(shí)例化完,那么線程 2 將會(huì)得到一個(gè)被實(shí)例化“一半”的對(duì)象,從而導(dǎo)致程序執(zhí)行出錯(cuò),這就是為什么要給私有變量添加 volatile 的原因了。
要使以上單例模式變?yōu)榫€程安全的程序,需要給 instance 變量添加 volatile 修飾,它的最終實(shí)現(xiàn)代碼如下:
public class Singleton {
private Singleton() {}
// 使用 volatile 禁止指令重排序
private static volatile Singleton instance = null; // 【主要是此行代碼發(fā)生了變化】
public static Singleton getInstance() {
if (instance == null) { // ①
synchronized (Singleton.class) {
if (instance == null) {
instance = new Singleton(); // ②
}
}
}
return instance;
}
}
2.volatile 實(shí)現(xiàn)原理
volatile 實(shí)現(xiàn)原理和它的作用有關(guān),我們首先先來看它的內(nèi)存可見性。
(1)內(nèi)存可見性實(shí)現(xiàn)原理
volatile 內(nèi)存可見性主要通過 lock 前綴指令實(shí)現(xiàn)的,它會(huì)鎖定當(dāng)前內(nèi)存區(qū)域的緩存(緩存行),并且立即將當(dāng)前緩存行數(shù)據(jù)寫入主內(nèi)存(耗時(shí)非常短),回寫主內(nèi)存的時(shí)候會(huì)通過 MESI 協(xié)議使其他線程緩存了該變量的地址失效,從而導(dǎo)致其他線程需要重新去主內(nèi)存中重新讀取數(shù)據(jù)到其工作線程中。
什么 MESI 協(xié)議?
MESI 協(xié)議,全稱為 Modified, Exclusive, Shared, Invalid,是一種高速緩存一致性協(xié)議。它是為了解決多處理器(CPU)在并發(fā)環(huán)境下,多個(gè) CPU 緩存不一致問題而提出的。MESI 協(xié)議定義了高速緩存中數(shù)據(jù)的四種狀態(tài):
- Modified(M):表示緩存行已經(jīng)被修改,但還沒有被寫回主存儲(chǔ)器。在這種狀態(tài)下,只有一個(gè) CPU 能獨(dú)占這個(gè)修改狀態(tài)。
- Exclusive(E):表示緩存行與主存儲(chǔ)器相同,并且是主存儲(chǔ)器的唯一拷貝。這種狀態(tài)下,只有一個(gè) CPU 能獨(dú)占這個(gè)狀態(tài)。
- Shared(S):表示此高速緩存行可能存儲(chǔ)在計(jì)算機(jī)的其他高速緩存中,并且與主存儲(chǔ)器匹配。在這種狀態(tài)下,各個(gè) CPU 可以并發(fā)的對(duì)這個(gè)數(shù)據(jù)進(jìn)行讀取,但都不能進(jìn)行寫操作。
- Invalid(I):表示此緩存行無效或已過期,不能使用。
MESI 協(xié)議的主要用途是確保在多個(gè) CPU 共享內(nèi)存時(shí),各個(gè) CPU 的緩存數(shù)據(jù)能夠保持一致性。當(dāng)某個(gè) CPU 對(duì)共享數(shù)據(jù)進(jìn)行修改時(shí),它會(huì)將這個(gè)數(shù)據(jù)的狀態(tài)從 S(共享)或 E(獨(dú)占)狀態(tài)轉(zhuǎn)變?yōu)?M(修改)狀態(tài),并等待適當(dāng)?shù)臅r(shí)機(jī)將這個(gè)修改寫回主存儲(chǔ)器。同時(shí),它會(huì)向其他 CPU 廣播一個(gè)“無效消息”,使得其他 CPU 將自己緩存中對(duì)應(yīng)的數(shù)據(jù)狀態(tài)轉(zhuǎn)變?yōu)镮(無效)狀態(tài),從而在下次訪問這個(gè)數(shù)據(jù)時(shí)能夠從主存儲(chǔ)器或其他 CPU 的緩存中重新獲取正確的數(shù)據(jù)。
這種協(xié)議可以確保在多處理器環(huán)境中,各個(gè) CPU 的緩存數(shù)據(jù)能夠正確、一致地反映主存儲(chǔ)器中的數(shù)據(jù)狀態(tài),從而避免由于緩存不一致導(dǎo)致的數(shù)據(jù)錯(cuò)誤或程序異常。
(2)有序性實(shí)現(xiàn)原理
volatile 的有序性是通過插入內(nèi)存屏障(Memory Barrier),在內(nèi)存屏障前后禁止重排序優(yōu)化,以此實(shí)現(xiàn)有序性的。
什么是內(nèi)存屏障?
內(nèi)存屏障(Memory Barrier 或 Memory Fence)是一種硬件級(jí)別的同步操作,它強(qiáng)制處理器按照特定順序執(zhí)行內(nèi)存訪問操作,確保內(nèi)存操作的順序性,阻止編譯器和 CPU 對(duì)內(nèi)存操作進(jìn)行不必要的重排序。內(nèi)存屏障可以確保跨越屏障的讀寫操作不會(huì)交叉進(jìn)行,以此維持程序的內(nèi)存一致性模型。
在 Java 內(nèi)存模型(JMM)中,volatile 關(guān)鍵字用于修飾變量時(shí),能夠保證該變量的可見性和有序性。關(guān)于有序性,volatile 通過內(nèi)存屏障的插入來實(shí)現(xiàn):
- 寫內(nèi)存屏障(Store Barrier / Write Barrier):當(dāng)線程寫入 volatile 變量時(shí),JMM 會(huì)在寫操作前插入 StoreStore 屏障,確保在這次寫操作之前的所有普通寫操作都已完成。接著在寫操作后插入 StoreLoad 屏障,強(qiáng)制所有后來的讀寫操作都在此次寫操作完成之后執(zhí)行,這就確保了其他線程能立即看到 volatile 變量的最新值。
- 讀內(nèi)存屏障(Load Barrier / Read Barrier):當(dāng)線程讀取 volatile 變量時(shí),JMM 會(huì)在讀操作前插入 LoadLoad 屏障,確保在此次讀操作之前的所有讀操作都已完成。而在讀操作后插入 LoadStore 屏障,防止在此次讀操作之后的寫操作被重排序到讀操作之前,這樣就確保了對(duì) volatile 變量的讀取總是能看到之前對(duì)同一變量或其他相關(guān)變量的寫入結(jié)果。
通過這種方式,volatile 關(guān)鍵字有效地實(shí)現(xiàn)了內(nèi)存操作的順序性,從而保證了多線程環(huán)境下對(duì) volatile 變量的操作遵循 happens-before 原則,確保了并發(fā)編程的正確性。
(3)簡單回答
因?yàn)閮?nèi)存屏障的作用既能保證內(nèi)存可見性,同時(shí)又能禁止指令重排序。因此你也可以籠統(tǒng)的回答 volatile 是通過內(nèi)存屏障實(shí)現(xiàn)的。但是,回答的越細(xì),面試的成績?cè)礁?,面試的通過率也就越高。