一文搞定JMM核心原理
JMM引入
從堆棧說(shuō)起
JVM內(nèi)部使用的Java內(nèi)存模型在線程棧和堆之間劃分內(nèi)存。此圖從邏輯角度說(shuō)明了Java內(nèi)存模型:
圖片
# 堆棧里面放了什么?
線程堆棧還包含正在執(zhí)行的每個(gè)方法的所有局部變量(調(diào)用堆棧上的所有方法)。線程只能訪問(wèn)它自己的線程堆棧。由線程創(chuàng)建的局部變量對(duì)于創(chuàng)建它的線程以外的所有其他線程是不可見(jiàn)的。即使兩個(gè)線程正在執(zhí)行完全相同的代碼,兩個(gè)線程仍將在每個(gè)自己的線程堆棧中創(chuàng)建該代碼的局部變量。因此,每個(gè)線程都有自己的每個(gè)局部變量的版本。
基本類型的所有局部變量(boolean,byte,short,char,int,long,float,double)完全存儲(chǔ)在線程堆棧中,因此對(duì)其他線程不可見(jiàn)。一個(gè)線程可以將一個(gè)基本類型變量的副本傳遞給另一個(gè)線程,但它不能共享原始局部變量本身。
堆包含了在Java應(yīng)用程序中創(chuàng)建的所有對(duì)象,無(wú)論創(chuàng)建該對(duì)象的線程是什么。這包括基本類型的包裝類(例如Byte,Integer,Long等)。無(wú)論是創(chuàng)建對(duì)象并將其分配給局部變量,還是創(chuàng)建為另一個(gè)對(duì)象的成員變量,該對(duì)象仍然存儲(chǔ)在堆上。
圖片
局部變量可以是基本類型,在這種情況下,它完全保留在線程堆棧上。
局部變量也可以是對(duì)象的引用。在這種情況下,引用(局部變量)存儲(chǔ)在線程堆棧中,但是對(duì)象本身存儲(chǔ)在堆(Heap)上。
對(duì)象的成員變量與對(duì)象本身一起存儲(chǔ)在堆上。當(dāng)成員變量是基本類型時(shí),以及它是對(duì)象的引用時(shí)都是如此。
靜態(tài)類變量也與類定義一起存儲(chǔ)在堆上。
線程棧如何訪問(wèn)堆上對(duì)象?
所有具有對(duì)象引用的線程都可以訪問(wèn)堆上的對(duì)象。當(dāng)一個(gè)線程有權(quán)訪問(wèn)一個(gè)對(duì)象時(shí),它也可以訪問(wèn)該對(duì)象的成員變量。如果兩個(gè)線程同時(shí)在同一個(gè)對(duì)象上調(diào)用一個(gè)方法,它們都可以訪問(wèn)該對(duì)象的成員變量,但每個(gè)線程都有自己的局部變量副本。
圖片
兩個(gè)線程有一組局部變量。其中一個(gè)局部變量(局部變量2)指向堆上的共享對(duì)象(對(duì)象3)。兩個(gè)線程各自對(duì)同一對(duì)象具有不同的引用。它們的引用是局部變量,因此存儲(chǔ)在每個(gè)線程的線程堆棧中(在每個(gè)線程堆棧上)。但是,這兩個(gè)不同的引用指向堆上的同一個(gè)對(duì)象。
注意共享對(duì)象(對(duì)象3)如何將對(duì)象2和對(duì)象4作為成員變量引用(由對(duì)象3到對(duì)象2和對(duì)象4的箭頭所示)。通過(guò)對(duì)象3中的這些成員變量引用,兩個(gè)線程可以訪問(wèn)對(duì)象2和對(duì)象4.
該圖還顯示了一個(gè)局部變量,該變量指向堆上的兩個(gè)不同對(duì)象。在這種情況下,引用指向兩個(gè)不同的對(duì)象(對(duì)象1和對(duì)象5),而不是同一個(gè)對(duì)象。理論上,如果兩個(gè)線程都引用了兩個(gè)對(duì)象,則兩個(gè)線程都可以訪問(wèn)對(duì)象1和對(duì)象5。但是在上圖中,每個(gè)線程只引用了兩個(gè)對(duì)象中的一個(gè)。
線程棧訪問(wèn)堆示例
那么,什么樣的Java代碼可以導(dǎo)致上面的內(nèi)存圖? 好吧,代碼就像下面的代碼一樣簡(jiǎn)單:
public class MyRunnable implements Runnable() {
public void run() {
methodOne();
}
public void methodOne() {
int localVariable1 = 45;
MySharedObject localVariable2 =
MySharedObject.sharedInstance;
//... do more with local variables.
methodTwo();
}
public void methodTwo() {
Integer localVariable1 = new Integer(99);
//... do more with local variable.
}
}
public class MySharedObject {
//static variable pointing to instance of MySharedObject
public static final MySharedObject sharedInstance =
new MySharedObject();
//member variables pointing to two objects on the heap
public Integer object2 = new Integer(22);
public Integer object4 = new Integer(44);
public long member1 = 12345;
public long member1 = 67890;
}
如果兩個(gè)線程正在執(zhí)行run()方法,則前面顯示的圖表將是結(jié)果。run()方法調(diào)用methodOne(),methodOne()調(diào)用methodTwo()。
methodOne()聲明一個(gè)局部基本類型變量(類型為int的localVariable1)和一個(gè)局部變量,它是一個(gè)對(duì)象引用(localVariable2)。
執(zhí)行methodOne()的每個(gè)線程將在各自的線程堆棧上創(chuàng)建自己的localVariable1和localVariable2副本。localVariable1變量將完全相互分離,只存在于每個(gè)線程的線程堆棧中。一個(gè)線程無(wú)法看到另一個(gè)線程對(duì)其localVariable1副本所做的更改。
執(zhí)行methodOne()的每個(gè)線程也將創(chuàng)建自己的localVariable2副本。但是,localVariable2的兩個(gè)不同副本最終都指向堆上的同一個(gè)對(duì)象。代碼將localVariable2設(shè)置為指向靜態(tài)變量引用的對(duì)象。靜態(tài)變量只有一個(gè)副本,此副本存儲(chǔ)在堆上。因此,localVariable2的兩個(gè)副本最終都指向靜態(tài)變量指向的MySharedObject的同一個(gè)實(shí)例。MySharedObject實(shí)例也存儲(chǔ)在堆上。它對(duì)應(yīng)于上圖中的對(duì)象3。
注意MySharedObject類還包含兩個(gè)成員變量。成員變量本身與對(duì)象一起存儲(chǔ)在堆上。兩個(gè)成員變量指向另外兩個(gè)Integer對(duì)象。這些Integer對(duì)象對(duì)應(yīng)于上圖中的Object 2和Object 4。
另請(qǐng)注意methodTwo()如何創(chuàng)建名為localVariable1的局部變量。此局部變量是對(duì)Integer對(duì)象的對(duì)象引用。該方法將localVariable1引用設(shè)置為指向新的Integer實(shí)例。localVariable1引用將存儲(chǔ)在執(zhí)行methodTwo()的每個(gè)線程的一個(gè)副本中。實(shí)例化的兩個(gè)Integer對(duì)象將存儲(chǔ)在堆上,但由于該方法每次執(zhí)行該方法時(shí)都會(huì)創(chuàng)建一個(gè)新的Integer對(duì)象,因此執(zhí)行此方法的兩個(gè)線程將創(chuàng)建單獨(dú)的Integer實(shí)例。在methodTwo()中創(chuàng)建的Integer對(duì)象對(duì)應(yīng)于上圖中的Object 1和Object 5。
另請(qǐng)注意類型為long的MySharedObject類中的兩個(gè)成員變量,它們是基本類型。由于這些變量是成員變量,因此它們?nèi)耘c對(duì)象一起存儲(chǔ)在堆上。只有局部變量存儲(chǔ)在線程堆棧中。
JMM與硬件內(nèi)存結(jié)構(gòu)關(guān)系
硬件內(nèi)存結(jié)構(gòu)簡(jiǎn)介
現(xiàn)代硬件內(nèi)存架構(gòu)與內(nèi)部Java內(nèi)存模型略有不同。了解硬件內(nèi)存架構(gòu)也很重要,以了解Java內(nèi)存模型如何與其一起工作。本節(jié)介紹了常見(jiàn)的硬件內(nèi)存架構(gòu),后面的部分將介紹Java內(nèi)存模型如何與其配合使用。
這是現(xiàn)代計(jì)算機(jī)硬件架構(gòu)的簡(jiǎn)化圖:
圖片
現(xiàn)代計(jì)算機(jī)通常有2個(gè)或更多CPU。其中一些CPU也可能有多個(gè)內(nèi)核。關(guān)鍵是,在具有2個(gè)或更多CPU的現(xiàn)代計(jì)算機(jī)上,可以同時(shí)運(yùn)行多個(gè)線程。每個(gè)CPU都能夠在任何給定時(shí)間運(yùn)行一個(gè)線程。這意味著如果您的Java應(yīng)用程序是多線程的,線程真的在可能同時(shí)運(yùn)行.
每個(gè)CPU基本上都包含一組在CPU內(nèi)存中的寄存器。CPU可以在這些寄存器上執(zhí)行的操作比在主存儲(chǔ)器中對(duì)變量執(zhí)行的操作快得多。這是因?yàn)镃PU可以比訪問(wèn)主存儲(chǔ)器更快地訪問(wèn)這些寄存器。
每個(gè)CPU還可以具有CPU高速緩存存儲(chǔ)器層。事實(shí)上,大多數(shù)現(xiàn)代CPU都有一些大小的緩存存儲(chǔ)層。CPU可以比主存儲(chǔ)器更快地訪問(wèn)其高速緩存存儲(chǔ)器,但通常不會(huì)像訪問(wèn)其內(nèi)部寄存器那樣快。因此,CPU高速緩存存儲(chǔ)器介于內(nèi)部寄存器和主存儲(chǔ)器的速度之間。某些CPU可能有多個(gè)緩存層(級(jí)別1和級(jí)別2),但要了解Java內(nèi)存模型如何與內(nèi)存交互,這一點(diǎn)并不重要。重要的是要知道CPU可以有某種緩存存儲(chǔ)層。
計(jì)算機(jī)還包含主存儲(chǔ)區(qū)(RAM)。所有CPU都可以訪問(wèn)主內(nèi)存。主存儲(chǔ)區(qū)通常比CPU的高速緩存存儲(chǔ)器大得多。同時(shí)訪問(wèn)速度也就較慢.
通常,當(dāng)CPU需要訪問(wèn)主存儲(chǔ)器時(shí),它會(huì)將部分主存儲(chǔ)器讀入其CPU緩存。它甚至可以將部分緩存讀入其內(nèi)部寄存器,然后對(duì)其執(zhí)行操作。當(dāng)CPU需要將結(jié)果寫(xiě)回主存儲(chǔ)器時(shí),它會(huì)將值從其內(nèi)部寄存器刷新到高速緩沖存儲(chǔ)器,并在某些時(shí)候?qū)⒅邓⑿禄刂鞔鎯?chǔ)器。
JMM與硬件內(nèi)存連接 - 引入
如前所述,Java內(nèi)存模型和硬件內(nèi)存架構(gòu)是不同的。硬件內(nèi)存架構(gòu)不區(qū)分線程堆棧和堆。在硬件上,線程堆棧和堆都位于主存儲(chǔ)器中。線程堆棧和堆的一部分有時(shí)可能存在于CPU高速緩存和內(nèi)部CPU寄存器中。這在圖中說(shuō)明:
圖片
當(dāng)對(duì)象和變量可以存儲(chǔ)在計(jì)算機(jī)的各種不同存儲(chǔ)區(qū)域中時(shí),可能會(huì)出現(xiàn)某些問(wèn)題。兩個(gè)主要問(wèn)題是:
- Visibility of thread updates (writes) to shared variables.
- Race conditions when reading, checking and writing shared variables. 以下各節(jié)將解釋這兩個(gè)問(wèn)題。
JMM與硬件內(nèi)存連接 - 對(duì)象共享后的可見(jiàn)性
如果兩個(gè)或多個(gè)線程共享一個(gè)對(duì)象,而沒(méi)有正確使用volatile聲明或同步,則一個(gè)線程對(duì)共享對(duì)象的更新可能對(duì)其他線程不可見(jiàn)。
想象一下,共享對(duì)象最初存儲(chǔ)在主存儲(chǔ)器中。然后,在CPU上運(yùn)行的線程將共享對(duì)象讀入其CPU緩存中。它在那里對(duì)共享對(duì)象進(jìn)行了更改。只要CPU緩存尚未刷新回主內(nèi)存,共享對(duì)象的更改版本對(duì)于在其他CPU上運(yùn)行的線程是不可見(jiàn)的。這樣,每個(gè)線程最終都可能擁有自己的共享對(duì)象副本,每個(gè)副本都位于不同的CPU緩存中。
下圖描繪了該情況。在左CPU上運(yùn)行的一個(gè)線程將共享對(duì)象復(fù)制到其CPU緩存中,并將其count變量更改為2.對(duì)于在右邊的CPU上運(yùn)行的其他線程,此更改不可見(jiàn),因?yàn)橛?jì)數(shù)更新尚未刷新回主內(nèi)存中.
圖片
要解決此問(wèn)題,您可以使用Java的volatile關(guān)鍵字。volatile關(guān)鍵字可以確保直接從主內(nèi)存讀取給定變量,并在更新時(shí)始終寫(xiě)回主內(nèi)存。
JMM與硬件內(nèi)存連接 - 競(jìng)態(tài)條件
如果兩個(gè)或多個(gè)線程共享一個(gè)對(duì)象,并且多個(gè)線程更新該共享對(duì)象中的變量,則可能會(huì)出現(xiàn)競(jìng)態(tài)。
想象一下,如果線程A將共享對(duì)象的變量計(jì)數(shù)讀入其CPU緩存中。想象一下,線程B也做同樣的事情,但是進(jìn)入不同的CPU緩存?,F(xiàn)在,線程A將一個(gè)添加到count,而線程B執(zhí)行相同的操作?,F(xiàn)在var1已經(jīng)增加了兩次,每個(gè)CPU緩存一次。
如果這些增量是按先后順序執(zhí)行的,則變量計(jì)數(shù)將增加兩次并將原始值+ 2寫(xiě)回主存儲(chǔ)器。
但是,兩個(gè)增量同時(shí)執(zhí)行而沒(méi)有適當(dāng)?shù)耐健o(wú)論線程A和B中哪一個(gè)將其更新后的計(jì)數(shù)版本寫(xiě)回主存儲(chǔ)器,更新的值將僅比原始值高1,盡管有兩個(gè)增量。
該圖說(shuō)明了如上所述的競(jìng)爭(zhēng)條件問(wèn)題的發(fā)生:
圖片
要解決此問(wèn)題,您可以使用Java synchronized塊。同步塊保證在任何給定時(shí)間只有一個(gè)線程可以進(jìn)入代碼的給定關(guān)鍵部分。同步塊還保證在同步塊內(nèi)訪問(wèn)的所有變量都將從主存儲(chǔ)器中讀入,當(dāng)線程退出同步塊時(shí),所有更新的變量將再次刷新回主存儲(chǔ)器,無(wú)論變量是不是聲明為volatile