Java并發(fā)編程:線程安全
1. 什么是線程安全?
《Java 并發(fā)編程實戰(zhàn)》的作者 Brian Goetz 對線程安全的理解是:當多個線程訪問一個對象時,如果不需要考慮這些線程在運行時環(huán)境中的調度和交替執(zhí)行,也不需要額外的同步,調用這個對象的行為都能獲得正確的結果,那么這個對象就是線程安全的。
通俗地說,無論有多少線程訪問業(yè)務中的一個對象或方法,在編寫這段業(yè)務邏輯時,無需做任何額外處理(即可以像單線程程序一樣編寫),程序也能正常運行(不會因多線程而失?。?,這樣的代碼就可以稱為線程安全的。
2. 什么是線程不安全?
當多個線程同時訪問一個對象時,如果某個線程正在更新對象的值,而另一個線程同時讀取該對象的值,就可能導致獲取到錯誤的值。這種情況下,我們需要采取額外措施(例如使用synchronized關鍵字同步這部分代碼的執(zhí)行)來確保結果的正確性。
3. 為什么不是所有程序都設計成線程安全的?
主要是出于程序性能、設計復雜度成本等方面的考量。
4. 線程安全問題的分類
4.1 運行結果錯誤
首先來看多線程同時操作一個變量如何導致運行結果錯誤。
假設用兩個線程對count變量進行計數(shù),每個線程各計 10000 次:
public class ResultError {
static int count;
public static void main(String[] args) throws InterruptedException {
Runnable runnable = () -> {
for (int i = 0; i < 10000; i++) {
count++;
}
};
Thread thread1 = new Thread(runnable);
Thread thread2 = new Thread(runnable);
thread1.start();
thread2.start();
thread1.join();
thread2.join();
System.out.println(count);
}
}
輸出:
圖片
理論上結果應為 20000,但實際輸出遠小于理論值,且每次結果不同。為什么會這樣?
這是因為多線程下,CPU 的調度是以時間片為單位分配的,每個線程獲得一定時間片后,若時間片耗盡會被掛起并讓出 CPU 資源給其他線程,這可能導致線程安全問題。例如,i++看似一行代碼,實際并非原子操作,其執(zhí)行步驟主要分為三步,且每一步操作之間可能被中斷:
- 讀取當前值;
- 遞增;
- 保存結果。
圖片
假設線程 1 先讀取count=1,隨后執(zhí)行count + 1操作,但此時結果尚未保存,線程 1 被切換。CPU 開始執(zhí)行線程 2,其操作與線程 1 相同。但此時線程 2 讀取的count值是多少?由于線程 1 的+1操作未保存結果,線程 2 讀取的仍然是count=1。
假設線程 2 執(zhí)行count + 1后保存結果為 2,隨后線程 1 恢復執(zhí)行,保存其計算結果為 2。雖然兩個線程各執(zhí)行了一次+1,但最終count結果為 2 而非預期的 3。這就是典型的線程安全問題,此時count變量被稱為共享變量或共享數(shù)據(jù)。
如何解決?
解決此類問題需要一種機制:當多個線程操作共享變量時,確保同一時刻僅有一個線程能操作該變量,其他線程必須等待當前線程處理完成。這種方法使用互斥鎖(Mutex Lock)實現(xiàn)互斥訪問——當共享數(shù)據(jù)被當前線程加鎖時,其他線程只能等待鎖釋放。
Java 中,用synchronized關鍵字修飾的方法或代碼塊可以保證同一時刻僅有一個線程執(zhí)行。代碼如下:
public class ResultErrorResolution {
staticint count;
public static void main(String[] args) throws InterruptedException {
Runnable runnable = () -> {
synchronized (ResultErrorResolution.class) {
for (int i = 0; i < 10000; i++) {
count++;
}
}
};
Thread thread1 = new Thread(runnable);
Thread thread2 = new Thread(runnable);
thread1.start();
thread2.start();
thread1.join();
thread2.join();
System.out.println(count);
}
}
輸出:
20000
輸出結果與預期一致??。
關于synchronized關鍵字,后續(xù)章節(jié)會詳細講解。目前只需知道它能保證同一時刻最多一個線程執(zhí)行該代碼段(需持有對應的鎖,本例中為ResultErrorResolution.class),從而實現(xiàn)并發(fā)安全。
4.2 線程活躍性問題
第二類線程安全問題統(tǒng)稱為活躍性問題?;钴S性問題指程序無法獲得運行的最終結果。相比前文的錯誤,活躍性問題的后果可能更嚴重,例如死鎖會導致程序完全卡死。
典型的活躍性問題包括死鎖(Deadlock)、活鎖(Livelock)和饑餓(Starvation)。由于內容較多,后續(xù)會單獨寫篇文章介紹。
4.3 對象初始化時的安全問題
最后是對象初始化過程中引發(fā)的線程安全問題。創(chuàng)建對象以供其他類或對象使用是常見操作,但若時機或錯誤可能導致線程安全問題。
看一個例子:
public class InitError {
private Map<Long, String> students;
public InitError() {
new Thread(() -> {
students = new HashMap<>();
students.put(1L, "Tom");
students.put(2L, "Bob");
students.put(3L, "Victor");
}).start();
}
public Map<Long, String> getStudents() {
return students;
}
public static void main(String[] args) throws InterruptedException {
InitError initError = new InitError();
System.out.println(initError.getStudents().get(1L));
}
}
此例中,成員變量students在構造函數(shù)的子線程中初始化。但主線程在初始化InitError后未等待子線程完成,直接嘗試獲取數(shù)據(jù),導致問題:
public static void main(String[] args) throws InterruptedException {
InitError initError = new InitError();
System.out.println(initError.getStudents().get(1L));
}
運行結果:
Exception in thread "main" java.lang.NullPointerException
at concurrency.chapter10.InitError.main(InitError.java:25)
原因:
students在構造函數(shù)的新線程中初始化,而主線程未等待該線程完成就直接調用getStudents(),此時students可能尚未初始化(返回null),導致空指針異常。
5. 哪些場景需特別注意線程安全問題?
5.1 訪問共享變量或資源
當訪問靜態(tài)變量、共享緩存等共享資源時,若多線程同時操作(如count++),需確保原子性。例如以下“檢查后執(zhí)行”操作可能被中斷:
if (count == 10) {
count = count * 10;
}
多個線程可能同時滿足count == 10,導致多次執(zhí)行count = count * 10,需通過加鎖保證原子性。
5.2 數(shù)據(jù)間存在綁定關系
當不同數(shù)據(jù)成組出現(xiàn)且需保持對應關系時(如 IP 和端口號),若修改未綁定為一個原子操作,可能導致信息不一致。例如僅修改 IP 而未同步修改端口號,接收方可能獲取錯誤的綁定結果。
5.3 依賴的類未聲明線程安全
若使用的類未聲明自身是線程安全的(如ArrayList),在多線程并發(fā)操作時可能引發(fā)線程安全問題。責任不在該類本身,因其未做任何線程安全保證(源碼注釋中通常會說明)。