并發(fā)編程的安全性、活躍性以及性能問題
并發(fā)編程中我們需要注意的問題有很多,主要有三個方面,分別是:安全性問題、活躍性問題和性能問題。下面我就來一一介紹這些問題。
安全性問題
相信你一定聽說過類似這樣的描述:這個方法不是線程安全的,這個類不是線程安全的,等等。
那什么是線程安全呢?其實本質(zhì)上就是正確性,而正確性的含義就是程序按照我們期望的執(zhí)行。
那如何才能寫出線程安全的程序呢?之前已經(jīng)介紹了并發(fā) Bug 的三個主要源頭:原子性問題、可見性問題和有序性問題。也就是說,理論上線程安全的程序,就要避免出現(xiàn)原子性問題、可見性問題和有序性問題。
那是不是所有的代碼都需要認真分析一遍是否存在這三個問題呢?當然不是,其實只有一種情況需要:存在共享數(shù)據(jù)并且該數(shù)據(jù)會發(fā)生變化,通俗地講就是有多個線程會同時讀寫同一數(shù)據(jù)。那如果能夠做到不共享數(shù)據(jù)或者數(shù)據(jù)狀態(tài)不發(fā)生變化,不就能夠保證線程的安全性了嘛。有不少技術(shù)方案都是基于這個理論的,例如線程本地存儲(Thread Local Storage,TLS)、不變模式等等,后面我會詳細介紹相關(guān)的技術(shù)方案是如何在 Java 語言中實現(xiàn)的。
但是,現(xiàn)實生活中,必須共享會發(fā)生變化的數(shù)據(jù),這樣的應(yīng)用場景還是很多的。當多個線程同時訪問同一數(shù)據(jù),并且至少有一個線程會寫這個數(shù)據(jù)的時候,如果我們不采取防護措施,那么就會導(dǎo)致并發(fā) Bug,對此還有一個專業(yè)的術(shù)語,叫做數(shù)據(jù)競爭(Data Race)。比如,前面下面這個個 add10K() 的方法,當多個線程調(diào)用時候就會發(fā)生數(shù)據(jù)競爭,如下所示。
public class Test {
private long count = 0;
void add10K() {
int idx = 0;
while(idx++ < 10000) {
count += 1;
}
}
}
那是不是在訪問數(shù)據(jù)的地方,我們加個鎖保護一下就能解決所有的并發(fā)問題了呢?顯然沒有這么簡單。例如,對于上面示例,我們稍作修改,增加兩個被 synchronized 修飾的 get() 和 set() 方法, add10K() 方法里面通過 get() 和 set() 方法來訪問 value 變量,修改后的代碼如下所示。對于修改后的代碼,所有訪問共享變量 value 的地方,我們都增加了互斥鎖,此時是不存在數(shù)據(jù)競爭的。但很顯然修改后的 add10K() 方法并不是線程安全的。
public class Test {
private long count = 0;
synchronized long get(){
return count;
}
synchronized void set(long v){
count = v;
}
void add10K() {
int idx = 0;
while(idx++ < 10000) {
set(get()+1)
}
}
}
假設(shè) count=0,當兩個線程同時執(zhí)行 get() 方法時,get() 方法會返回相同的值 0,兩個線程執(zhí)行 get()+1 操作,結(jié)果都是 1,之后兩個線程再將結(jié)果 1 寫入了內(nèi)存。你本來期望的是 2,而結(jié)果卻是 1。
這種問題,有個官方的稱呼,叫競態(tài)條件(Race Condition)。所謂競態(tài)條件,指的是程序的執(zhí)行結(jié)果依賴線程執(zhí)行的順序。例如上面的例子,如果兩個線程完全同時執(zhí)行,那么結(jié)果是 1;如果兩個線程是前后執(zhí)行,那么結(jié)果就是 2。在并發(fā)環(huán)境里,線程的執(zhí)行順序是不確定的,如果程序存在競態(tài)條件問題,那就意味著程序執(zhí)行的結(jié)果是不確定的,而執(zhí)行結(jié)果不確定這可是個大 Bug。
在并發(fā)場景中,程序的執(zhí)行依賴于某個狀態(tài)變量,也就是類似于下面這樣:
if (狀態(tài)變量 滿足 執(zhí)行條件) {
執(zhí)行操作
}
當某個線程發(fā)現(xiàn)狀態(tài)變量滿足執(zhí)行條件后,開始執(zhí)行操作;可是就在這個線程執(zhí)行操作的時候,其他線程同時修改了狀態(tài)變量,導(dǎo)致狀態(tài)變量不滿足執(zhí)行條件了。當然很多場景下,這個條件不是顯式的,例如前面 addOne 的例子中,set(get()+1) 這個復(fù)合操作,其實就隱式依賴 get() 的結(jié)果。
那面對數(shù)據(jù)競爭和競態(tài)條件問題,又該如何保證線程的安全性呢?其實這兩類問題,都可以用互斥這個技術(shù)方案,而實現(xiàn)互斥的方案有很多,CPU 提供了相關(guān)的互斥指令,操作系統(tǒng)、編程語言也會提供相關(guān)的 API。從邏輯上來看,我們可以統(tǒng)一歸為:鎖。。
活躍性問題
所謂活躍性問題,指的是某個操作無法執(zhí)行下去。我們常見的“死鎖”就是一種典型的活躍性問題,當然除了死鎖外,還有兩種情況,分別是“活鎖”和“饑餓”。通過前面的學習你已經(jīng)知道,發(fā)生“死鎖”后線程會互相等待,而且會一直等待下去,在技術(shù)上的表現(xiàn)形式是線程永久地“阻塞”了。
但有時線程雖然沒有發(fā)生阻塞,但仍然會存在執(zhí)行不下去的情況,這就是所謂的“活鎖”??梢灶惐痊F(xiàn)實世界里的例子,路人甲從左手邊出門,路人乙從右手邊進門,兩人為了不相撞,互相謙讓,路人甲讓路走右手邊,路人乙也讓路走左手邊,結(jié)果是兩人又相撞了。這種情況,基本上謙讓幾次就解決了,因為人會交流啊。可是如果這種情況發(fā)生在編程世界了,就有可能會一直沒完沒了地“謙讓”下去,成為沒有發(fā)生阻塞但依然執(zhí)行不下去的“活鎖”。
解決“活鎖”的方案很簡單,謙讓時,嘗試等待一個隨機的時間就可以了。
那“饑餓”該怎么去理解呢?所謂“饑餓”指的是線程因無法訪問所需資源而無法執(zhí)行下去的情況?!安换脊眩疾痪?,如果線程優(yōu)先級“不均”,在 CPU 繁忙的情況下,優(yōu)先級低的線程得到執(zhí)行的機會很小,就可能發(fā)生線程“饑餓”;持有鎖的線程,如果執(zhí)行的時間過長,也可能導(dǎo)致“饑餓”問題。
解決“饑餓”問題的方案很簡單,有三種方案:一是保證資源充足,二是公平地分配資源,三就是避免持有鎖的線程長時間執(zhí)行。這三個方案中,方案一和方案三的適用場景比較有限,因為很多場景下,資源的稀缺性是沒辦法解決的,持有鎖的線程執(zhí)行的時間也很難縮短。倒是方案二的適用場景相對來說更多一些。
那如何公平地分配資源呢?在并發(fā)編程里,主要是使用公平鎖。所謂公平鎖,是一種先來后到的方案,線程的等待是有順序的,排在等待隊列前面的線程會優(yōu)先獲得資源。
性能問題
使用“鎖”要非常小心,但是如果小心過度,也可能出“性能問題”?!版i”的過度使用可能導(dǎo)致串行化的范圍過大,這樣就不能夠發(fā)揮多線程的優(yōu)勢了,而我們之所以使用多線程搞并發(fā)程序,為的就是提升性能。
所以使用鎖的時候一定要關(guān)注對性能的影響。 那怎么才能避免鎖帶來的性能問題呢?這個問題很復(fù)雜,Java SDK 并發(fā)包里之所以有那么多東西,有很大一部分原因就是要提升在某個特定領(lǐng)域的性能。
不過從方案層面,我們可以這樣來解決這個問題。
第一,既然使用鎖會帶來性能問題,那最好的方案自然就是使用無鎖的算法和數(shù)據(jù)結(jié)構(gòu)了。在這方面有很多相關(guān)的技術(shù),例如線程本地存儲 (Thread Local Storage, TLS)、寫入時復(fù)制 (Copy-on-write)、樂觀鎖等;Java 并發(fā)包里面的原子類也是一種無鎖的數(shù)據(jù)結(jié)構(gòu);Disruptor 則是一個無鎖的內(nèi)存隊列,性能都非常好……
第二,減少鎖持有的時間。互斥鎖本質(zhì)上是將并行的程序串行化,所以要增加并行度,一定要減少持有鎖的時間。這個方案具體的實現(xiàn)技術(shù)也有很多,例如使用細粒度的鎖,一個典型的例子就是 Java 并發(fā)包里的 ConcurrentHashMap 1.7,它使用了所謂分段鎖的技術(shù);還可以使用讀寫鎖,也就是讀是無鎖的,只有寫的時候才會互斥。
性能方面的度量指標有很多,我覺得有三個指標非常重要,就是:吞吐量、延遲和并發(fā)量。
- 吞吐量:指的是單位時間內(nèi)能處理的請求數(shù)量。吞吐量越高,說明性能越好。
- 延遲:指的是從發(fā)出請求到收到響應(yīng)的時間。延遲越小,說明性能越好。
- 并發(fā)量:指的是能同時處理的請求數(shù)量,一般來說隨著并發(fā)量的增加、延遲也會增加。所以延遲這個指標,一般都會是基于并發(fā)量來說的。例如并發(fā)量是 1000 的時候,延遲是 50 毫秒。
總結(jié)
并發(fā)編程是一個復(fù)雜的技術(shù)領(lǐng)域,微觀上涉及到原子性問題、可見性問題和有序性問題,宏觀則表現(xiàn)為安全性、活躍性以及性能問題。
我們在設(shè)計并發(fā)程序的時候,主要是從宏觀出發(fā),也就是要重點關(guān)注它的安全性、活躍性以及性能。安全性方面要注意數(shù)據(jù)競爭和競態(tài)條件,活躍性方面需要注意死鎖、活鎖、饑餓等問題,性能方面我們雖然介紹了兩個方案,但是遇到具體問題,你還是要具體分析,根據(jù)特定的場景選擇合適的數(shù)據(jù)結(jié)構(gòu)和算法。
要解決問題,首先要把問題分析清楚。同樣,要寫好并發(fā)程序,首先要了解并發(fā)程序相關(guān)的問題。