多核編程中的條件同步模式
在多線程編程中,當(dāng)對共享資源進(jìn)行操作時,需要使用同步(通常是鎖或原子操作)來進(jìn)行保護(hù),以避免數(shù)據(jù)競爭問題。不幸的是,同步操作的開銷非常大,比如對一個整數(shù)變量進(jìn)行加法操作,那么同步操作的開銷是加法操作的上百倍以上。
有沒有辦法可以減少這種同步操作的開銷呢?如果能設(shè)計出更快的鎖或更快的原子操作來,那么這種開銷自然就減少了。以目前的技術(shù)來看,最快速的原子操作耗時也是普通加法操作的上百倍,所以從這方面著手是非常困難的。
那么能不能從軟件算法的角度來減少同步操作的開銷呢?答案是當(dāng)然可以,基本思想是減少使用同步的次數(shù),比如原來要使用同步1000次,現(xiàn)在改為在滿足一定條件下才使用同步,只需要10次,那么同步的開銷平攤下來就被減少了100倍,效率大大提高了。下面先來看一個共享隊(duì)列例子。
一個普通的共享隊(duì)列通常都是使用鎖來實(shí)現(xiàn),當(dāng)然也有用CAS原子操作來實(shí)現(xiàn)的,這里只討論用鎖來實(shí)現(xiàn)的共享隊(duì)列。
在有鎖保護(hù)的共享隊(duì)列中,在隊(duì)列的進(jìn)隊(duì)和出隊(duì)操作時,通常都是使用鎖來進(jìn)行保護(hù)的,一個典型的使用鎖保護(hù)的出隊(duì)操作偽代碼如下:
- template class <T>
- Locked_DeQueue(T &data)
- {
- Lock();
- DeQueue(data); //調(diào)用串行的出隊(duì)操作
- Unlock();
- }
在使用上面的Locked_DeQueue()函數(shù)時,每調(diào)用一次,就會發(fā)生一次鎖操作。事實(shí)上,并不是每次都需要加鎖操作的,比如隊(duì)列為空時,這時實(shí)際上是不需要進(jìn)行出隊(duì)操作的,完全可以采取的一定的方法避免鎖操作,但是采用上面的Locked_DeQueue()函數(shù)無法避免鎖操作,這就需要對上面的函數(shù)進(jìn)行改進(jìn)。
一種最容易想到的方面就是先判斷隊(duì)列是否為空,如果不為空才使用鎖保護(hù)進(jìn)行出隊(duì)操作。代碼如下:
- template class <T>
- Locked_DeQueue_a(T &data)
- {
- If ( !IsEmpty() )
- {
- Lock();
- DeQueue(data); //調(diào)用串行的出隊(duì)操作
- Unlock();
- }
- }
上面的Locked_DeQueue_a()函數(shù)的一個關(guān)鍵之處是IsEmpty()函數(shù)必須不能使用鎖操作,否則不僅沒有減少同步開銷,反而將同步開銷增大了近一倍。
如何來使得IsEmtpy()函數(shù)不用鎖操作呢,以數(shù)組實(shí)現(xiàn)的環(huán)行隊(duì)列為例,在判斷隊(duì)列是否為空時,其基本方法是判斷隊(duì)首指針是否等于隊(duì)尾指針。偽代碼如下:
- INT IsEmpty()
- {
- Lock()
- if ( 隊(duì)首指針 == 隊(duì)尾指針 )
- {
- Unlock();
- return 1; //為空
- }
- else
- {
- Unlock();
- return 0; //非空
- }
- }
由于隊(duì)首指針和隊(duì)尾指針在進(jìn)隊(duì)或出隊(duì)操作時會發(fā)生改變,因此在上面的IsEmpty()函數(shù)中,需要使用鎖保護(hù),那么如何去掉這層鎖保護(hù)呢?
基本的方法是設(shè)一個標(biāo)志變量EmptyFlag,在進(jìn)隊(duì)和出隊(duì)操作中,當(dāng)隊(duì)列為空時,標(biāo)志變量的值置為1,隊(duì)列非空時,標(biāo)志變量的值置為0。這樣判斷隊(duì)列是否為空就可以通過EmptyFlag單個變量來進(jìn)行,而單個變量的讀寫可以使用原子操作來實(shí)現(xiàn),使得讀操作和普通操作一樣不存在同步操作。
下面是使用EmptyFlag變量實(shí)現(xiàn)的出隊(duì)操作。
- template class <T>
- Locked_DeQueue_b(T &data)
- {
- if ( EmptyFlag )
- {
- return;
- }
- Lock();
- if ( !EmptyFlag ) //Lock()前, 其他線程可能修改了標(biāo)志
- {
- DeQueue(data); //調(diào)用串行的出隊(duì)操作
- if ( 隊(duì)首指針 == 隊(duì)尾指針 )
- {
- //出隊(duì)后,隊(duì)列變空,使用原子操作將EmptyFlag置為1
- AtomicIncrement(&EmptyFlag);
- }
- }
- Unlock();
- }
隊(duì)列的是否為空函數(shù)可以使用下面的完全不需要同步的實(shí)現(xiàn)。
- INT IsEmpty()
- {
- return EmptyFlag;
- }
從Locked_DeQueue_b()函數(shù)的實(shí)現(xiàn)可以看出,如果隊(duì)列本來為空的情況下,它只判斷一個EmptyFlag就返回了,不會調(diào)用鎖操作,減少了同步使用的次數(shù),并且在IsEmpty()函數(shù)中,根本不需要使用同步,這對于那些需要頻繁判斷隊(duì)列是否為空的使用場景,有很好的效果。
比 如對于動態(tài)任務(wù)調(diào)度,假設(shè)使用普通的有鎖的共享隊(duì)列。當(dāng)一個線程私有隊(duì)列為空時,需要去偷取其他線程的共享隊(duì)列中的任務(wù),如果偷取的隊(duì)列為空則發(fā)生了一次 鎖操作,此時需要再偷另外一個隊(duì)列的任務(wù),如果這個隊(duì)列仍然為空則又要一次鎖操作,一次獲取任務(wù)的操作中將可能出現(xiàn)多次加鎖解鎖的情況。通過上面講的條件 同步方法就可以在偷取取一個任務(wù)時,只要一次鎖操作就可以實(shí)現(xiàn)。
上面講的條件同步模式非常適應(yīng)于具有狀態(tài)機(jī)性質(zhì)的場合,只有在發(fā)生狀態(tài)切換(例如隊(duì)列中空或非空的狀態(tài)的切換)時才使用同步,通過對狀態(tài)變量(例如EmptyFlag)的操作來替代其他非狀態(tài)變量(例如隊(duì)首指針和隊(duì)尾指針)的操作,減少同步的使用。
原文鏈接:http://blog.csdn.net/drzhouweiming/article/details/4006899