自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

C++11 修復(fù)了雙重檢查鎖定問題

開發(fā) 后端
雙重檢查鎖定模式(DCLP)在無鎖編程(lock-free programming)中經(jīng)常被討論,直到2004年,JAVA才提供了可靠的雙重檢查鎖定實現(xiàn)。而在C++11之前,C++沒有提供一種該模式的可移植的可靠實現(xiàn)。

雙重檢查鎖定模式(DCLP)在無鎖編程(lock-free programming)中經(jīng)常被討論,直到2004年,JAVA才提供了可靠的雙重檢查鎖定實現(xiàn)。而在C++11之前,C++沒有提供一種該模式的可移植的可靠實現(xiàn)。

隨著雙重檢查鎖定模式在各語言實現(xiàn)上存在的缺點暴露,人們開始研究如何安全可靠地實現(xiàn)它。2000年,一個JAVA高性能研究小組發(fā)布了一篇聲明《雙重檢查鎖定可能導(dǎo)致鎖定無效》。2004年,Scott Meyers 和Andrei Alexandrescu聯(lián)合發(fā)表了一篇名為《C++實現(xiàn)雙重檢查鎖定存在嚴(yán)重缺陷》。這兩篇論文都是重點闡述了雙重檢查鎖定(DCLP)是什么,以及雙重檢查鎖定的意義,和當(dāng)前的各語言實現(xiàn)存在諸多不足。

現(xiàn)如今,JAVA為了安全地實現(xiàn)雙重檢查鎖定修改了其內(nèi)存模型,并引入了關(guān)鍵詞volatile。與此同時,C++構(gòu)建了一個全新的內(nèi)存模型和原子 操作庫(atomic),使得不同編譯器實現(xiàn)雙重檢查鎖定(DCLP)更為容易。為了在更早期的C\C++編譯器中實現(xiàn)DCLP,在C++11引入了一個 名為Mintomic的庫,在今年早些時候由我發(fā)布了。

過去的一段時間,我都著力于C++中實現(xiàn)DCLP的研究。

什么是雙重檢查鎖定?

如果你想在多線程編程中安全使用單件模式(Singleton),最簡單的做法是在訪問時對其加鎖,使用這種方式,假定兩個線程同時調(diào)用Singleton::getInstance方法,其中之一負責(zé)創(chuàng)建單件:

  1. Singleton* Singleton::getInstance() { 
  2.     Lock lock;      // scope-based lock, released automatically when the function returns 
  3.     if (m_instance == NULL) { 
  4.         m_instance = new Singleton; 
  5.     } 
  6.     return m_instance; 

使用這種方式是可行的,但是當(dāng)單件被創(chuàng)建之后,實際上你已經(jīng)不需要再對其進行加鎖,加鎖雖然不一定導(dǎo)致性能低下,但是在重負載情況下,這也可能導(dǎo)致響應(yīng)緩慢。

使用雙重檢查鎖定模式避免了在單件對象已經(jīng)創(chuàng)建好之后進行不必要的鎖定,然而實現(xiàn)卻有點復(fù)雜,在Meyers-Alexandrescu的論文中也 有過闡述,文中提出了幾種存在缺陷的實現(xiàn)方式,并逐一解釋了為什么這樣實現(xiàn)存在問題。在論文的結(jié)尾的第12頁,給出了一種可靠的實現(xiàn)方式,實現(xiàn)依賴一種標(biāo) 準(zhǔn)中未規(guī)范的內(nèi)存柵欄技術(shù)。

  1. Singleton* Singleton::getInstance() { 
  2.     Singleton* tmp = m_instance; 
  3.     ...                     // insert memory barrier 
  4.     if (tmp == NULL) { 
  5.         Lock lock; 
  6.         tmp = m_instance; 
  7.         if (tmp == NULL) { 
  8.             tmp = new Singleton; 
  9.             ...             // insert memory barrier 
  10.             m_instance = tmp; 
  11.         } 
  12.     } 
  13.     return tmp; 

這里,我們可以看到:如模式名稱一樣,代碼中實現(xiàn)了雙重校驗,在m_instance指針為NULL時,我們做了一次鎖定,這一過程在***創(chuàng)建該對象的線程可見。在創(chuàng)建線程內(nèi)部構(gòu)造塊中,m_instance被再一次檢查,以確保該線程僅創(chuàng)建了一份對象副本。

這是雙重檢查鎖定的實現(xiàn),只不過在被高亮的代碼行中還缺乏了內(nèi)存柵欄技術(shù)做保證,在此文寫就之際,C/C++各編譯器未對該實現(xiàn)進行統(tǒng)一,而在C++11標(biāo)準(zhǔn)中,對這種情況下的實現(xiàn)進行了完善和統(tǒng)一。

在C++11中獲取和釋放內(nèi)存柵欄

在C++11中,你可以獲取和釋放內(nèi)存柵欄來實現(xiàn)上述功能(如何獲取和釋放內(nèi)存柵欄在我上一篇博文中有講述)。為了使你的代碼在C++各種實現(xiàn)中具 備更好的可移植性,你應(yīng)該使用C++11中新增的atomic類型來包裝你的m_instance指針,這使得對m_instance的操作是一個原子操作。下面的代碼演示了如何使用內(nèi)存柵欄,請注意代碼高亮部分:

  1. std::atomic<Singleton*> Singleton::m_instance; 
  2. std::mutex Singleton::m_mutex; 
  3.   
  4. Singleton* Singleton::getInstance() { 
  5.     Singleton* tmp = m_instance.load(std::memory_order_relaxed); 
  6.     std::atomic_thread_fence(std::memory_order_acquire);  // 編注:原作者提示注意的 
  7.     if (tmp == nullptr) { 
  8.         std::lock_guard<std::mutex> lock(m_mutex); 
  9.         tmp = m_instance.load(std::memory_order_relaxed); 
  10.         if (tmp == nullptr) { 
  11.             tmp = new Singleton; 
  12.             std::atomic_thread_fence(std::memory_order_release); // 編注:作者提示注意的 
  13.             m_instance.store(tmp, std::memory_order_relaxed); 
  14.         } 
  15.     } 
  16.     return tmp; 

上述代碼在多核系統(tǒng)中仍然工作正常,這是因為內(nèi)存柵欄技術(shù)在創(chuàng)建對象線程和使用對象線程之間建立了一種“同步-與”的關(guān)系(synchronizes-with)。Singleton::m_instance扮演了守衛(wèi)變量的角色,而單件本身則作為負載內(nèi)容。

two-cones-dclp

而其他存在缺陷的雙重檢查鎖定實現(xiàn)都缺乏該機制的保障:在沒有“同步-與”關(guān)系保證的情況下,***個創(chuàng)建線程的寫操作,確切地說是在其構(gòu)造函數(shù)中, 可以被其他線程感知,即m_instance指針能被其他線程訪問!創(chuàng)建單件線程中的鎖也不起作用,由于該鎖對其他線程不可見,從而導(dǎo)致在某些情況下,創(chuàng) 建對象被執(zhí)行多次。

如果你想了解關(guān)于內(nèi)存柵欄技術(shù)是如何可靠實現(xiàn)雙重檢查鎖定的內(nèi)部原理,在我的前一篇文章中有一些背景信息(previous post),之前的博客也有一些相關(guān)內(nèi)容。

#p#

使用Mintomic 內(nèi)存柵欄

Mintomic是一個很小的c庫,提供了C++11 atomic庫中的一些功能函數(shù)子集,包含獲取和釋放內(nèi)存柵欄,同時它能工作在早期的編譯器之上。Mintomic依賴于與C++11相似的內(nèi)存模型—— 確切地說是不使用Out-of-thin-air存儲——這一技術(shù)在早期編譯器中未進行實現(xiàn),而這是在沒有C++11標(biāo)準(zhǔn)情況下我們能做的***實現(xiàn)。以我 多年C++多線程開發(fā)的經(jīng)驗看來,Out-of-thin-air存儲并不流行,而且大多數(shù)編譯器會避免實現(xiàn)它。

下面的代碼演示了如何使用Mintomic的獲取和釋放內(nèi)存柵欄機制實現(xiàn)雙重檢查鎖定,基本上與上面的例子類似:

  1. mint_atomicPtr_t Singleton::m_instance = { 0 }; 
  2. mint_mutex_t Singleton::m_mutex; 
  3.   
  4. Singleton* Singleton::getInstance() { 
  5.     Singleton* tmp = (Singleton*) mint_load_ptr_relaxed(&m_instance); 
  6.     mint_thread_fence_acquire(); 
  7.     if (tmp == NULL) { 
  8.         mint_mutex_lock(&m_mutex); 
  9.         tmp = (Singleton*) mint_load_ptr_relaxed(&m_instance); 
  10.         if (tmp == NULL) { 
  11.             tmp = new Singleton; 
  12.             mint_thread_fence_release(); 
  13.             mint_store_ptr_relaxed(&m_instance, tmp); 
  14.         } 
  15.         mint_mutex_unlock(&m_mutex); 
  16.     } 
  17.     return tmp; 

為了實現(xiàn)獲取和釋放內(nèi)存柵欄,Mintomic會試圖在其支持的編譯器平臺產(chǎn)生***效的機器碼。例如,下面的匯編代碼來自Xbox 360,使用的是PowerPC處理器。在該平臺上,內(nèi)聯(lián)的lwsync關(guān)鍵字是針對獲取和釋放內(nèi)存柵欄的優(yōu)化指令。

ppc-double-checked-mintomic

上述采用C++11標(biāo)準(zhǔn)庫編譯的例子在PowerPC處理器編譯應(yīng)該會產(chǎn)生一樣的匯編代碼(理想情況下)。不過,我沒有能夠在PowerPC下編譯C++11來驗證這一點。

使用C++11低階指令順序約束

在C++11中使用內(nèi)存柵欄鎖定技術(shù)可以很方便地實現(xiàn)雙重檢查鎖定。同時也保證在現(xiàn)今流行的多核系統(tǒng)中產(chǎn)生優(yōu)化的機器碼(Mintomic也能做到 這一點)。不過使用這種方式并不是常用,在C++11中更好的實現(xiàn)方式是使用保證低階指令執(zhí)行順序約束的原子操作。之前的圖片中可以看到,一個寫-釋放操 作可以與一個獲取-讀操作同步:

  1. std::atomic<Singleton*> Singleton::m_instance; 
  2. std::mutex Singleton::m_mutex; 
  3.   
  4. Singleton* Singleton::getInstance() { 
  5.     Singleton* tmp = m_instance.load(std::memory_order_acquire); 
  6.     if (tmp == nullptr) { 
  7.         std::lock_guard<std::mutex> lock(m_mutex); 
  8.         tmp = m_instance.load(std::memory_order_relaxed); 
  9.         if (tmp == nullptr) { 
  10.             tmp = new Singleton; 
  11.             m_instance.store(tmp, std::memory_order_release); 
  12.         } 
  13.     } 
  14.     return tmp; 

從技術(shù)上講,使用這種形式的無鎖同步比獨立內(nèi)存柵欄技術(shù)限制更低。上述操作只是為了防止自身操作的內(nèi)存排序,而內(nèi)存柵欄技術(shù)則阻止了臨近操作的內(nèi)存 排序。盡管如此,現(xiàn)今的x86/64,ARMv6 / v7,和PowerPC處理器架構(gòu),針對這兩種形式產(chǎn)生的機器碼應(yīng)該是一致的。在我之前的博文中,我展示了C++11低階指令順序約束在ARM7中使用了 dmb指令,這和使用內(nèi)存柵欄技術(shù)產(chǎn)生的匯編代碼相一致。

上述兩種方式在Itanium平臺可能產(chǎn)生不一樣的機器碼,在Itanium平臺上,C++11標(biāo)準(zhǔn)中的 load(memory_order_acquire)可以用單CPU指令:ld.acq,而store(tmp, memory_order_release)使用st.rel就可以實現(xiàn)。

在ARMv8處理器架構(gòu)中,也提供了和Itanium指令等價的ldar 和 stlr 指令,而不同的地方是:這些指令還會導(dǎo)致stlr和后續(xù)ldar之間進一級的存儲裝載指令進行排序。實際上,ARMv8的新指令試圖實現(xiàn)C++11標(biāo)準(zhǔn)中 的順序約束原子操作,這會在后面進一步講述。

使用C++順序一致的原子操作

C++11標(biāo)準(zhǔn)提供了一個不同的方式來編寫無鎖程序(可以把雙重檢查鎖定歸類為無鎖編程的一種,因為不是所有線程都會獲取鎖)。在所有原子操作庫方 法中使用可選參數(shù)std::memory_order可以使得所有原子變量變?yōu)轫樞虻脑硬僮鳎╯equentially consistent),方法的默認參數(shù)為std::memory_order_seq_cst。使用順序約束(SC)原子操作庫,整個函數(shù)執(zhí)行都將保證 順序執(zhí)行,并且不會出現(xiàn)數(shù)據(jù)競態(tài)(data races)。順序約束(SC)原子操作和JAVA5版本之后出現(xiàn)的volatile變量很相似。

使用SC原子操作實現(xiàn)雙重檢查鎖定的代碼如下:和前面的例子一樣,高亮的第二行會與***次創(chuàng)建單件的線程進行同步與操作。

  1. std::atomic<Singleton*> Singleton::m_instance; 
  2. std::mutex Singleton::m_mutex; 
  3.   
  4. Singleton* Singleton::getInstance() { 
  5.     Singleton* tmp = m_instance.load(); 
  6.     if (tmp == nullptr) { 
  7.         std::lock_guard<std::mutex> lock(m_mutex); 
  8.         tmp = m_instance.load(); 
  9.         if (tmp == nullptr) { 
  10.             tmp = new Singleton; 
  11.             m_instance.store(tmp); 
  12.         } 
  13.     } 
  14.     return tmp; 

順序約束(SC)原子操作使得開發(fā)者更容易預(yù)測代碼執(zhí)行結(jié)果,不足之處在于使用順序約束(SC)原子操作類庫的代碼效率要比之前的例子低一些。例如,在x64位機器上,上述代碼使用Clang3.3優(yōu)化后產(chǎn)生如下匯編代碼:

x64-double-checked-seq-cst

由于使用了順序約束(SC)原子操作類庫,變量m_instance的存儲操作使用了xchg指令,在x64處理器上相當(dāng)于一個內(nèi)存柵欄操作。該指 令在x64位處理器是一個長周期指令,使用輕量級的mov指令也可以完成操作。不過,這影響不大,因為xchg指令只被單件創(chuàng)建過程調(diào)用一次。

不過,在PowerPC or ARMv6/v7處理器上編譯上述代碼,產(chǎn)生的匯編操作要糟糕得多,具體情形可以參見Herb Sutter的演講(atomic Weapons talk, part 2.00:44:25 – 00:49:16)。

#p#

使用C++11數(shù)據(jù)順序依賴原理

上面的例子都是使用了創(chuàng)建單件線程和使用單件其他線程之間的同步與關(guān)系。守衛(wèi)的是數(shù)據(jù)指針單個元素,開銷也是創(chuàng)建單件內(nèi)容本身。這里,我將演示一種使用數(shù)據(jù)依賴來保護防衛(wèi)的指針。

在使用數(shù)據(jù)依賴時候,上述例子中都使用了一個讀-獲取操作,這也會產(chǎn)生性能消耗,我們可以使用消費指令來進一步優(yōu)化。消費指令(consume instruction)非常酷,在PowerPc處理器上它使用了lwsync指令,在ARMv7處理器上則編譯為dmd指令。今后我會寫一些文章來講 述消費指令和數(shù)據(jù)依賴機制。

使用C++11靜態(tài)初始化

一些讀者可能已經(jīng)知道C++11中,你可以跳過之前的檢查過程而直接得到線程安全的單件。你只需要使用一個靜態(tài)初始化:

C++11標(biāo)準(zhǔn)在6.7.4節(jié)中規(guī)定:

如果指令邏輯進入一個未被初始化的聲明變量,所有并發(fā)執(zhí)行應(yīng)當(dāng)?shù)却瓿稍撟兞客瓿沙跏蓟?/p>

上述操作在編譯時由編譯器保證。雙重檢查鎖定則可以利用這一點。編譯器并不保證會使用雙重檢查鎖定,但是大部分編譯器會這樣做。gcc4.6使用-std=c++0x編譯選項在ARM處理器產(chǎn)生的匯編代碼如下:

clang-arm-static-init

由于單件使用的是一個固定地址,編譯器會使用一個特殊的防衛(wèi)變量來完成同步。請注意這里,在初始化變量讀操作時沒有使用dmb指令來獲取一個內(nèi)存柵 欄。守衛(wèi)變量指向了單件,因此編譯器可以使用數(shù)據(jù)依賴原則來避免使用dmb指令的開銷。__cxa_guard_release指令扮演了一個寫-釋放來 解除變量守衛(wèi)。一旦守衛(wèi)柵欄被設(shè)置,這里存在一個指令順序強制在讀-消費操作之前。這里和前面的例子一樣,對內(nèi)存排序的進行適應(yīng)性的變更。

前面的長篇累牘主要講述了C++11標(biāo)準(zhǔn)修復(fù)了雙層檢查鎖定實現(xiàn),并且講述了其他一些相關(guān)知識。

就我個人而言,我認為應(yīng)當(dāng)在程序初始化時就初始化一個singleton。使用雙重檢查鎖定可以幫你將任意數(shù)據(jù)類型存儲在一個無鎖的哈希表中。這會在后續(xù)的文章進一步闡述。

原文鏈接:http://preshing.com/20130930/double-checked-locking-is-fixed-in-cpp11/

譯文鏈接:http://blog.jobbole.com/52164/

責(zé)任編輯:陳四芳 來源: 伯樂在線
相關(guān)推薦

2013-12-23 09:48:43

C++鎖定模式

2011-04-20 10:07:15

2016-11-11 00:33:25

雙重檢查鎖定延遲初始化線程

2020-06-01 21:07:33

C11C++11內(nèi)存

2020-07-27 10:40:35

C++11語言代碼

2013-05-30 00:49:36

C++11C++條件變量

2024-05-29 13:21:21

2024-02-21 23:43:11

C++11C++開發(fā)

2013-09-25 14:20:46

2021-10-09 06:42:43

Windows 11WinRAR微軟

2011-10-13 10:21:01

C++

2024-10-12 21:13:57

2021-06-11 10:53:40

Folly組件開發(fā)

2012-12-25 10:52:23

IBMdW

2025-01-21 08:02:03

2013-12-11 10:00:14

C++新特性C

2013-07-31 11:09:05

C++11

2020-12-09 10:55:25

ArrayvectorLinux

2023-09-22 22:27:54

autoC++11

2020-09-23 16:31:38

C++C++11啟動線程
點贊
收藏

51CTO技術(shù)棧公眾號