自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

說說 Python 里關(guān)于線程安全的那些事兒

安全 數(shù)據(jù)安全 后端
那什么情況下,訪問數(shù)據(jù)時(shí)是安全的?什么情況下,訪問數(shù)據(jù)是不安全的?如何知道你的代碼是否線程安全?要如何訪問數(shù)據(jù)才能保證數(shù)據(jù)的安全?本篇文章會(huì)一一回答你的問題。

在并發(fā)編程時(shí),如果多個(gè)線程訪問同一資源,我們需要保證訪問的時(shí)候不會(huì)產(chǎn)生沖突,數(shù)據(jù)修改不會(huì)發(fā)生錯(cuò)誤,這就是我們常說的線程安全 。

那什么情況下,訪問數(shù)據(jù)時(shí)是安全的?什么情況下,訪問數(shù)據(jù)是不安全的?如何知道你的代碼是否線程安全?要如何訪問數(shù)據(jù)才能保證數(shù)據(jù)的安全?

本篇文章會(huì)一一回答你的問題。

1. 線程不安全是怎樣的?

要搞清楚什么是線程安全,就要先了解線程不安全是什么樣的。

比如下面這段代碼,開啟兩個(gè)線程,對(duì)全局變量 number 各自增 10萬次,每次增量 1。

  1. from threading import Thread, Lock 
  2.  
  3. number = 0 
  4.  
  5. def target(): 
  6.     global number 
  7.     for _ in range(1000000): 
  8.         number += 1 
  9.  
  10. thread_01 = Thread(targettarget=target) 
  11. thread_02 = Thread(targettarget=target) 
  12. thread_01.start() 
  13. thread_02.start() 
  14.  
  15. thread_01.join() 
  16. thread_02.join() 
  17.  
  18. print(number) 

正常我們的預(yù)期輸出結(jié)果,一個(gè)線程自增100萬,兩個(gè)線程就自增 200 萬嘛,輸出肯定為 2000000 。

可事實(shí)卻并不是你想的那樣,不管你運(yùn)行多少次,每次輸出的結(jié)果都會(huì)不一樣,而這些輸出結(jié)果都有一個(gè)特點(diǎn)是,都小于 200 萬。

以下是執(zhí)行三次的結(jié)果

  1. 1459782 
  2. 1379891 
  3. 1432921 

這種現(xiàn)象就是線程不安全,究其根因,其實(shí)是我們的操作 number += 1 ,不是原子操作,才會(huì)導(dǎo)致的線程不安全。

2. 什么是原子操作?

原子操作(atomic operation),指不會(huì)被線程調(diào)度機(jī)制打斷的操作,這種操作一旦開始,就一直運(yùn)行到結(jié)束,中間不會(huì)切換到其他線程。

它有點(diǎn)類似數(shù)據(jù)庫中的 事務(wù)。

在 Python 的官方文檔上,列出了一些常見原子操作

  1. L.append(x) 
  2. L1.extend(L2) 
  3. x = L[i] 
  4. x = L.pop() 
  5. L1[i:j] = L2 
  6. L.sort() 
  7. x = y 
  8. x.field = y 
  9. D[x] = y 
  10. D1.update(D2) 
  11. D.keys() 

而下面這些就不是原子操作

  1. ii = i+1 
  2. L.append(L[-1]) 
  3. L[i] = L[j] 
  4. D[x] = D[x] + 1 

像上面的我使用自增操作 number += 1,其實(shí)等價(jià)于 number = number + 1,可以看到這種可以拆分成多個(gè)步驟(先讀取相加再賦值),并不屬于原子操作。

這樣就導(dǎo)致多個(gè)線程同時(shí)讀取時(shí),有可能讀取到同一個(gè) number 值,讀取兩次,卻只加了一次,最終導(dǎo)致自增的次數(shù)小于預(yù)期。

當(dāng)我們還是無法確定我們的代碼是否具有原子性的時(shí)候,可以嘗試通過 dis 模塊里的 dis 函數(shù)來查看

當(dāng)我們執(zhí)行這段代碼時(shí),可以看到 number += 1 這一行代碼,由兩條字節(jié)碼實(shí)現(xiàn)。

  • BINARY_ADD :將兩個(gè)值相加
  • STORE_GLOBAL:將相加后的值重新賦值

每一條字節(jié)碼指令都是一個(gè)整體,無法分割,他實(shí)現(xiàn)的效果也就是我們所說的原子操作。

當(dāng)一行代碼被分成多條字節(jié)碼指令的時(shí)候,就代表在線程線程切換時(shí),有可能只執(zhí)行了一條字節(jié)碼指令,此時(shí)若這行代碼里有被多個(gè)線程共享的變量或資源時(shí),并且拆分的多條指令里有對(duì)于這個(gè)共享變量的寫操作,就會(huì)發(fā)生數(shù)據(jù)的沖突,導(dǎo)致數(shù)據(jù)的不準(zhǔn)確。

為了對(duì)比,我們從上面列表的原子操作拿一個(gè)出來也來試試,是不是真如官網(wǎng)所說的原子操作。

這里我拿字典的 update 操作舉例,代碼和執(zhí)行過程如下圖

從截圖里可以看到,info.update(new) 雖然也分為好幾個(gè)操作:

  • LOAD_GLOBAL:加載全局變量
  • LOAD_ATTR:加載屬性,獲取 update 方法
  • LOAD_FAST:加載 new 變量
  • CALL_FUNCTION:調(diào)用函數(shù)
  • POP_TOP:執(zhí)行更新操作

但我們要知道真正會(huì)引導(dǎo)數(shù)據(jù)沖突的,其實(shí)不是讀操作,而是寫操作。

上面這么多字節(jié)碼指令,寫操作都只有一個(gè)(POP_TOP),因此字典的 update 方法是原子操作。

3. 實(shí)現(xiàn)人工原子操作

在多線程下,我們并不能保證我們的代碼都具有原子性,因此如何讓我們的代碼變得具有 “原子性” ,就是一件很重要的事。

方法也很簡單,就是當(dāng)你在訪問一個(gè)多線程間共享的資源時(shí),加鎖可以實(shí)現(xiàn)類似原子操作的效果,一個(gè)代碼要嘛不執(zhí)行,執(zhí)行了的話就要執(zhí)行完畢,才能接受線程的調(diào)度。

因此,我們使用加鎖的方法,對(duì)例子一進(jìn)行一些修改,使其具備“原子性”。

  1. from threading import Thread, Lock 
  2.  
  3.  
  4. number = 0 
  5. lock = Lock() 
  6.  
  7.  
  8. def target(): 
  9.     global number 
  10.     for _ in range(1000000): 
  11.         with lock: 
  12.             number += 1 
  13.  
  14. thread_01 = Thread(targettarget=target) 
  15. thread_02 = Thread(targettarget=target) 
  16. thread_01.start() 
  17. thread_02.start() 
  18.  
  19. thread_01.join() 
  20. thread_02.join() 
  21.  
  22. print(number) 

此時(shí),不管你執(zhí)行多少遍,輸出都是 2000000.

4. 為什么 Queue 是線程安全的?

Python 的 threading 模塊里的消息通信機(jī)制主要有如下三種:

  • Event
  • Condition
  • Queue

使用最多的是 Queue,而我們都知道它是線程安全的。當(dāng)我們對(duì)它進(jìn)行寫入和提取的操作不會(huì)被中斷而導(dǎo)致錯(cuò)誤,這也是我們?cè)谑褂藐?duì)列時(shí),不需要額外加鎖的原因。

他是如何做到的呢?

其根本原因就是 Queue 實(shí)現(xiàn)了鎖原語,因此他能像第三節(jié)那樣實(shí)現(xiàn)人工原子操作。

原語指由若干個(gè)機(jī)器指令構(gòu)成的完成某種特定功能的一段程序,具有不可分割性;即原語的執(zhí)行必須是連續(xù)的,在執(zhí)行過程中不允許被中斷。

 

責(zé)任編輯:趙寧寧 來源: Python編程時(shí)光
相關(guān)推薦

2020-05-07 10:05:52

Python數(shù)據(jù)安全

2020-05-14 10:08:14

網(wǎng)絡(luò)安全網(wǎng)絡(luò)安全技術(shù)周刊

2019-12-27 10:28:07

信息安全證書信息安全網(wǎng)絡(luò)安全

2021-03-09 23:12:51

Python集合項(xiàng)目

2016-06-07 10:47:42

2019-11-20 10:00:56

開源侵權(quán)版權(quán)

2022-08-04 10:18:32

棧遷移?寄存器內(nèi)存

2021-06-09 13:28:40

密碼安全身份認(rèn)證數(shù)據(jù)安全

2013-07-09 13:50:05

2017-04-12 12:31:14

緩存Web瀏覽器

2022-06-02 08:42:15

Redis數(shù)據(jù)庫

2016-01-11 10:10:53

2014-02-14 09:28:55

數(shù)據(jù)中心日常維護(hù)

2012-11-28 10:54:37

禁止追蹤DNT

2020-09-22 14:29:24

智能

2017-03-31 09:24:53

AR現(xiàn)實(shí)游戲

2016-09-27 23:47:42

2015-10-12 18:09:42

2014-05-30 10:23:15

樂跑手環(huán)智能手環(huán)運(yùn)動(dòng)手環(huán)

2022-07-10 07:48:26

緩存軟件設(shè)計(jì)
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)