自?。悍植际芥i主動續(xù)期的入門級實現(xiàn)
?一、背景
在《??# 分布式鎖上-初探??》中有提到一個分布式鎖應(yīng)具備的功能特點中有避免死鎖這一條:
如果某個客戶端獲得鎖之后處理時間超過最大約定時間,或者持鎖期間內(nèi)發(fā)生了故障導(dǎo)致無法主動釋放鎖,其持有的鎖也能夠被其他機(jī)制正確釋放,并保證后續(xù)其它客戶端也能加鎖,整個處理流程繼續(xù)正常執(zhí)行。
簡單解釋一下:
- 客戶端搶到分布式鎖之后開始執(zhí)行任務(wù),執(zhí)行完畢后再釋放分布式鎖。
- 持鎖后因客戶端異常未能把鎖釋放,會導(dǎo)致鎖成為永恒鎖。
- 為了避免這種情況,在創(chuàng)建鎖的時候給鎖指定一個過期時間。
- 到期之后鎖會被自動刪除掉,這個角度看是對鎖資源的一種保護(hù)。
二、理還亂?
邏輯看很簡單,也很清晰,但任何事情都有兩面性,自動刪除自然有理,但肯定也有弊端。如果要把鎖的功能做的健壯,總要從不斷地自我質(zhì)疑、自我反思中,理順?biāo)悸?,尋找答案,我認(rèn)為這屬于自省式學(xué)習(xí),以后也想嘗試這種模式,一起來試試吧:
- 問題:鎖過期了會被刪掉,可是任務(wù)沒結(jié)束怎么辦?如果鎖被釋放的時候,任務(wù)尚未執(zhí)行完畢,那就可能導(dǎo)致其它客戶端又搶到鎖,任務(wù)被重復(fù)執(zhí)行。
- 問題:把鎖的過期時間定得長一點?邏輯聽起來沒錯,如果你能確定任務(wù)的最大耗時,那沒問題;大部分情況都很難確定任務(wù)的最大耗時該是多少。
- 問題:鎖的過期時間定多長合適?反正會被釋放,過期時間定的足夠長吧;如果鎖使用的頻率很高,加了鎖程序有bug釋放不掉,服務(wù)端豈不是要出現(xiàn)大量的垃圾數(shù)據(jù)?思來想去,對一個健壯的分布式鎖來說,過期時間設(shè)置太長了不合適,設(shè)置太短了也不合適。
- 問題:怎么平衡?不長不短,主動延期!持鎖期間,酌情推后鎖的過期時間,以基于Redis的分布式鎖來說,就需要調(diào)用 API 重置鎖 key 的過期時間。當(dāng)前線程持鎖后在執(zhí)行任務(wù)期間不能再調(diào)用 API 重試鎖 key 的過期時間。
- 問題:誰來調(diào)用API呢?需要使用其他的線程來執(zhí)行續(xù)期。
- 問題:給每個鎖配一個線程?可以,如果使用分布式鎖的場景中沒有什么并發(fā),一個客戶端也就那么三兩個鎖同時存在,那就沒問題。每個鎖搶鎖成功后,開啟一個線程,在線程中通過循環(huán)給鎖續(xù)期。
- 問題:多久執(zhí)行一次續(xù)期?有一些常規(guī)處理是續(xù)租間隔默認(rèn)采用過期時間的1/3。若把鎖的過期時間設(shè)定為與實際耗時相差不大,這樣通過一兩次續(xù)租基本就滿足了大部分的情況。
- 問題:為什么要觸發(fā)一次續(xù)期操作呢,這不浪費(fèi)資源嗎?采用過期時間1/3間隔,若用戶定義鎖3秒過期,那每秒鐘都有一個續(xù)期指令,有沒有覺得也不太合適。
- 問題:要不要避免續(xù)期指令太頻繁?避免續(xù)期指令太頻繁調(diào)用是有必要的,也可以增加一個續(xù)期的最小間隔時間,比如最少是5秒??捎捎脩糇约嚎刂评m(xù)期周期,沒必要一定要發(fā)起續(xù)期調(diào)用。比如任務(wù)執(zhí)行大多在5秒鐘,那么就把鎖定為7秒,續(xù)期時間定在6秒,那么6秒內(nèi)任務(wù)結(jié)束了就不用續(xù)期,即不必把過期時間定的太長,也不必執(zhí)行一兩次續(xù)期操作。
- 問題:續(xù)租的間隔怎么實現(xiàn)?線程內(nèi)間隔控制通常是通過 sleep() 方法,稍微精準(zhǔn)一點的話,單位使用毫秒。
- 問題:線程要關(guān)閉吧?釋放鎖的時候要主動關(guān)閉負(fù)責(zé)續(xù)期的線程,所以線程的循環(huán)里要有一個變量來控制退出 while 循環(huán)
- 問題:變量是跨線程訪問,如何保證跨線程的可見性呢?在變量上增加 volatile 關(guān)鍵字。
- 問題:如果續(xù)期線程里在 sleep(),那就一直等 sleep() 結(jié)束?如果等到 sleep() 結(jié)束,就挺浪費(fèi)資源的
- 問題:能不能快速結(jié)束 sleep() 狀態(tài)?可以,通過 interrupt(),需留意,被打斷的時候會拋異常 InterruptedException
到這里,似乎都理順了。
三、新的思考
- 問題:如果同時有成百上千個鎖呢?同時有成百上千個線程在工作,你若認(rèn)為沒問題,不存在,那ok,不用繼續(xù)看下一篇。
- 那怎么辦呢?可以用 Executors.newScheduledThreadPool ,里邊有 scheduleAtFixedRate
- 不能用?風(fēng)險是什么?
本文轉(zhuǎn)載自微信公眾號「架構(gòu)染色」,可以通過以下二維碼關(guān)注。轉(zhuǎn)載本文請聯(lián)系【架構(gòu)染色】公眾號作者。