秒殺系統(tǒng):并發(fā)隊(duì)列 接口設(shè)計(jì) 并發(fā)請(qǐng)求數(shù)據(jù)安全處理
并發(fā)隊(duì)列的選擇
Java的并發(fā)包提供了三個(gè)常用的并發(fā)隊(duì)列實(shí)現(xiàn),分別是:ArrayBlockingQueue、ConcurrentLinkedQueue 和 LinkedBlockingQueue 。
ArrayBlockingQueue是初始容量固定的阻塞隊(duì)列,我們可以用來作為數(shù)據(jù)庫模塊成功競(jìng)拍的隊(duì)列,比如有10個(gè)商品,那么我們就設(shè)定一個(gè)10大小的數(shù)組隊(duì)列。
ConcurrentLinkedQueue使用的是CAS原語無鎖隊(duì)列實(shí)現(xiàn),是一個(gè)異步隊(duì)列,入隊(duì)的速度很快,出隊(duì)進(jìn)行了加鎖,性能稍慢。
LinkedBlockingQueue也是阻塞的隊(duì)列,入隊(duì)和出隊(duì)都用了加鎖,當(dāng)隊(duì)空的時(shí)候線程會(huì)暫時(shí)阻塞。
在請(qǐng)求預(yù)處理階段,由于我們的系統(tǒng)入隊(duì)需求要遠(yuǎn)大于出隊(duì)需求,一般不會(huì)出現(xiàn)隊(duì)空的情況,所以我們可以選擇ConcurrentLinkedQueue來作為我們的請(qǐng)求隊(duì)列實(shí)現(xiàn)
1. 請(qǐng)求接口的合理設(shè)計(jì)
一個(gè)秒殺或者搶購(gòu)頁面,通常分為2個(gè)部分,一個(gè)是靜態(tài)的HTML等內(nèi)容,另一個(gè)就是參與秒殺的Web后臺(tái)請(qǐng)求接口。
通常靜態(tài)HTML等內(nèi)容,是通過CDN的部署,一般壓力不大,核心瓶頸實(shí)際上在后臺(tái)請(qǐng)求接口上。這個(gè)后端接口,必須能夠支持高并發(fā)請(qǐng)求,同時(shí),非常重要的一點(diǎn),必須盡可能“快”,在最短的時(shí)間里返回用戶的請(qǐng)求結(jié)果。為了實(shí)現(xiàn)盡可能快這一點(diǎn),接口的后端存儲(chǔ)使用內(nèi)存級(jí)別的操作會(huì)更好一點(diǎn)。仍然直接面向MySQL之類的存儲(chǔ)是不合適的,如果有這種復(fù)雜業(yè)務(wù)的需求,都建議采用異步寫入。

當(dāng)然,也有一些秒殺和搶購(gòu)采用“滯后反饋”,就是說秒殺當(dāng)下不知道結(jié)果,一段時(shí)間后才可以從頁面中看到用戶是否秒殺成功。但是,這種屬于“偷懶”行為,同時(shí)給用戶的體驗(yàn)也不好,容易被用戶認(rèn)為是“暗箱操作”。
高并發(fā)下的數(shù)據(jù)安全
我們知道在多線程寫入同一個(gè)文件的時(shí)候,會(huì)存現(xiàn)“線程安全”的問題(多個(gè)線程同時(shí)運(yùn)行同一段代碼,如果每次運(yùn)行結(jié)果和單線程運(yùn)行的結(jié)果是一樣的,結(jié)果和預(yù)期相同,就是線程安全的)。如果是MySQL數(shù)據(jù)庫,可以使用它自帶的鎖機(jī)制很好的解決問題,但是,在大規(guī)模并發(fā)的場(chǎng)景中,是不推薦使用MySQL的。秒殺和搶購(gòu)的場(chǎng)景中,還有另外一個(gè)問題,就是“超發(fā)”,如果在這方面控制不慎,會(huì)產(chǎn)生發(fā)送過多的情況。我們也曾經(jīng)聽說過,某些電商搞搶購(gòu)活動(dòng),買家成功拍下后,商家卻不承認(rèn)訂單有效,拒絕發(fā)貨。這里的問題,也許并不一定是商家奸詐,而是系統(tǒng)技術(shù)層面存在超發(fā)風(fēng)險(xiǎn)導(dǎo)致的。
1. 超發(fā)的原因
假設(shè)某個(gè)搶購(gòu)場(chǎng)景中,我們一共只有100個(gè)商品,在最后一刻,我們已經(jīng)消耗了99個(gè)商品,僅剩最后一個(gè)。這個(gè)時(shí)候,系統(tǒng)發(fā)來多個(gè)并發(fā)請(qǐng)求,這批請(qǐng)求讀取到的商品余量都是99個(gè),然后都通過了這一個(gè)余量判斷,最終導(dǎo)致超發(fā)。(同文章前面說的場(chǎng)景)

在上面的這個(gè)圖中,就導(dǎo)致了并發(fā)用戶B也“搶購(gòu)成功”,多讓一個(gè)人獲得了商品。這種場(chǎng)景,在高并發(fā)的情況下非常容易出現(xiàn)。
2. 悲觀鎖思路
解決線程安全的思路很多,可以從“悲觀鎖”的方向開始討論。
悲觀鎖,也就是在修改數(shù)據(jù)的時(shí)候,采用鎖定狀態(tài),排斥外部請(qǐng)求的修改。遇到加鎖的狀態(tài),就必須等待。

雖然上述的方案的確解決了線程安全的問題,但是,別忘記,我們的場(chǎng)景是“高并發(fā)”。也就是說,會(huì)很多這樣的修改請(qǐng)求,每個(gè)請(qǐng)求都需要等待“鎖”,某些線程可能永遠(yuǎn)都沒有機(jī)會(huì)搶到這個(gè)“鎖”,這種請(qǐng)求就會(huì)死在那里。同時(shí),這種請(qǐng)求會(huì)很多,瞬間增大系統(tǒng)的平均響應(yīng)時(shí)間,結(jié)果是可用連接數(shù)被耗盡,系統(tǒng)陷入異常。
3. FIFO隊(duì)列思路
那好,那么我們稍微修改一下上面的場(chǎng)景,我們直接將請(qǐng)求放入隊(duì)列中的,采用FIFO(First Input First Output,先進(jìn)先出),這樣的話,我們就不會(huì)導(dǎo)致某些請(qǐng)求永遠(yuǎn)獲取不到鎖??吹竭@里,是不是有點(diǎn)強(qiáng)行將多線程變成單線程的感覺哈。

然后,我們現(xiàn)在解決了鎖的問題,全部請(qǐng)求采用“先進(jìn)先出”的隊(duì)列方式來處理。那么新的問題來了,高并發(fā)的場(chǎng)景下,因?yàn)檎?qǐng)求很多,很可能一瞬間將隊(duì)列內(nèi)存“撐爆”,然后系統(tǒng)又陷入到了異常狀態(tài)?;蛘咴O(shè)計(jì)一個(gè)極大的內(nèi)存隊(duì)列,也是一種方案,但是,系統(tǒng)處理完一個(gè)隊(duì)列內(nèi)請(qǐng)求的速度根本無法和瘋狂涌入隊(duì)列中的數(shù)目相比。也就是說,隊(duì)列內(nèi)的請(qǐng)求會(huì)越積累越多,最終Web系統(tǒng)平均響應(yīng)時(shí)候還是會(huì)大幅下降,系統(tǒng)還是陷入異常。
4. 樂觀鎖思路
這個(gè)時(shí)候,我們就可以討論一下“樂觀鎖”的思路了。樂觀鎖,是相對(duì)于“悲觀鎖”采用更為寬松的加鎖機(jī)制,大都是采用帶版本號(hào)(Version)更新。實(shí)現(xiàn)就是,這個(gè)數(shù)據(jù)所有請(qǐng)求都有資格去修改,但會(huì)獲得一個(gè)該數(shù)據(jù)的版本號(hào),只有版本號(hào)符合的才能更新成功,其他的返回?fù)屬?gòu)失敗。這樣的話,我們就不需要考慮隊(duì)列的問題,不過,它會(huì)增大CPU的計(jì)算開銷。但是,綜合來說,這是一個(gè)比較好的解決方案。

有很多軟件和服務(wù)都“樂觀鎖”功能的支持,例如Redis中的watch就是其中之一。通過這個(gè)實(shí)現(xiàn),我們保證了數(shù)據(jù)的安全。