消息總線真的能保證冪等?
一、緣起
如《消息總線消息必達(dá)》所述,MQ消息必達(dá),架構(gòu)上有兩個(gè)核心設(shè)計(jì)點(diǎn):
(1)消息落地
(2)消息超時(shí)、重傳、確認(rèn)
再次回顧消息總線核心架構(gòu),它由發(fā)送端、服務(wù)端、固化存儲(chǔ)、接收端四大部分組成。
為保證消息的可達(dá)性,超時(shí)、重傳、確認(rèn)機(jī)制可能導(dǎo)致消息總線、或者業(yè)務(wù)方收到重復(fù)的消息,從而對(duì)業(yè)務(wù)產(chǎn)生影響。
舉個(gè)栗子:
購(gòu)買(mǎi)會(huì)員卡,上游支付系統(tǒng)負(fù)責(zé)給用戶扣款,下游系統(tǒng)負(fù)責(zé)給用戶發(fā)卡,通過(guò)MQ異步通知。不管是上半場(chǎng)的ACK丟失,導(dǎo)致MQ收到重復(fù)的消息,還是下半場(chǎng)ACK丟失,導(dǎo)致購(gòu)卡系統(tǒng)收到重復(fù)的購(gòu)卡通知,都可能出現(xiàn),上游扣了一次錢(qián),下游發(fā)了多張卡。
消息總線的冪等性設(shè)計(jì)至關(guān)重要,是本文將要討論的重點(diǎn)。
二、上半場(chǎng)的冪等性設(shè)計(jì)
MQ消息發(fā)送上半場(chǎng),即上圖中的1-3
- 1,發(fā)送端MQ-client將消息發(fā)給服務(wù)端MQ-server
- 2,服務(wù)端MQ-server將消息落地
- 3,服務(wù)端MQ-server回ACK給發(fā)送端MQ-client
如果3丟失,發(fā)送端MQ-client超時(shí)后會(huì)重發(fā)消息,可能導(dǎo)致服務(wù)端MQ-server收到重復(fù)消息。
此時(shí)重發(fā)是MQ-client發(fā)起的,消息的處理是MQ-server,為了避免步驟2落地重復(fù)的消息,對(duì)每條消息,MQ系統(tǒng)內(nèi)部必須生成一個(gè)inner-msg-id,作為去重和冪等的依據(jù),這個(gè)內(nèi)部消息ID的特性是:
(1)全局***
(2)MQ生成,具備業(yè)務(wù)無(wú)關(guān)性,對(duì)消息發(fā)送方和消息接收方屏蔽
有了這個(gè)inner-msg-id,就能保證上半場(chǎng)重發(fā),也只有1條消息落到MQ-server的DB中,實(shí)現(xiàn)上半場(chǎng)冪等。
三、下半場(chǎng)的冪等性設(shè)計(jì)
MQ消息發(fā)送下半場(chǎng),即上圖中的4-6
- 4,服務(wù)端MQ-server將消息發(fā)給接收端MQ-client
- 5,接收端MQ-client回ACK給服務(wù)端
- 6,服務(wù)端MQ-server將落地消息刪除
需要強(qiáng)調(diào)的是,接收端MQ-client回ACK給服務(wù)端MQ-server,是消息消費(fèi)業(yè)務(wù)方的主動(dòng)調(diào)用行為,不能由MQ-client自動(dòng)發(fā)起,因?yàn)镸Q系統(tǒng)不知道消費(fèi)方什么時(shí)候真正消費(fèi)成功。
如果5丟失,服務(wù)端MQ-server超時(shí)后會(huì)重發(fā)消息,可能導(dǎo)致MQ-client收到重復(fù)的消息。
此時(shí)重發(fā)是MQ-server發(fā)起的,消息的處理是消息消費(fèi)業(yè)務(wù)方,消息重發(fā)勢(shì)必導(dǎo)致業(yè)務(wù)方重復(fù)消費(fèi)(上例中的一次付款,重復(fù)發(fā)卡),為了保證業(yè)務(wù)冪等性,業(yè)務(wù)消息體中,必須有一個(gè)biz-id,作為去重和冪等的依據(jù),這個(gè)業(yè)務(wù)ID的特性是:
(1)對(duì)于同一個(gè)業(yè)務(wù)場(chǎng)景,全局***
(2)由業(yè)務(wù)消息發(fā)送方生成,業(yè)務(wù)相關(guān),對(duì)MQ透明
(3)由業(yè)務(wù)消息消費(fèi)方負(fù)責(zé)判重,以保證冪等
最常見(jiàn)的業(yè)務(wù)ID有:支付ID,訂單ID,帖子ID等。
具體到支付購(gòu)卡場(chǎng)景,發(fā)送方必須將支付ID放到消息體中,消費(fèi)方必須對(duì)同一個(gè)支付ID進(jìn)行判重,保證購(gòu)卡的冪等。
有了這個(gè)業(yè)務(wù)ID,才能夠保證下半場(chǎng)消息消費(fèi)業(yè)務(wù)方即使收到重復(fù)消息,也只有1條消息被消費(fèi),保證了冪等。
三、總結(jié)
MQ為了保證消息必達(dá),消息上下半場(chǎng)均可能發(fā)送重復(fù)消息,如何保證消息的冪等性呢?
上半場(chǎng)
- MQ-client生成inner-msg-id,保證上半場(chǎng)冪等。
- 這個(gè)ID全局***,業(yè)務(wù)無(wú)關(guān),由MQ保證。
下半場(chǎng)
- 業(yè)務(wù)發(fā)送方帶入biz-id,業(yè)務(wù)接收方去重保證冪等。
- 這個(gè)ID對(duì)單業(yè)務(wù)***,業(yè)務(wù)相關(guān),對(duì)MQ透明。
結(jié)論:冪等性,不僅對(duì)MQ有要求,對(duì)業(yè)務(wù)上下游也有要求。
【本文為51CTO專欄作者“58沈劍”原創(chuàng)稿件,轉(zhuǎn)載請(qǐng)聯(lián)系原作者】