啥是2PC?在架構(gòu)設(shè)計(jì)中有什么用?
什么是2PC?
二階段提交2PC(Two phase Commit)是指,在分布式系統(tǒng)里,為了保證所有節(jié)點(diǎn)在進(jìn)行事務(wù)提交時(shí)保持一致性的一種協(xié)議算法。
為什么要引入2PC?
在分布式系統(tǒng)里,每個(gè)節(jié)點(diǎn)都可以知曉自己操作的成功或者失敗,卻無(wú)法知道其他節(jié)點(diǎn)操作的成功或失敗。
因此,當(dāng)一個(gè)事務(wù)跨越多個(gè)節(jié)點(diǎn)時(shí),為了保持事務(wù)的原子性與一致性,可行引入一個(gè)協(xié)調(diào)者(Coordinator)來(lái)統(tǒng)一掌控所有參與者(Participant)的操作結(jié)果,并指示它們是否要把操作結(jié)果進(jìn)行真正的提交(commit)或者回滾(rollback)。
而2PC,就是這個(gè)思路的一個(gè)落地實(shí)踐。
兩階段提交,是怎么個(gè)兩階段法?
2PC的實(shí)施思路可概括為:投票階段(voting phase)與提交階段(commit phase):
- 投票階段,參與者將操作結(jié)果通知協(xié)調(diào)者;
- 提交階段:收到參與者的通知后,協(xié)調(diào)者再向參與者發(fā)出通知,根據(jù)反饋情況決定各參與者是否要提交還是回滾。
2PC有什么不足?
答:在算法執(zhí)行過(guò)程中,所有節(jié)點(diǎn)都處于阻塞狀態(tài),所有節(jié)點(diǎn)所持有的資源(例如數(shù)據(jù)庫(kù)數(shù)據(jù),本地文件等)都處于封鎖狀態(tài)。
典型場(chǎng)景為:
- 某一個(gè)參與者確認(rèn)之前,所有參與者以及協(xié)調(diào)者都處于阻塞狀態(tài);
- 在協(xié)調(diào)者確認(rèn)之前,所有參與者都處于阻塞狀態(tài);
另外,如有協(xié)調(diào)者或者某個(gè)參與者出現(xiàn)了崩潰,為了避免整個(gè)算法處于一個(gè)完全阻塞狀態(tài),往往需要借助超時(shí)機(jī)制來(lái)將算法繼續(xù)向前推進(jìn),總的來(lái)說(shuō),2PC是一種比較保守的算法。
舉個(gè)例子:
甲乙丙丁四人要組織一個(gè)會(huì)議,需要確定會(huì)議時(shí)間,不妨設(shè)甲是協(xié)調(diào)者,乙丙丁是參與者。
投票階段:
- 甲發(fā)郵件給乙丙丁,周二十點(diǎn)開(kāi)會(huì)是否有時(shí)間;
- 甲回復(fù)有時(shí)間;
- 乙回復(fù)有時(shí)間;
- 丙遲遲不回復(fù),此時(shí)對(duì)于這個(gè)活動(dòng),甲乙丙均處于阻塞狀態(tài),算法無(wú)法繼續(xù)進(jìn)行;
- 丙回復(fù)有時(shí)間(或者沒(méi)有時(shí)間);
提交階段:
- 協(xié)調(diào)者甲將收集到的結(jié)果反饋給乙丙丁(什么時(shí)候反饋,以及反饋結(jié)果如何,在此例中取決于丙的時(shí)間與決定);
- 乙收到;
- 丙收到;
- 丁收到;
可以看到,當(dāng)出現(xiàn)極端情況時(shí),如果不借助超時(shí),整個(gè)活動(dòng)的推進(jìn)非常的低效。
這么多缺點(diǎn),那為什么2PC的應(yīng)用還這么廣泛呢?
- 其一,2PC原理簡(jiǎn)單,易于實(shí)現(xiàn);
- 其二,協(xié)調(diào)者有明確的控制權(quán),而不像paxos算法各節(jié)點(diǎn)平等,自選舉,自推進(jìn),不可控。明確可控在工程系統(tǒng)中相當(dāng)重要;
- 其三,能切實(shí)地解決微服務(wù)架構(gòu)中,很多本地邏輯與遠(yuǎn)程數(shù)據(jù)庫(kù),緩存,MQ分布式事務(wù)的實(shí)際問(wèn)題;
- 其四,它是一個(gè)非常通用的方案。
因此,它的使用非常廣泛。
知其然,知其所以然。
思路比結(jié)論更重要。