在分布式系統(tǒng)里看CAP定理
計算機界有很多高大上又難于理解的術(shù)語,CAP就是其中之一, 什么一致性(Consistency), 可用性(Availability), 分區(qū)容錯性(Partition tolerance) 就很難理解了, 再加上CAP定理更是讓人云里霧里, 今天咱們試圖通俗的演繹一下。
張大胖在公司奮發(fā)圖強,經(jīng)過多年的努力,終于做到了架構(gòu)師的位置。
架構(gòu)師的椅子還沒坐熱,很快就來了一個項目要做架構(gòu)設計。
老板把大胖叫來,諄諄教導說: 大胖啊, 數(shù)據(jù)是我們的寶貴資產(chǎn),你設計的系統(tǒng)可千萬要保證數(shù)據(jù)不能丟失啊!
大胖說老板放心, 這方面我有經(jīng)驗, 一般來講我們要做數(shù)據(jù)的冗余處理, 簡單的來講就是給數(shù)據(jù)做多個副本來保存。 我會設計一個分布式系統(tǒng), 把數(shù)據(jù)備份到多個機器節(jié)點去。
幾天后, 大胖給發(fā)了一張圖, 展示了這個分布式系統(tǒng)是怎么工作的:
數(shù)據(jù)副本在不同的機器上做冗余, 中間有數(shù)據(jù)的復制, 保證數(shù)據(jù)的同步。
雖然只是兩臺機器, 但是也構(gòu)成了一個簡單的分布式環(huán)境。
老板雖然不懂技術(shù), 但是看到數(shù)據(jù)在不同的機器之間有備份,也就放心了。
經(jīng)過幾個月的開發(fā)和測試,系統(tǒng)順利上線, 但是大家很快就發(fā)現(xiàn): 分布式系統(tǒng)不像單機系統(tǒng)那么簡單, 由于網(wǎng)絡的原因, 或者某個機器的原因很容易導致通訊失敗,或者節(jié)點不可用。
有一天, 用戶先訪問了左邊的機器A , 寫入了一條數(shù)據(jù), 然后機器A很不幸, 網(wǎng)線被悲催的網(wǎng)管給踢掉了, 這直接導致了兩個嚴重的后果:
1. 負載均衡找不著機器A,認為它死翹翹了, 就要把用戶的下一次訪問轉(zhuǎn)到機器B去。
2. 數(shù)據(jù)復制也找不著機器A , 只好罷工。 用戶剛寫入的數(shù)據(jù)沒法復制到機器B,機器B上還是老數(shù)據(jù)
怎么辦? 雖然這是一次偶然, 把網(wǎng)管臭罵一頓, 插上網(wǎng)線就可以了, 但是誰能保證以后兩個機器的通信是一致暢通的呢?
組里的小王說: 我們的機器B 還活著呢, 還能提供服務, 數(shù)據(jù)復制不到機器B, 不就是少看幾條數(shù)據(jù)嘛, 無傷大雅,不影響大局, 勉強可用, 插上網(wǎng)線后數(shù)據(jù)復制就會工作, 一切就會恢復正常。
小王無意中選擇了系統(tǒng)的可用性(Availability,簡稱A), 系統(tǒng)能提供服務就好, 數(shù)據(jù)不一致可以忍受。
張大胖說: 不行, 老板說了,我們系統(tǒng)的數(shù)據(jù)極為重要, 數(shù)據(jù)如果不一致會帶來嚴重后果,所以機器B上的和這些關(guān)鍵數(shù)據(jù)相關(guān)的功能也必須停掉, 必須等到機器A插上網(wǎng)線,數(shù)據(jù)同步以后才能開工
很明顯, 張大胖遵循老板指示, 把一致性(Consistency, 簡稱C )放到了首位。
所以問題就很明顯了, 在網(wǎng)絡節(jié)點之間無法通信的情況下, 和數(shù)據(jù)復制相關(guān)的功能, 要么選擇可用性(A) , 要么選擇一致性(C), 不能同時選擇兩者。
大胖仔細思考了一下, 其實這兩種選擇的背后其實隱藏著另外一個事實, 那就是網(wǎng)絡節(jié)點之間無法通信的情況下, 節(jié)點被隔離,產(chǎn)生了網(wǎng)絡分區(qū), 整個系統(tǒng)仍然是可以工作的, 大胖給它起了個名: 分區(qū)容錯性(Partition tolerance, 簡稱P)。
如果選擇了可用性(A) + 分區(qū)容錯性(P) , 就要放棄一致性(C)。
如果選在一致性(C) + 分區(qū)容錯性(P) , 就得放棄可用性(A) , 對了, 這種情況下,雖然系統(tǒng)的有些功能是不能使用的, 因為需要等待數(shù)據(jù)的同步, 但是那些和數(shù)據(jù)同步無關(guān)的功能還是可以訪問的 , 相當于系統(tǒng)做了功能的降級。
既然有AP和CP, 會不會出現(xiàn)僅僅是CA(一致性+可用性)這種組合呢? 就是沒有分區(qū)容錯性, 只保留可用性和一致性? 仔細想想, 這種情況其實就退化成了單機應用, 沒有意義了。
大胖覺得自己似乎發(fā)現(xiàn)了一個規(guī)律: 在一個分布式計算機系統(tǒng)中,一致性(C),可用性(A)和分區(qū)容錯性(P) 這三種保證無法同時得到滿足,最多滿足兩個。
他決定把找個規(guī)律叫做CAP定理, 聽起來比較高大上, 顯得自己高深莫測。
如果你實在是搞不懂這CAP, 張大胖會告訴你一個更容易理解的版本: 在一個分布式系統(tǒng)中, 在出現(xiàn)節(jié)點之間無法通信(網(wǎng)絡分區(qū)產(chǎn)生), 你只能選擇 可用性 或者 一致性, 沒法同時選擇他們。
【本文為51CTO專欄作者“劉欣”的原創(chuàng)稿件,轉(zhuǎn)載請通過作者微信公眾號coderising獲取授權(quán)】