如何清除分布式存儲的危樓?
導(dǎo)讀:分布式存儲具有高擴展與可持續(xù)演進的特性,在超融合、Openstack私有云、大數(shù)據(jù)與AI領(lǐng)域中得到了廣泛的關(guān)注和應(yīng)用。然而,與基于傳統(tǒng)RAID技術(shù)的磁盤陣列相比,分布式存儲不僅在穩(wěn)定性與性能方面有差距,甚至可能成為數(shù)據(jù)安全的隱患,如同IT基礎(chǔ)架構(gòu)中的“危樓”。
序言:如果看見一群人住在危樓里,但卻對危險毫無所知,您會不會著急地大聲吶喊,希望人們盡快遠離危樓?而在分布式存儲領(lǐng)域,目前最流行的以Ceph為代表的三副本方案,就是存儲領(lǐng)域的“危樓”。
為什么?
著名的CAP原理是分布式系統(tǒng)最基本、最重要的理論之一,最初由加州柏克萊計算機科學(xué)家布魯爾教授在2000年提出猜想,兩年后由麻省理工的吉爾伯特和林奇教授證明。CAP原理的核心是:當(dāng)分布式系統(tǒng)出現(xiàn)網(wǎng)絡(luò)問題(Network Partition),人們只能在數(shù)據(jù)的一致性(Consistency)與可用性(Availability)二選一。
這意味著什么?
這意味著,在三副本系統(tǒng)中,當(dāng)網(wǎng)絡(luò)出現(xiàn)故障時,如果仍試圖維持業(yè)務(wù)在線,即選擇Availability(可用性),無論軟件設(shè)計多么巧妙,運維團隊多么優(yōu)秀,仍然無法保證數(shù)據(jù)副本之間的一致性,最終可能只有一個副本保持了最新數(shù)據(jù),即三副本在網(wǎng)絡(luò)不穩(wěn)定的情況下,將不可避免地降級為兩副本甚至單副本,成為無形中的“危樓”:一旦出現(xiàn)系統(tǒng)掉電或一個或多個硬盤損壞,很可能造成嚴重的數(shù)據(jù)丟失現(xiàn)象。
如何消除分布式存儲的危樓? 如何解決三副本的對數(shù)據(jù)安全帶來的潛在威脅?
南京道熵推出的雙重RAID架構(gòu)是徹底清消除上述“危樓”的有效方法。雙重RAID采用節(jié)點內(nèi)RAID數(shù)據(jù)保護技術(shù)與跨節(jié)點的網(wǎng)絡(luò)RAID技術(shù)相結(jié)合,將網(wǎng)絡(luò)副本或EC碼建立在節(jié)點內(nèi)RAID基礎(chǔ)之上,即使在出現(xiàn)網(wǎng)絡(luò)故障的情形下,依靠每個節(jié)點內(nèi)獨立的RAID數(shù)據(jù)保護,仍然可以保證數(shù)據(jù)無憂,有效解決分布式系統(tǒng)中因網(wǎng)絡(luò)故障而帶來的安全隱患。
總結(jié):
根據(jù)CAP定理,單純的網(wǎng)絡(luò)RAID,如三副本,無法徹底解決分布式系統(tǒng)中的數(shù)據(jù)一致性問題,無形中導(dǎo)致IT基礎(chǔ)架構(gòu)領(lǐng)域的“危樓”。雙重RAID架構(gòu),將成為分布式存儲最可靠的選擇。