一體化雙活解決方案如何保障關(guān)鍵業(yè)務(wù)實(shí)時(shí)在線
移動(dòng)互聯(lián)、云計(jì)算、大數(shù)據(jù)使得企業(yè)面臨著結(jié)構(gòu)化與非結(jié)構(gòu)化數(shù)據(jù)并存的系統(tǒng)場(chǎng)景;同時(shí),企業(yè)業(yè)務(wù)越來越不能忍受系統(tǒng)故障,例如金融等行業(yè),業(yè)務(wù)中斷一小時(shí)意味著數(shù)百萬(wàn)美元的損失。在這樣的需求背景下,一體化雙活數(shù)據(jù)中心方案應(yīng)運(yùn)而生。
各行業(yè)每小時(shí)停機(jī)造成的損失
一體化雙活的誕生
數(shù)據(jù)高度集中的傳統(tǒng)數(shù)據(jù)中心所面臨的風(fēng)險(xiǎn)和威脅非常多,故障影響范圍變得越來越廣。主備數(shù)據(jù)中心是一個(gè)主流的容災(zāi)方案,業(yè)務(wù)部署于其中一個(gè)數(shù)據(jù)中心中,而另一個(gè)作為備用,當(dāng)主數(shù)據(jù)中心故障,管理員需要將業(yè)務(wù)遷至備用數(shù)據(jù)中心上。系統(tǒng)故障后業(yè)務(wù)恢復(fù)操作復(fù)雜,中斷時(shí)間長(zhǎng)。對(duì)于分秒必爭(zhēng)的企業(yè)來講,這是無法容忍的。
而雙活數(shù)據(jù)中心不再單一的從提高系統(tǒng)組件高可靠性上思考,而是從業(yè)務(wù)連續(xù)的角度,高效利用網(wǎng)絡(luò)資源、計(jì)算以及存儲(chǔ)資源,設(shè)置兩個(gè)數(shù)據(jù)始終一致的數(shù)據(jù)中心,為上層應(yīng)用提供服務(wù)。如此一來,當(dāng)其中一個(gè)站點(diǎn)發(fā)生故障,另一站點(diǎn)仍然能夠繼續(xù)為業(yè)務(wù)提供服務(wù),端到端實(shí)時(shí)可用,容災(zāi)切換也是自動(dòng)實(shí)現(xiàn)的。
早期的雙活數(shù)據(jù)中心以SAN雙活為主,其中又有網(wǎng)關(guān)和陣列雙活等實(shí)現(xiàn)方式,隨著NAS的發(fā)展,NAS雙活也成為雙活數(shù)據(jù)中心的一個(gè)重要分支。事實(shí)上,以醫(yī)院為例,對(duì)HIS和PACS信息系統(tǒng)的依賴加大。HIS信息系統(tǒng)的數(shù)據(jù)庫(kù)數(shù)據(jù)采用SAN保存,而PACS系統(tǒng)的影像文件采用NAS保存。針對(duì)同時(shí)要求數(shù)據(jù)庫(kù)與文件關(guān)鍵業(yè)務(wù)存儲(chǔ)系統(tǒng)同時(shí)高可用的需求,所以需要融合SAN雙活和NAS雙活于一身的雙活數(shù)據(jù)中心,才能保障業(yè)務(wù)連續(xù)。
華為HyperMetro SAN與NAS一體化雙活解決方案
針對(duì)醫(yī)院、制造、政府等行業(yè)客戶要求數(shù)據(jù)庫(kù)與文件關(guān)鍵業(yè)務(wù)存儲(chǔ)系統(tǒng)同時(shí)要滿足高可用的需求,華為推出HyperMetro SAN與NAS一體化雙活解決方案,為數(shù)據(jù)中心關(guān)鍵業(yè)務(wù)提供7*24小時(shí)服務(wù)保障。
華為HyperMetro SAN與NAS一體化雙活解決方案
華為一體化雙活解決方案,具有渾然一體和化繁為簡(jiǎn)的兩大特點(diǎn)
- 華為的一體化雙活解決方案設(shè)計(jì)可謂渾然一體:一臺(tái)設(shè)備+一套仲裁+一種網(wǎng)絡(luò)就可以搞定
首先是一臺(tái)設(shè)備。借助OceanStor V3融合架構(gòu),華為一體化雙活方案采用免網(wǎng)關(guān)的架構(gòu),一臺(tái)設(shè)備即可同時(shí)提供SAN和NAS雙活服務(wù)。設(shè)備數(shù)量減少2臺(tái)以上,同時(shí)提升了系統(tǒng)整體性能。
其次是一套仲裁。共用一套仲裁,統(tǒng)一的仲裁機(jī)制確保仲裁結(jié)果始終一致,從而保證SAN和NAS同時(shí)在一套設(shè)備上提供服務(wù)。這一設(shè)計(jì)規(guī)避了傳統(tǒng)雙活方案兩套仲裁機(jī)制在站點(diǎn)間網(wǎng)絡(luò)故障后,出現(xiàn)仲裁結(jié)果不一致的問題。
***是一種網(wǎng)絡(luò)。僅需要一種網(wǎng)絡(luò)(IP或者FC)就可以滿足站點(diǎn)心跳、配置、復(fù)制鏈路等需求,此外,業(yè)務(wù)網(wǎng)絡(luò)、站點(diǎn)間網(wǎng)絡(luò)以及仲裁網(wǎng)絡(luò)均可以使用IP進(jìn)行部署,組網(wǎng)和網(wǎng)絡(luò)管理操作簡(jiǎn)單。
- 化繁為簡(jiǎn)的一體化雙活方案:升級(jí)、恢復(fù)和擴(kuò)展都很簡(jiǎn)單
升級(jí)簡(jiǎn)單:可實(shí)現(xiàn)單套設(shè)備在線平滑升級(jí)到雙活,甚至擴(kuò)展到兩地三中心,提供更高級(jí)別的數(shù)據(jù)保護(hù)服務(wù)。
恢復(fù)簡(jiǎn)單:支持自動(dòng)恢復(fù)雙活關(guān)系,當(dāng)故障設(shè)備修復(fù)后,無需人工進(jìn)行干預(yù)即可恢復(fù)雙活關(guān)系,實(shí)現(xiàn)運(yùn)維自動(dòng)化。
擴(kuò)展簡(jiǎn)單:***可在線擴(kuò)展至32節(jié)點(diǎn),滿足客戶業(yè)務(wù)不斷增長(zhǎng)的存儲(chǔ)性能訴求。
那華為一體化雙活方案SAN和NAS的讀寫流程是怎樣的呢?是如何做到數(shù)據(jù)一致性的呢?讓我們?cè)敿?xì)剖析一下。
SAN的讀寫流程
下圖展示了一個(gè)I/O的處理流程。主機(jī)下發(fā)I/O到雙活管理模塊,系統(tǒng)記錄日志。之后雙活管理模塊將I/O同時(shí)寫入本端和遠(yuǎn)端Cache并收集兩端Cache的寫處理結(jié)果。如果寫成功則清除日志,如果失敗,日志則轉(zhuǎn)換成為DCL(Data Change Log)并記錄本端LUN與遠(yuǎn)端LUN差異。
一體化雙活寫請(qǐng)求流程(LUN)
與SAN的寫操作類似,文件的寫則是將寫請(qǐng)求先下發(fā)到文件系統(tǒng),文件系統(tǒng)再將請(qǐng)求下發(fā)給雙活管理模塊。在HyperMetro收到雙端Cache寫請(qǐng)求結(jié)果之后再將結(jié)果返回到文件系統(tǒng)。
正常情況下,任意應(yīng)用I/O都需要同時(shí)寫到兩端陣列才能返回主機(jī),確保兩個(gè)數(shù)據(jù)中心的數(shù)據(jù)實(shí)時(shí)一致。當(dāng)其中一端寫I/O異常,那么雙活管理模塊會(huì)通過DCL進(jìn)行記錄,站點(diǎn)修復(fù)之后再依據(jù)DCL將數(shù)據(jù)增量寫入存儲(chǔ)。整個(gè)過程無需人工進(jìn)行干預(yù)即可恢復(fù)雙活關(guān)系,實(shí)現(xiàn)運(yùn)維自動(dòng)化。
一體化雙活寫請(qǐng)求流程(FS)
為了保障雙活數(shù)據(jù)中心的數(shù)據(jù)始終一致,設(shè)計(jì)了分布式鎖機(jī)制(DLM),一方面任何控制器訪問數(shù)據(jù)之前都需要申請(qǐng)這個(gè)全局的鎖,另一方面其他控制器無法對(duì)存在鎖保護(hù)的地址進(jìn)行訪問操作,這就保障了同一地址上的數(shù)據(jù)不會(huì)出現(xiàn)訪問沖突。
單點(diǎn)故障時(shí),另一站點(diǎn)會(huì)自動(dòng)接管所有請(qǐng)求,如果仲裁服務(wù)器故障,系統(tǒng)也會(huì)自動(dòng)進(jìn)入靜態(tài)優(yōu)先模式,所以不會(huì)影響業(yè)務(wù);雙點(diǎn)故障較為復(fù)雜,在仲裁服務(wù)器、優(yōu)先站點(diǎn)、非優(yōu)先站點(diǎn)以及三者之間的鏈路出現(xiàn)雙點(diǎn)故障時(shí),系統(tǒng)同樣會(huì)通過靜態(tài)優(yōu)先等方式繼續(xù)為應(yīng)用提供服務(wù),大部分雙點(diǎn)不會(huì)影響業(yè)務(wù)連續(xù)性。
華為一體化雙活方案可以實(shí)現(xiàn)大部分的非典型故障自動(dòng)恢復(fù),用戶無需進(jìn)行過多配置操作。
分布式鎖機(jī)制(DLM)
在比利時(shí)Saint-LUC(UCL)醫(yī)院,華為為客戶提供300公里內(nèi)的端到端雙活數(shù)據(jù)中心解決方案,確保業(yè)務(wù)系統(tǒng)發(fā)生設(shè)備故障、甚至單數(shù)據(jù)中心故障時(shí),業(yè)務(wù)自動(dòng)切換,上層應(yīng)用無感知,確保業(yè)務(wù)永續(xù)。
隨著企業(yè)業(yè)務(wù)復(fù)雜度的不斷提升,業(yè)務(wù)中斷和數(shù)據(jù)丟失的風(fēng)險(xiǎn)越來越大。華為一體化雙活解決方案,可以確保數(shù)據(jù)庫(kù)與文件業(yè)務(wù)實(shí)時(shí)在線,并且通過統(tǒng)一管理平臺(tái)實(shí)現(xiàn)了簡(jiǎn)易運(yùn)維。更為重要的是,不論單點(diǎn)故障還是雙點(diǎn)故障,都能夠***限度的縮短恢復(fù)時(shí)間,通過充分的自動(dòng)化設(shè)計(jì)提高系統(tǒng)恢復(fù)效率,全面保障企業(yè)業(yè)務(wù)永續(xù)。目前,華為一體化雙活解決方案在金融電子影像、公安警務(wù)綜合系統(tǒng)、檢察院電子檢務(wù)等場(chǎng)景下均有著廣泛的應(yīng)用。
全文結(jié)束--