被宕機(jī)撞了一下腰,看雙活如何保障業(yè)務(wù)連續(xù)性
近幾日,一系列網(wǎng)站宕機(jī)事件成為熱點話題,在令用戶揪心的互聯(lián)網(wǎng)金融交易受阻、旅行和酒店預(yù)定系統(tǒng)故障的背后,凸顯的問題是:隨著互聯(lián)網(wǎng)+深入滲透,如何實現(xiàn)業(yè)務(wù)連續(xù)運行、如何保障數(shù)據(jù)安全,這對置身其中的每個企業(yè)都意義重大。
“宕機(jī)”拷問數(shù)據(jù)保護(hù),業(yè)務(wù)連續(xù)性尤為重要
在這里,小編不去探討這些事件的起因是單純“挖斷光纖”的意外、是所謂的“程序猿操作失誤”、是一次不夠謹(jǐn)慎的應(yīng)用升級導(dǎo)致業(yè)務(wù)中斷、還是受到了網(wǎng)絡(luò)攻擊。
在網(wǎng)絡(luò)段子調(diào)侃不斷的同時,更需要深刻的認(rèn)識到,宕機(jī)導(dǎo)致業(yè)務(wù)中斷是企業(yè)普遍面臨的風(fēng)險,無論是近幾年微軟、亞馬遜等國際巨頭爆出的大規(guī)模宕機(jī)事件,還是今年年初微信遭遇平臺癱瘓的悲劇,業(yè)務(wù)中斷會嚴(yán)重影響用戶體驗,更對企業(yè)的經(jīng)濟(jì)及名譽(yù)造成巨大損失。
如何通過未雨綢繆,構(gòu)建領(lǐng)先的高可用方案,保護(hù)數(shù)據(jù)安全,保障業(yè)務(wù)連續(xù),降低企業(yè)的業(yè)務(wù)風(fēng)險,成了身在其中的每家企業(yè)需要認(rèn)真思考的課題。
亂花迷人眼,多種高可用方案如何選擇
其實多中心的業(yè)務(wù)平滑切換主要需要三方面的支撐:業(yè)務(wù)流程支撐,網(wǎng)絡(luò)訪問支撐以及數(shù)據(jù)一致性支撐,這其中數(shù)據(jù)一致性以及數(shù)據(jù)安全性是最重要的部分,這需要構(gòu)建一個穩(wěn)健并有效率的存儲高可用平臺來提供底層支撐。
企業(yè)級存儲高可用方案,一般有備份、容災(zāi)、雙活/多活、兩地三中心等。那么,企業(yè)怎么才能知道那種高可用方案適合公司的業(yè)務(wù)呢?
衡量企業(yè)高可用方案有兩個重要指標(biāo):RPO恢復(fù)點目標(biāo)和RTO恢復(fù)時間目標(biāo)。當(dāng)然啦,這兩個指標(biāo)是越低越好,說明企業(yè)的數(shù)據(jù)恢復(fù)速度快、業(yè)務(wù)連續(xù)性好,比如雙活方案的RTO可以做到等于0或約等于0,而RPO可做到小時級、分鐘級乃至秒級,能很好的保障業(yè)務(wù)連續(xù)性;但隨著這兩個指標(biāo)的降低,技術(shù)開發(fā)的邊際成本大幅上漲,企業(yè)的資金畢竟是有限,不可能任性的進(jìn)行數(shù)據(jù)保護(hù)的投資,而是要在業(yè)務(wù)連續(xù)性需求和投資成本上找到平衡點。
根據(jù)企業(yè)的業(yè)務(wù)規(guī)模和核心數(shù)據(jù)的重要程度,一般金融、稅務(wù)、電信等行業(yè)的大規(guī)模關(guān)鍵業(yè)務(wù)數(shù)據(jù)保護(hù),多采用雙活和兩地三中心方案,在業(yè)務(wù)連續(xù)性方面提供最高等級的保障;而對于中小規(guī)模的企業(yè)級數(shù)據(jù)保護(hù)、非關(guān)鍵業(yè)務(wù)數(shù)據(jù)保護(hù)或初始投資有限的項目,企業(yè)會采用高效、經(jīng)濟(jì)適用的備份和容災(zāi)方案,從小規(guī)模部署起步,逐步提升數(shù)據(jù)保護(hù)能力。
雙活,企業(yè)業(yè)務(wù)不再“躺槍”
第三方的調(diào)研數(shù)據(jù)顯示,90%的戰(zhàn)略型數(shù)據(jù)中心都已經(jīng)采用了雙活數(shù)據(jù)中心的配置。那么,雙活/多活方案有什么優(yōu)勢,能夠受到大規(guī)模企業(yè)業(yè)務(wù)連續(xù)性建設(shè)的青睞呢?
很簡單,建立雙活數(shù)據(jù)中心,是確保企業(yè)能夠在危險到來后,最低的標(biāo)準(zhǔn)是還能夠活著。
而對于業(yè)務(wù)“活著”的目標(biāo),業(yè)界的存儲雙活方案有多種實現(xiàn)方法,一是以EMC為代表的采用全局緩存一致性來實現(xiàn)雙活;第二種是國外一些科技公司采用的一種智能路由技術(shù):用IO拆分器實現(xiàn)數(shù)據(jù)同時寫兩份;對比來看第三種方法則更具先進(jìn)性:通過同步鏡像技術(shù),在兩個存儲設(shè)備之間同步存儲數(shù)據(jù),采用這種方案的有浪潮、華為等。
按照浪潮存儲資深產(chǎn)品經(jīng)理王剛的說法,“以AS8000為核心的浪潮存儲雙活技術(shù),可實現(xiàn)企業(yè)數(shù)據(jù)在數(shù)據(jù)中心內(nèi)部及之間實時共享和移動,并統(tǒng)一提供對外的數(shù)據(jù)訪問服務(wù),保證數(shù)據(jù)的可靠性及可用性。”
即使在一臺存儲設(shè)備或一個數(shù)據(jù)中心出現(xiàn)故障的情況下,雙活方案仍能確保業(yè)務(wù)連續(xù)性提供保障,給企業(yè)管理者踏踏實實的安全感。
以AS8000為核心構(gòu)建雙活方案
“三零”雙活,零感知數(shù)據(jù)遷移
與傳統(tǒng)的主-備方式的容災(zāi)解決方案不同,當(dāng)單數(shù)據(jù)中心存儲故障時,雙活方案中的存儲系統(tǒng)需要能夠?qū)崿F(xiàn)路徑訪問自動切換,同時受業(yè)務(wù)端軟件驅(qū)使,數(shù)據(jù)訪問需要自動切換到另一數(shù)據(jù)中心。最理想的狀態(tài)是,能在用戶無感知的情況下,實現(xiàn)了訪問另一個數(shù)據(jù)中心存儲數(shù)據(jù)的目的。
浪潮存儲資深產(chǎn)品經(jīng)理王剛表示,“浪潮以AS8000為核心的‘三零’存儲雙活方案,即故障零秒切換、零數(shù)據(jù)風(fēng)險和零資源浪費,可以協(xié)助用戶達(dá)到業(yè)界較高水平的數(shù)據(jù)中心業(yè)務(wù)連續(xù)性管理水平。”
當(dāng)單臺存儲故障時可以實現(xiàn)應(yīng)用無感知的切換,切換時間近乎零秒;基于緩存鏡像的數(shù)據(jù)同步方式,可以實現(xiàn)數(shù)據(jù)的一致同步,不存在傳輸時差導(dǎo)致的數(shù)據(jù)不完整;雙活中心意味著兩個中心設(shè)備同時工作,可均衡業(yè)務(wù)負(fù)載,有效提升存儲資源利用率,避免傳統(tǒng)的一主一備模式的資源浪費。
這樣,“三零”存儲方案,就解決了傳統(tǒng)災(zāi)備中心不能承載業(yè)務(wù)和業(yè)務(wù)無法自動切換的問題,同時提供亞毫秒級的響應(yīng)時間。
在“互聯(lián)網(wǎng)+”與電信、金融、政府、交通、能源、醫(yī)療等行業(yè)深度融合中,提供業(yè)務(wù)連續(xù)性保障。一些中等規(guī)模的企業(yè)客戶,也可以利用該方案很好地滿足對數(shù)據(jù)高增長的需求。
養(yǎng)成災(zāi)備“好習(xí)慣”,別忘找個“好伙伴”
我們的生活已經(jīng)與互聯(lián)網(wǎng),移動互聯(lián)網(wǎng)緊緊聯(lián)系在了一起,而說句實在的,不管是哪家數(shù)據(jù)中心宕機(jī),對于企業(yè)和用戶都是一個不幸的事件,而絕不應(yīng)止于網(wǎng)友們腦洞大開的調(diào)侃。
如何提升系統(tǒng)的穩(wěn)定性、安全性,如何做好突發(fā)事件的應(yīng)急預(yù)案,已成為互聯(lián)網(wǎng)和傳統(tǒng)企業(yè)都必須提上日程的當(dāng)務(wù)之急。
但是,保持業(yè)務(wù)連續(xù)性不是一個可以一勞永逸的事情,而是一個從方案到運維的慢慢征程,企業(yè)不僅需要把高頻度的“演練”的看成“習(xí)慣”,更需要選擇一個好合作伙伴,比如像浪潮,雙活方案無論從技術(shù)水平還是集成經(jīng)驗上都可圈可點,這對企業(yè)的業(yè)務(wù)連續(xù)性規(guī)劃、演練指導(dǎo)和應(yīng)急處理都非常重要。