災(zāi)備世界:深入其中才知水有多深
自云計算、大數(shù)據(jù)、物聯(lián)網(wǎng)等技術(shù)的崛起,企業(yè)在從新技術(shù)中受益的同時,也面臨著前不斷出現(xiàn)的新問題,其中安全是最大的一個問題。每年我們都會聽到幾例云宕機(jī)、網(wǎng)站受的攻擊、數(shù)據(jù)泄漏的事件。
安全問題是必然事件
2015年5月,對于企業(yè)來說真的是“一片黑色”,各大企業(yè)組團(tuán)發(fā)生安全事件,從陌陌網(wǎng)絡(luò)故障無正常運行、到因骨干網(wǎng)絡(luò)異常,網(wǎng)易旗下游戲、有道云筆記無法運行,再到因光纜被斷,導(dǎo)致支付寶大面積癱瘓、最后再到攜程由于員工失誤刪除數(shù)據(jù),導(dǎo)致官方網(wǎng)站及應(yīng)用近12小時無法使用,直接損失超過7,400多萬元。2016年,一月中旬清華大學(xué)網(wǎng)站遭IS黑客攻擊,服務(wù)器全部停機(jī);7月6日,國內(nèi)最大公有云提供商阿里云華北2區(qū)網(wǎng)絡(luò)故障導(dǎo)致業(yè)務(wù)中斷一小時。
這些案例讓我們清楚地意識到,安全問題的產(chǎn)生是一件必然事件——無論是大公司還是小企業(yè)都無法避免;安全事件的發(fā)生也讓人防不勝防,且花樣百出——有自然的、有人為的,有內(nèi)部的,也有外部的原因。針對所有這些安全事件,企業(yè)可以做的就是建立自己的災(zāi)備系統(tǒng),即使事故發(fā)生,我們?nèi)匀挥袀溆梅桨福匀豢梢跃S持業(yè)務(wù)的正常運行。
然而,我想說的是,“災(zāi)備不是想做,想做就能做;要你明白,要你研究,放手才能做”。只有全面了解,深入研究,才能感知災(zāi)備的真諦,才能做出更好的災(zāi)難防護(hù)。
災(zāi)備的思考
災(zāi)備一詞,有許多人都錯誤地理解它為災(zāi)難備份的縮略詞;事實上災(zāi)備的真正意義包含兩層意思:災(zāi)難前的備份與災(zāi)難后恢復(fù)。人們往往只注意到了備份,而忽略了恢復(fù)的重要性,導(dǎo)致災(zāi)難發(fā)生后系統(tǒng)、數(shù)據(jù)無法恢復(fù)如初。近日, 專注于容災(zāi)及業(yè)務(wù)高可用領(lǐng)域的科技企業(yè)英方股份發(fā)布了《2016 年中國災(zāi)備技術(shù)和行業(yè)白皮書》。書中明確定義的了災(zāi)備的含義,指出災(zāi)備五大主流技術(shù):
五大災(zāi)備技術(shù)
數(shù)據(jù)復(fù)制技術(shù):該技術(shù)是容災(zāi)方案設(shè)計中最基本、最核心的技術(shù),主要分為基于數(shù)據(jù)庫/應(yīng)用的復(fù)制、基于主機(jī)的數(shù)據(jù)復(fù)制、基于存儲網(wǎng)絡(luò)的數(shù)據(jù)復(fù)制、基于存儲的數(shù)據(jù)復(fù)制。
切換技術(shù):切換是指在早前支行系統(tǒng)故障或異常終止后,能夠自動切換到冗余或備用信息系統(tǒng)的能力。根據(jù)具體突發(fā)故障的不同,切換可以分為網(wǎng)絡(luò)切換和應(yīng)用切換。另外,災(zāi)備的切換是一系列操作的組合,不是單一技術(shù)動作,并且由于“容災(zāi)黑盒”的存在,其切換的決策難度難度非常大,不能根據(jù)單一的個人意愿,需要集體進(jìn)行決策。
重復(fù)數(shù)據(jù)刪除技術(shù):在災(zāi)備存儲中已經(jīng)大量應(yīng)用了基于磁盤的重復(fù)數(shù)據(jù)刪除技術(shù)。該技術(shù)通過尋找不同數(shù)據(jù)塊中的冗余數(shù)據(jù),并通過刪除這些重復(fù)數(shù)據(jù)來對數(shù)據(jù)進(jìn)行壓縮,不僅節(jié)省一數(shù)據(jù)中心的空間,還減少了傳輸備份數(shù)據(jù)所需要的帶寬。重復(fù)數(shù)據(jù)刪除技術(shù)主要分為基于軟件的重復(fù)數(shù)據(jù)刪除和基于硬件的重復(fù)數(shù)據(jù)刪除兩種方式。
數(shù)據(jù)加密與傳輸技術(shù):數(shù)據(jù)級災(zāi)備往往依托于多部門、多單位,甚至跨系統(tǒng)的統(tǒng)合協(xié)作,因此數(shù)據(jù)在傳輸過程或存儲介質(zhì)上的安全性問題也格外引人注意。目前針對數(shù)據(jù)的加密方式主要有兩大類,即源端加密和傳輸加密。
數(shù)據(jù)存儲技術(shù):從定義來看,存儲和災(zāi)備并不屬于同一領(lǐng)域,但災(zāi)備技術(shù)是基于存儲技術(shù)而發(fā)展的,數(shù)據(jù)備份的過程也必須涉及到數(shù)據(jù)的存儲過程。目前,常見的存儲方式包含:DAS直播附加存儲、SAN存儲區(qū)域網(wǎng)絡(luò)、NAS網(wǎng)絡(luò)附加存儲、OBS對象存儲等。
云災(zāi)備
除了上面提到五項技術(shù)外,隨著技術(shù)的不斷發(fā)展,災(zāi)備技術(shù)也在不斷地創(chuàng)新。虛擬化技術(shù)、開源技術(shù),和超融合等新型技術(shù),也推動著災(zāi)備行業(yè)的向前發(fā)展,同時也出現(xiàn)了新的災(zāi)備模式——云災(zāi)備。
云災(zāi)備是一種全新的災(zāi)備服務(wù)模式,主要包括傳統(tǒng)物理主機(jī)、虛擬主機(jī)等IT系統(tǒng),向私有云或公有云等云端化災(zāi)備的趨勢,以及新業(yè)務(wù)形態(tài)下,災(zāi)備端云化,云與云之間的災(zāi)備等。它不僅包含傳統(tǒng)的數(shù)據(jù)存儲和定時復(fù)制,還包括了數(shù)據(jù)實時傳輸、遷移和應(yīng)用切換,從而保證災(zāi)備端應(yīng)急接管理業(yè)務(wù)應(yīng)用等等范疇。
根據(jù)云計算的不同模式,云災(zāi)備也有幾個不同的業(yè)務(wù)模式:SaaS層災(zāi)備、PaaS層災(zāi)備、IaaS層災(zāi)備和DRaaS(災(zāi)難恢復(fù)即服務(wù))。利用云災(zāi)備,企業(yè)可獲得五大優(yōu)勢:減少基礎(chǔ)設(shè)施、按需付費降低IT成本、高度機(jī)動性和靈活性、快速恢復(fù)和安全備份,以及大量的支持服務(wù)。
英方首創(chuàng)了災(zāi)備全生態(tài)理念:以往單一的災(zāi)備技術(shù)已經(jīng)發(fā)展成一個集信息存儲、 信息傳輸、數(shù)據(jù)安全等多個方面于一體的綜合性 IT 技 術(shù) ,同時 ,不同的災(zāi)備技術(shù)也必須依賴更高維度的生 態(tài)系統(tǒng)管理予以有效整合。從災(zāi)備管理的便捷性 ,降低運維成本的角度出發(fā) , 能夠提供基于統(tǒng)一災(zāi)備平臺 ,實現(xiàn)對各類業(yè)務(wù)數(shù)據(jù)進(jìn) 行實時或定時數(shù)據(jù)災(zāi)備、兼容各類操作系統(tǒng)、同時能 夠滿足本地災(zāi)備或異地及云災(zāi)備的全生態(tài)災(zāi)備技術(shù)將 大受歡迎。
災(zāi)備建設(shè)三步曲
英方股份CTO周華說,“災(zāi)備的架構(gòu)比較開放,不是某一個廠商或某幾個廠商能支撐起來的領(lǐng)域。這是需要大家一起來建設(shè)的一個生態(tài)系統(tǒng),包括所有廠商,以及知識體系共享建設(shè)的一個生態(tài)。”
因此,在了解了災(zāi)備的含義、災(zāi)備所需要的技術(shù),以及新型云災(zāi)備后,企業(yè)就應(yīng)該著手進(jìn)行災(zāi)備建設(shè)了。在英方看來,災(zāi)備的建設(shè)有三個步驟,即業(yè)務(wù)連續(xù)性規(guī)劃、災(zāi)備規(guī)劃、災(zāi)備方案設(shè)計和實施。只有做到專業(yè)性實施,且服務(wù)體系全面,才能得到用戶的認(rèn)同。
首先,災(zāi)備建設(shè)的最終目的就是要保護(hù)業(yè)務(wù)的連續(xù)性運行,其具體要求需要通過進(jìn)行業(yè)務(wù)連續(xù)性規(guī)劃來確定。沒有業(yè)務(wù)連續(xù)性規(guī)劃,災(zāi)備建設(shè)就沒有意義,充其量只能做到數(shù)據(jù)不丟失,而不能恢復(fù)業(yè)務(wù)運行,所以保障業(yè)務(wù)連接性運行是災(zāi)備建設(shè)的重中之中。
其次,災(zāi)備規(guī)劃采用的方法與業(yè)務(wù)連續(xù)性規(guī)劃的方法基本一致,主要區(qū)別在于前者針對的是支持業(yè)務(wù)運行的IT應(yīng)用和系統(tǒng),后者主要關(guān)注的業(yè)務(wù)流程。通過災(zāi)備規(guī)劃,確定所有支持業(yè)務(wù)運行的IT系統(tǒng)的各項恢復(fù)指標(biāo),并制定IT系統(tǒng)的恢復(fù)策略,以及IT系統(tǒng)的恢復(fù)計劃。
最后,根據(jù)災(zāi)備規(guī)劃對支持業(yè)務(wù)運行的IT系統(tǒng)提出的恢復(fù)要求和恢復(fù)策略,來設(shè)計災(zāi)難恢復(fù)技術(shù)方案,例如同城災(zāi)備,異地災(zāi)備、兩地三中心、雙活,云災(zāi)備等。災(zāi)備方案的實施是確保所設(shè)計的災(zāi)備方案真正有效的重要環(huán)節(jié),需要制定詳細(xì)的工作計劃,包括場地選址、產(chǎn)品先型、服務(wù)商選擇、資源保障、項目管理、驗收評審、演練測試等等內(nèi)容。同時,還應(yīng)該根據(jù)災(zāi)備計劃,確保各個部門在災(zāi)難發(fā)生時能夠統(tǒng)一協(xié)調(diào)地行動。
結(jié)語:
有了技術(shù)、有了方法與步驟,相信《2016 年中國災(zāi)備技術(shù)和行業(yè)白皮書》 能在企業(yè)構(gòu)建災(zāi)備過程給出一定的指導(dǎo)意義。另外,英方股份也給用戶提供了現(xiàn)成的解決方案,例如,英方數(shù)據(jù)分發(fā)產(chǎn)品 i2Distributor在多家證券公司的第四代、第五代行情分發(fā)里成功上線運營;英方 i2Availibility 解決方案,幫助企業(yè)關(guān)鍵系統(tǒng)實現(xiàn)業(yè)務(wù)本地高可用及數(shù)據(jù)異地容災(zāi)。
未來,中國災(zāi)備市場也將趨勢于成熟,趨于完善;我們也期待未來的因為有了災(zāi)備系統(tǒng)的支持,企業(yè)業(yè)務(wù)不會再現(xiàn)在面積癱瘓的問題。