淺析云計算中的災(zāi)難恢復(fù)策略
有不少人對傳統(tǒng)離線的災(zāi)難恢復(fù)和云計算中的災(zāi)難恢復(fù)這兩個概念還存在著混淆。弄清楚其中的差異與恢復(fù)需求是維持一個固定災(zāi)難恢復(fù)策略的第一步。
無論是否是在云計算中實施災(zāi)難恢復(fù),一個成功災(zāi)難恢復(fù)計劃所包含的要素都是相同的:
1.用于災(zāi)難的計劃
2.記錄你的計劃
3.測試你的備份文件
4.修正任何存在的問題
5.再次測試,以確保你已解決了所有的問題
6.經(jīng)常性地重復(fù)上述步驟
最后一步的“重復(fù)”是讓災(zāi)難免于發(fā)生的關(guān)鍵所在。
災(zāi)難恢復(fù)技術(shù)已從基于磁帶的恢復(fù)技術(shù)和租用數(shù)據(jù)中心空間對重要服務(wù)進行恢復(fù)發(fā)展至即時地從發(fā)生故障的站點切換到虛擬的失效備援站點。在云計算災(zāi)難恢復(fù)供應(yīng)商如何管理離線組件,或他們?nèi)绾螌σ粋€IT環(huán)境實現(xiàn)云計算化方面是存在著差異的。有些人可能會說,他們相信災(zāi)難恢復(fù)可通過云計算實現(xiàn),而有些人則不這么認為。
大多數(shù)廠商將設(shè)備插入到客戶的IT基礎(chǔ)設(shè)施,以獲取信息并將其存儲在本地,然后復(fù)制到云中。在絕大多數(shù)情況下,事實上數(shù)據(jù)并不會存在于云中;實際上數(shù)據(jù)被轉(zhuǎn)移至供應(yīng)商的數(shù)據(jù)中心中。這一方法類似于傳統(tǒng)的備份解決方案。這一方法的本地化和高速可允許你從發(fā)生非災(zāi)難性數(shù)據(jù)丟失事件的設(shè)備中恢復(fù)數(shù)據(jù)。在將被保護站點離線的實際災(zāi)難事件中,離線數(shù)據(jù)通過互聯(lián)網(wǎng)重新上線。
一旦你了解到災(zāi)難事件中數(shù)據(jù)的位置,確定滿足公司需求的恢復(fù)點對象(RPO)和恢復(fù)時間對象(RTO)成為了IT團隊和業(yè)務(wù)經(jīng)理的首要任務(wù)。雖然可能有許多公司都要求“永遠在線、永不掉線”的運行,但是實際的預(yù)算和災(zāi)難發(fā)生概率都在時刻提醒他們,他們的這一需求是完全不必要的。最重要的是要制定出切實可行的災(zāi)難恢復(fù)目標。
對于那些依賴于技術(shù)創(chuàng)造價值的公司來說,一個零RPO/零RTO的準則同樣有效;為這個災(zāi)難恢復(fù)計劃支付費用是組成這一業(yè)務(wù)成本的一部分。而對于其他的公司,計算機網(wǎng)絡(luò)保險和高RPO/RTO就足夠了。業(yè)務(wù)規(guī)模越大,其組合復(fù)雜程度越高,同樣RPO和RTO需求的復(fù)雜程度也越高(從0/0到8小時/24小時設(shè)置,甚至于更為復(fù)雜24/24的需求。)
云計算選項中的災(zāi)難恢復(fù)
虛擬化是基于云計算災(zāi)難恢復(fù)技術(shù)的基礎(chǔ)。在這個過程之后,就成為了一個真正的云計算服務(wù)。諸如IBM公司、Iron Mountain公司、CommVault公司、Simply Continuous公司和AppAssure公司等主要供應(yīng)商提供了基于云計算的商業(yè)級災(zāi)難恢復(fù)產(chǎn)品,該產(chǎn)品旨在整合業(yè)務(wù)標準和流程、報告活動并可使IT團隊和業(yè)務(wù)單位了解產(chǎn)品狀態(tài)。
已創(chuàng)建用于恢復(fù)IT環(huán)境的虛擬機(VM)與你使用物理機器在專用設(shè)施中使用的虛擬機并無不同。其中唯一的差異在于這些虛擬機托管于一個第三方設(shè)施中并基本上從云中運行。當(dāng)被保護設(shè)施的指示燈熄滅,同時調(diào)用災(zāi)難協(xié)議,那些虛擬機替代了物理機器和虛擬機器——接管生產(chǎn)機器。
該方法是SLA友好的。能夠以可控的方式使用存儲災(zāi)難恢復(fù)數(shù)據(jù)和應(yīng)用程序的虛擬機。這一點可確保你管理系統(tǒng)能力和成本。如果一個業(yè)務(wù)單位基于Web訂單處理系統(tǒng)的RTO為四小時,而一個常用但不重要的客戶訂單歷史記錄歸檔系統(tǒng)RTO為48小時,那么服務(wù)水平協(xié)議將要求災(zāi)難恢復(fù)產(chǎn)品立即恢復(fù)基于Web的訂單處理系統(tǒng),并在其后恢復(fù)歷史記錄歸檔系統(tǒng)。這一機制保留了恢復(fù)服務(wù)的兩個目的:它降低了與任何時間相關(guān)的成本,并賦予忙碌的IT人員時間以確保首先滿足更為關(guān)鍵的SLA。
這一分階段恢復(fù)計劃還允許用于消除災(zāi)難的時間。當(dāng)然,還必須考慮到徹底破壞情況下的恢復(fù)計劃;但是,在大多數(shù)情況下,災(zāi)難是指一次簡單的失效。一旦發(fā)出失效命令并選中相關(guān)設(shè)施,你可能不需要為并不重要的SLA運行災(zāi)難恢復(fù)協(xié)議。