災(zāi)難恢復(fù)計(jì)劃 數(shù)據(jù)中心不可忽視
在一個(gè)數(shù)據(jù)中心里,某個(gè)地方發(fā)生了火災(zāi),并迅速蔓延到了距離服務(wù)器只有幾個(gè)房間的地方。盡管數(shù)據(jù)中心的消防部門在不到10鐘內(nèi)撲滅了火災(zāi),服務(wù)器安然無恙。但是冷卻和電力等基礎(chǔ)設(shè)施卻被全部損壞,甚至一些連接到服務(wù)器的線路也受到波及。在接下來的幾個(gè)星期里,這個(gè)數(shù)據(jù)中心都不能正常的工作。
于是,在接下來的時(shí)候,由于沒有服務(wù)器能夠工作,無法正常的和客戶聯(lián)系,這意味著企業(yè)將的業(yè)務(wù)會(huì)受到嚴(yán)重的影響。而在IT部門,似乎沒人知道如何讓備份的系統(tǒng)以及應(yīng)用程序工作。可能首席技術(shù)官知道,但災(zāi)備計(jì)劃是幾年前完成的,他也不清楚其中的細(xì)節(jié)。而制定那個(gè)計(jì)劃的人卻在西藏登山,通過電話和電子郵件顯然不能夠讓數(shù)據(jù)中心更好的恢復(fù)正常工作。
這并不是一個(gè)不著邊際的假設(shè),而是一個(gè)隨時(shí)可能發(fā)生的情況。由此可見,建立一個(gè)完整的災(zāi)備計(jì)劃并認(rèn)真的執(zhí)行是多么的重要。即使出現(xiàn)了最壞的的情況,企業(yè)的服務(wù)器也能夠快速的恢復(fù)正常運(yùn)行。#p#
確定優(yōu)先級(jí)
由于應(yīng)用程序和數(shù)據(jù)的重要性的不同,因此災(zāi)備計(jì)劃應(yīng)該考慮在災(zāi)難發(fā)生的時(shí)候哪些應(yīng)該優(yōu)先得到恢復(fù)。在規(guī)劃災(zāi)備計(jì)劃的同時(shí)應(yīng)該選擇那些優(yōu)先恢復(fù)的服務(wù)器,來盡量減少客戶等待的時(shí)間。如果有10臺(tái)服務(wù)器,可能有3臺(tái)服務(wù)器上運(yùn)行著關(guān)鍵性的任務(wù),需要24小時(shí)運(yùn)行。但有些服務(wù)器就不太重要,即使關(guān)掉幾天,對(duì)企業(yè)的業(yè)務(wù)也不會(huì)產(chǎn)生什么影響。
而劃分這個(gè)優(yōu)先順序也包括收集除了IT部門以外其他部門的服務(wù)器使用狀況。即使IT部門以及客戶的服務(wù)器全部恢復(fù)了正常,但收發(fā)郵件的服務(wù)器卻沒能恢復(fù)工作,那么其他部門也不能正常工作,甚至?xí)苯佑绊懙狡髽I(yè)的管理。
另外,即使有了完整的災(zāi)備計(jì)劃,如果不能很好的執(zhí)行也沒什么用。如果只有一個(gè)人了解這個(gè)計(jì)劃,如果出現(xiàn)問題的時(shí)候他不在,這顯然是個(gè)很悲劇的事情。所以災(zāi)備計(jì)劃應(yīng)該存放在硬盤里或者打印出來,并讓相關(guān)的人員知道。而出現(xiàn)問題的時(shí)候,工作人員也應(yīng)該知道該和誰聯(lián)系,來確保在最短的時(shí)間內(nèi)讓數(shù)據(jù)中心恢復(fù)正常的工作。#p#
仔細(xì)規(guī)劃
災(zāi)備計(jì)劃的規(guī)劃是一個(gè)持續(xù)的,不斷演進(jìn)的過程,制訂好了災(zāi)備計(jì)劃就等著災(zāi)難的發(fā)生是一個(gè)顯然錯(cuò)誤的觀念。
雖然管理員在不斷的評(píng)估數(shù)據(jù)中心網(wǎng)絡(luò)容量的需求,但不要忘了災(zāi)備計(jì)劃也占其中的一部分,要留給備份所需的空間。這并不是一個(gè)可選部分,而是一個(gè)必要的部分。因?yàn)榘藬?shù)據(jù)和應(yīng)用程序的備份計(jì)劃,在災(zāi)難發(fā)生的時(shí)候就會(huì)顯示出它的價(jià)值,快速的幫助企業(yè)恢復(fù)業(yè)務(wù)是花多少錢也買不來的。
整個(gè)計(jì)劃還包括遠(yuǎn)程戰(zhàn)略。當(dāng)發(fā)生災(zāi)難的時(shí)候,必須要確保管理員在異地也能啟動(dòng)災(zāi)備計(jì)劃。而發(fā)生災(zāi)難的時(shí)候,太多的人參與計(jì)劃反而起不到積極的作用。在這個(gè)領(lǐng)域,不會(huì)需要太多的幫助,有時(shí)候反而會(huì)導(dǎo)致更糟的事情發(fā)生。
所以災(zāi)備計(jì)劃應(yīng)該確定哪些人分別負(fù)責(zé)哪些工作。并且讓工作人員們清楚,什么是應(yīng)該做的,什么不應(yīng)該做。#p#
不要忘了企業(yè)
由于管理員在選擇災(zāi)備計(jì)劃的時(shí)候往往從技術(shù)方面來考慮,他可能忘了,災(zāi)備計(jì)劃的規(guī)劃首先必須服從于企業(yè)的業(yè)務(wù)需求。在今天,雖然IT的基礎(chǔ)設(shè)施隨著虛擬化,云計(jì)算技術(shù)的發(fā)展,結(jié)構(gòu)發(fā)生了很大的變化。但是,業(yè)務(wù)的連續(xù)性和災(zāi)難恢復(fù)的聯(lián)系依然是密不可分的。
規(guī)劃災(zāi)備計(jì)劃的根本原則并不是技術(shù)的可行性,而是那些業(yè)務(wù)所依賴的服務(wù)。畢竟,數(shù)據(jù)中心也是為了更好的為企業(yè)提供服務(wù)。不僅僅的企業(yè)數(shù)據(jù)中心,云計(jì)算服務(wù)提供商,托管服務(wù)提供商都必須要有良好的業(yè)務(wù)連續(xù)性,并讓它的客戶清楚的知道。才能保證他的優(yōu)勢(shì)。
因此,盡管災(zāi)難恢復(fù)解決方案在不斷的發(fā)展,但最根本的災(zāi)備計(jì)劃仍然是一致的。保證業(yè)務(wù)的連續(xù)性也是制定災(zāi)備計(jì)劃的根本意義所在,也是最大限度的提高災(zāi)難恢復(fù)效率的唯一出發(fā)點(diǎn)。