未雨綢繆,為災(zāi)難恢復(fù)提前做好準備
在數(shù)字經(jīng)濟中,業(yè)務(wù)連續(xù)性與科技密不可分。從零售和旅游業(yè),到金融和公共事務(wù)領(lǐng)域,從服務(wù)轉(zhuǎn)移到線上和員工遠程辦公,都意味著企業(yè)比以往任何時候都更加依賴其數(shù)字基礎(chǔ)設(shè)施。雖然組織可以采取措施,保護其數(shù)字服務(wù)免受諸如用戶操作失誤、系統(tǒng)故障或網(wǎng)絡(luò)攻擊等事件的影響,但總有些天災(zāi)人禍是超出任何企業(yè)所能控制范圍的,例如極端天氣事件、自然災(zāi)害或區(qū)域性斷電等可能導(dǎo)致的停機和服務(wù)中斷的情況。
當(dāng)此類事件發(fā)生時,如何讓服務(wù)和員工快速恢復(fù)聯(lián)機至關(guān)重要。 因此,企業(yè)必須具備一套健全的、有據(jù)可查的、并且經(jīng)過測試的預(yù)案,方案中須有明確的負責(zé)人、角色和職責(zé)、緊急聯(lián)系人和行動規(guī)則。 但是,光有預(yù)案是不夠的,企業(yè)還需要技術(shù)能力以恢復(fù)到事故前狀態(tài)。這意味著企業(yè)需在既定時間范疇內(nèi)完整恢復(fù)數(shù)據(jù)、應(yīng)用程序和服務(wù),并最大限度地減少任何影響。 從業(yè)務(wù)連續(xù)性和技術(shù)恢復(fù)的角度來看,所有這些都構(gòu)成了一套穩(wěn)健的流程,企業(yè)必須確保在災(zāi)難發(fā)生時做好充分準備。
讓團隊嚴陣以待
預(yù)測和行動的能力是區(qū)分成功者與失敗者的關(guān)鍵。當(dāng)涉及到從不可預(yù)測的技術(shù)災(zāi)難中恢復(fù)時,能夠準確預(yù)測事發(fā)第一時間的情況和執(zhí)行應(yīng)對措施變得至關(guān)重要。IT 管理者必須將自身置身于此等情況下,從而了解應(yīng)對措施,而非等待災(zāi)難發(fā)生才想對策。各種情況可能會非常不同,因此在事情發(fā)生之前從頭到尾地模擬一遍至關(guān)重要。
最終,企業(yè)都將依靠其自身的數(shù)據(jù)系統(tǒng)和基礎(chǔ)設(shè)施,以在充足的時間范圍內(nèi)完全恢復(fù)其關(guān)鍵任務(wù)的應(yīng)用程序。但在進入到恢復(fù)階段之前,企業(yè)必須培養(yǎng)團隊以做好準備。屆時他們將采取關(guān)鍵操作來啟動恢復(fù),這可以根據(jù)企業(yè)的需求分為幾個階段。一般來講,企業(yè)首先要確保擁有一套在當(dāng)前業(yè)務(wù)中部署的應(yīng)用程序及服務(wù)的完整且最新的清單。其次,在確保以上措施后,企業(yè)可考慮按其重要性劃分優(yōu)先級——與企業(yè)內(nèi)部最關(guān)鍵的職能一致。在此,企業(yè)須考慮哪些應(yīng)用程序需優(yōu)先恢復(fù)聯(lián)機。例如,在線零售商可能會優(yōu)先考慮恢復(fù)其庫存和供應(yīng)鏈功能后,才考慮恢復(fù)其電商平臺功能。而律師和市場營銷等服務(wù)性行業(yè)可能會優(yōu)先考慮其電子郵件和協(xié)作應(yīng)用程序的恢復(fù)以實現(xiàn)其公司的通信功能。
一旦企業(yè)考慮好了需要優(yōu)先聯(lián)機的應(yīng)用程序,便可開始制定行動計劃,并將其記錄下來,集中存儲并備份至少在兩種其他形式的媒介(異地和離線)。此行動計劃需盡量詳細和具體,并且還必須做好最壞的打算,比如假設(shè)您的系統(tǒng)管理員主管在休假或因病請假了,團隊需在沒有主管指導(dǎo)的情況下恢復(fù)數(shù)據(jù)系統(tǒng)。為了應(yīng)對此類情況所制定的計劃,除關(guān)鍵行動和指令外,還應(yīng)詳列聯(lián)系電話,以重新恢復(fù)整個企業(yè)的溝通。諸如“誰需要立即被通知?”、“ IT 團隊需要致電誰來獲取重要信息?”等類似問題都必須在計劃中,以及考慮實用性?!肮芾韱T團隊是否需要夜以繼日地恢復(fù)數(shù)據(jù)中心的服務(wù)器?”、“他們吃和住如何解決?”,最詳細的災(zāi)難恢復(fù) (DR) 計劃總是盡心盡力,甚至包括了從披薩外賣公司到出租車公司和酒店的信息。
自動恢復(fù)
除根據(jù)優(yōu)先恢復(fù)的關(guān)鍵業(yè)務(wù)功能制定恢復(fù)計劃外,企業(yè)還須確保其數(shù)據(jù)系統(tǒng)在所有形式的存儲中都受到備份和災(zāi)難恢復(fù)的全面保護。其中,異地和離線數(shù)據(jù)備份有助于減輕災(zāi)難性事件的影響。在此,Veeam 提倡 3-2-1-1-0 備份原則。每個企業(yè)應(yīng)至少在不少于兩種不同類型的介質(zhì)上保存至少三個重要數(shù)據(jù)副本,其中至少一個異地與一個離線,沒有未經(jīng)驗證的備份,或備份完成時無誤。 當(dāng)然,備份和災(zāi)難恢復(fù)是兩個密不可分的解決方案,但我們不應(yīng)該將兩者混為一談。 災(zāi)難恢復(fù)是指一連串旨在確保公司數(shù)據(jù)存活的舉措和流程,無論災(zāi)難或危機的范圍如何,重點是為了盡快恢復(fù) IT 服務(wù)。
使用第三方災(zāi)難恢復(fù)提供商提供的災(zāi)難恢復(fù)即服務(wù) (DRaaS),企業(yè)只需單擊一下即可自動測試、記錄和執(zhí)行災(zāi)難恢復(fù)計劃,從而實現(xiàn)從單個應(yīng)用程序到整個站點的恢復(fù)。回到規(guī)劃過程,企業(yè)可以根據(jù)他們需要的服務(wù)水平協(xié)議 (SLA) 選擇最佳保護方法。災(zāi)難恢復(fù)計劃背后的基本問題和目標(biāo)需要是:業(yè)務(wù)需要多快的速度恢復(fù)?無論是指讓關(guān)鍵任務(wù)應(yīng)用程序重新上線,還是完全恢復(fù)之前的數(shù)據(jù)。借助 DRaaS,客戶可以利用一種可完全掌控的、受監(jiān)控的和安全的方法來保護關(guān)鍵數(shù)據(jù),而無需維護異地存儲庫??偠灾瑸?zāi)難恢復(fù)最佳實踐結(jié)合了以業(yè)務(wù)為主導(dǎo)和以 IT 為中心的戰(zhàn)略,以確保整個業(yè)務(wù)的業(yè)務(wù)連續(xù)性。唇亡齒寒,考慮到企業(yè)對其數(shù)字基礎(chǔ)設(shè)施的依賴,他們需要一個強有力的計劃以及能夠充分保護業(yè)務(wù)的現(xiàn)代數(shù)據(jù)保護解決方案。