災(zāi)難恢復(fù)團隊必須測試的五大 IT 災(zāi)難場景
IT 團隊準備應(yīng)對的典型中斷是常見事件,例如磁盤故障或斷電。但是,企業(yè)必須解決更多 IT 災(zāi)難場景才能得到充分保護。
許多 IT 災(zāi)難的根源通常是負責恢復(fù)的人員沒有考慮硬件故障或意外或惡意丟失數(shù)據(jù)以外的任何事情。遺憾的是,威脅和場景總是在不斷變化,因此災(zāi)難恢復(fù)計劃也必須這樣做。
有許多形式的災(zāi)難會影響 IT 服務(wù)的可用性,有些災(zāi)難可能比其他組織更與單個組織相關(guān)。評估哪些風險最有可能威脅到公司的基礎(chǔ)設(shè)施和服務(wù)是一個謹慎的舉動。風險評估矩陣是一種工具,可以幫助確定災(zāi)難發(fā)生的可能性及其嚴重程度。
以下是災(zāi)難恢復(fù)團隊必須準備的五種可能的 IT 災(zāi)難場景,以及有關(guān)如何做到這一點的提示,無論業(yè)務(wù)規(guī)模和類型、位置和基礎(chǔ)架構(gòu)如何。
失敗的備份
失敗的備份是最常見的 IT 災(zāi)難之一。企業(yè)可以更換硬件和軟件,但如果數(shù)據(jù)和所有備份都消失了,那么將它們恢復(fù)可能是不可能的,或者非常昂貴。
系統(tǒng)管理員必須定期測試他們從備份還原的能力,以確保備份正常工作,并且還原過程沒有一些看不見的致命缺陷。同時,應(yīng)始終存在多代備份,其中一些備份集在異地進行。
自然災(zāi)害
自然災(zāi)害可以有多種形式,包括火災(zāi)、洪水和地震。雖然災(zāi)難的類型可能因地區(qū)而異,但幾乎所有災(zāi)難都可能損壞硬件并導(dǎo)致數(shù)據(jù)丟失。許多會使工作場所長時間無法進入。
一些組織可能沒有意識到他們的辦公室位于洪泛平原或地震多發(fā)地區(qū),直到為時已晚。緩解此類問題需要一定程度的前瞻性規(guī)劃。
故障進入云以保持核心服務(wù)工作的能力意味著,雖然并非每個應(yīng)用程序都可用,但那些對運行業(yè)務(wù)至關(guān)重要的應(yīng)用程序是可用的。建設(shè)基礎(chǔ)設(shè)施,使遠程工作成為一種可行的選擇,是為各種自然災(zāi)害做準備的另一種方式。
能夠故障到云中并在異地工作需要一些深思熟慮、規(guī)劃和應(yīng)用,但如果發(fā)生災(zāi)難,會帶來巨大的回報。維修和更換建筑物和硬件所需的時間可能比人們估計的要長,而在恢復(fù)期間無法運作的企業(yè)將面臨嚴重財務(wù)損失的風險。
災(zāi)難恢復(fù)團隊可以使用風險評估矩陣來確定不同 IT 災(zāi)難場景的可能性和嚴重性。
勒索軟件攻擊
勒索軟件不僅是企業(yè)可能發(fā)生的最具破壞性的災(zāi)難之一,而且可能也是最有可能發(fā)生的災(zāi)難。只需要一個具有足夠權(quán)限的人點擊錯誤的鏈接就會造成混亂。
防御勒索軟件既不是微不足道的,也不是便宜的。許多現(xiàn)代勒索軟件都具有智能功能,可以確保在破壞幾代備份之前不會激活。
有許多方法可以降低勒索軟件攻擊的風險,但沒有一種單一的預(yù)防工具。使應(yīng)用程序和操作系統(tǒng)補丁保持最新狀態(tài),掃描電子郵件以查找可疑附件,限制對外部媒體的訪問并提供良好的用戶教育將有所幫助。
網(wǎng)絡(luò)中斷
不幸的是,這種 IT 災(zāi)難場景經(jīng)常發(fā)生。例如,重型機械可能會切斷電纜,使網(wǎng)絡(luò)無法訪問。隨著越來越多的 IT 系統(tǒng)基于 SaaS,網(wǎng)絡(luò)中斷是一個越來越緊迫的問題。網(wǎng)絡(luò)連接對于加入和使用 SaaS 系統(tǒng)至關(guān)重要。
幸運的是,近年來,解決這個問題的方法變得容易獲得且價格低廉。輔助線路是小型企業(yè)的一種選擇,大多數(shù)網(wǎng)絡(luò)路由器都提供 4G 或 5G 網(wǎng)絡(luò)作為備份。雖然不理想,但它使網(wǎng)絡(luò)中斷不再是災(zāi)難,而是帶來更多不便。整合備份連接確實有成本,但當替代方案是辦公室里擠滿了無法工作的員工時,這可能是值得的。
硬件故障
硬件故障可以有多種形式,包括系統(tǒng)不使用 RAID、單個磁盤丟失導(dǎo)致整個系統(tǒng)癱瘓、網(wǎng)絡(luò)交換機故障和電源故障。
大多數(shù)基于硬件的 IT 災(zāi)難場景都可以相對容易地緩解,但代價是增加了復(fù)雜性和價格標簽。一個示例是數(shù)據(jù)庫服務(wù)器。這樣的服務(wù)器可以變成具有高度可用性存儲和網(wǎng)絡(luò)的數(shù)據(jù)庫集群。這樣做的成本很容易使單個非冗余服務(wù)器的成本增加一倍。管理員還必須接受培訓才能管理這樣的環(huán)境。
硬件故障也會影響云。但是,它通常被抽象出來,并且有多個數(shù)據(jù)副本需要重新生成并繼續(xù)。