異地災(zāi)備:避開互聯(lián)網(wǎng)道路上的那些“坑”
5月27日下午5點,擁有將近3億活躍用戶的支付寶出現(xiàn)了大面積訪問故障。據(jù)悉,包括北京、上海、廣東、武漢、西安、湖南、浙江、四川、福建等地用戶均受到不同程度的影響,如手機和電腦支付寶無法登陸、無法正常支付、余額錯誤等問題。據(jù)支付寶官微回應(yīng)稱,故障原因是杭州市蕭山區(qū)某地光纖被挖斷。2.5小時后,支付寶才恢復(fù)正常使用。
無獨有偶,18個小時后,擁有超2.5億用戶的攜程官方網(wǎng)站與APP也出現(xiàn)了訪問故障,官方回應(yīng)稱其原因為部分服務(wù)器遭到不明攻擊。受此影響,攜程股價盤前暴跌11.67%,而宕機帶來的業(yè)務(wù)損失也不是小數(shù)字。近12小時后,攜程官網(wǎng)及APP終于恢復(fù)正常。
一時間,網(wǎng)民類似的戲謔之言在網(wǎng)上比比皆是。事實上,相關(guān)事件之所以引得廣泛關(guān)注,主要原因就在于今天的互聯(lián)網(wǎng)與大眾生活已緊密相關(guān)。接連發(fā)生的兩次故障事件,讓更多普通用戶只是感受到了平日里“賴以生存”的網(wǎng)絡(luò)之脆弱,而讓高度依賴網(wǎng)絡(luò)和IT能力的相關(guān)企業(yè)卻是產(chǎn)生了空前的關(guān)注與警醒。
周星馳電影《功夫》里有句名言:能力越大,責(zé)任就越大。而短時間的兩次故障正凸顯出互聯(lián)網(wǎng)+下,企業(yè)容災(zāi)備份和IT管理亟待進一步提升的問題。在中國這樣的人口大國,隨著用戶數(shù)量激增,企業(yè)背后的數(shù)據(jù)安全和整個IT系統(tǒng)的管理也變得更加重要,影響著企業(yè)的服務(wù)質(zhì)量、品牌聲譽與用戶的信賴。正因如此,探討一下企業(yè)如何避開互聯(lián)網(wǎng)道路上的“坑”,要遠比談?wù)?ldquo;一把鐵鍬的威力”重要得多。
萬物互聯(lián)時代更需理性
“萬物互聯(lián)時代,基礎(chǔ)設(shè)施的復(fù)雜性和安全問題勢必更加突出。包括今天的支付寶光纜被挖斷,攜程被攻擊宕機。再一次展示了傳統(tǒng)行業(yè)鐵鍬和IT時代運維管理的力量,凸顯了網(wǎng)絡(luò)時代的脆弱性。在互聯(lián)網(wǎng)+轟轟烈烈的大潮下,如何處理好營養(yǎng)的極大豐富,與基礎(chǔ)設(shè)施非常脆弱的問題?”這是某位行業(yè)專家在朋友圈里寫下的反思。
帶著這些問題,記者走訪了相關(guān)專業(yè)人士。一位國有銀行人士稱,相對移動支付或大型網(wǎng)站,傳統(tǒng)金融機構(gòu)更為理性,在涉及資金交易的重要系統(tǒng)災(zāi)備方面往往有著更充分的準備,發(fā)生大范圍數(shù)據(jù)故障的幾率更低,而這種理性也在某種程度上意味著服務(wù)安全級別的提升。
異地災(zāi)備,聯(lián)手避“坑”
就此次事件記者也專門采訪了國內(nèi)領(lǐng)先的整合IT服務(wù)商神州信息,其專家也持類似觀點:當前企業(yè)業(yè)務(wù)受益互聯(lián)網(wǎng)+的帶動不斷擴張,為保障業(yè)務(wù)安全和穩(wěn)定,很多銀行與企業(yè)都實施了“兩地三中心”的異地災(zāi)備方案,神州信息也在其中承接了很多工作。在實施過程中不僅可幫助企業(yè)在同城部署一個災(zāi)備中心,還會在異地部署另一個備份中心,并在此基礎(chǔ)上輔以完善的災(zāi)備技術(shù)與解決方案,確保數(shù)據(jù)、業(yè)務(wù)因突發(fā)災(zāi)難或其他因素中斷時的及時可恢復(fù)性。實現(xiàn)了“兩地三中心”災(zāi)備,一旦企業(yè)某個機房的核心數(shù)據(jù)庫或業(yè)務(wù)系統(tǒng)出現(xiàn)故障,系統(tǒng)將按照預(yù)定策略,自動切換到同城或異地的災(zāi)備中心,確保業(yè)務(wù)不間斷,從而大大提高業(yè)務(wù)連續(xù)性,高度保障系統(tǒng)的連續(xù)運行與核心數(shù)據(jù)安全。
同時這位負責(zé)人也指出,作為中國最大的第三方支付平臺,支付寶日均支付的數(shù)據(jù)量遠遠超出一般銀行,其容災(zāi)管理也更加復(fù)雜,異地災(zāi)備的部署難度也更大。但企業(yè)用戶只要有數(shù)據(jù)保護的必要性,采取異地災(zāi)備方式就是當前有效的解決方案之一。特別是在云備份平臺的支持下,異地災(zāi)備可以最大程度的避免自然災(zāi)難或戰(zhàn)爭等極端情況給企業(yè)造成的影響。
“24小時內(nèi)出現(xiàn)的兩起大面積突發(fā)事件,讓每個企業(yè)重新認識到了災(zāi)備和IT運維管理的重要性。大型網(wǎng)站的架構(gòu)與業(yè)務(wù)系統(tǒng)錯綜復(fù)雜,各種服務(wù)之間的依賴關(guān)系也會隨時間推移難以厘清,一旦出現(xiàn)問題,重建過程將繁瑣耗時。只有不斷提高網(wǎng)絡(luò)安全意識,完善相關(guān)管理機制,才能從根源上更好地解決問題。”