大數(shù)據(jù)與云計(jì)算背后 繞不開數(shù)據(jù)保護(hù)這道坎
原創(chuàng)【51CTO.com原創(chuàng)稿件】大數(shù)據(jù)時(shí)代,數(shù)據(jù)逐漸成為企業(yè)的核心資產(chǎn)和競爭力,每個(gè)新項(xiàng)目都會(huì)產(chǎn)生大量新的數(shù)據(jù),讓人們很容易忘掉次級(jí)數(shù)據(jù)所蘊(yùn)含的價(jià)值。云的興起,企業(yè)加快將數(shù)據(jù)遷移至云端,云天然的分布式架構(gòu),具有一定的容錯(cuò)能力,也常常讓人們忽略數(shù)據(jù)保護(hù)的重要作用。
次級(jí)數(shù)據(jù)保護(hù)在大數(shù)據(jù)領(lǐng)域的全新應(yīng)用
通常我們把除生產(chǎn)數(shù)據(jù)和原始數(shù)據(jù)以外的數(shù)據(jù),包括副本數(shù)據(jù)、備份數(shù)據(jù)和災(zāi)難恢復(fù)數(shù)據(jù)等統(tǒng)稱為次級(jí)數(shù)據(jù)。過去,次級(jí)數(shù)據(jù)只有一個(gè)作用,就是在災(zāi)難發(fā)生后把次級(jí)數(shù)據(jù)恢復(fù)過來給生產(chǎn)使用。如今,隨著大數(shù)據(jù)技術(shù)的發(fā)展,次級(jí)數(shù)據(jù)的運(yùn)用領(lǐng)域已經(jīng)擴(kuò)展開來,初級(jí)數(shù)據(jù)和次級(jí)數(shù)據(jù)之間的界限也越來越模糊。近幾年,災(zāi)備領(lǐng)域的發(fā)展呈現(xiàn)兩大特點(diǎn):一是為了提升次級(jí)數(shù)據(jù)的訪問速度,提高利用效率,數(shù)據(jù)備份和容災(zāi)的介質(zhì)由磁帶向磁盤過度;二是傳統(tǒng)的封閉式接口必須打開,用開放式的接口讓前端的應(yīng)用軟件能夠方便的對次級(jí)數(shù)據(jù)進(jìn)行訪問和調(diào)用。
Commvault大中華區(qū)技術(shù)總監(jiān)蔡報(bào)永在接受記者采訪時(shí)表示:“對傳統(tǒng)的數(shù)據(jù)保護(hù)和備份的廠商而言,如何盤活次級(jí)數(shù)據(jù),把次級(jí)數(shù)據(jù)存儲(chǔ)打開來,采用開放的接口讓前端的分析軟件能便捷的訪問,從而將其用于開發(fā)、測試等多種數(shù)據(jù)應(yīng)用場景,是當(dāng)前備份廠商面臨的一大挑戰(zhàn)。”
很多企業(yè)在做大數(shù)據(jù)分析時(shí),普遍的作法是從各個(gè)生產(chǎn)系統(tǒng)中抓取數(shù)據(jù),然后放到大數(shù)據(jù)平臺(tái)上,經(jīng)過存儲(chǔ)、分析,形成決策并反過來指導(dǎo)生產(chǎn)和銷售等。蔡報(bào)永認(rèn)為,“如果企業(yè)的數(shù)據(jù)管理做得好,次級(jí)數(shù)據(jù)里存儲(chǔ)的數(shù)據(jù)是豐富且完整的,那么只需將次級(jí)數(shù)據(jù)的接口開放給大數(shù)據(jù)分析平臺(tái),就可以在做好數(shù)據(jù)保護(hù)的同時(shí),盤活你的次級(jí)數(shù)據(jù),同時(shí)又能節(jié)省一定的存儲(chǔ)成本。”
2017年下半年,Commvault推出了HyperScale存儲(chǔ)技術(shù),能夠?yàn)榭蛻籼峁┚哂泻啙嵭?、彈性、恢?fù)能力、靈活性和擴(kuò)展性的本地次級(jí)數(shù)據(jù)管理。企業(yè)將次級(jí)數(shù)據(jù)直接放到HyperScale存儲(chǔ)上,優(yōu)點(diǎn)是備份時(shí)寫入速度快,且能給前端分析及查找的軟件提供API接口,使之能提供類似一級(jí)存儲(chǔ)一樣的訪問性能,幫助企業(yè)驅(qū)動(dòng)關(guān)鍵業(yè)務(wù)和IT轉(zhuǎn)型。以前,我們在測試的過程中要想調(diào)用備份數(shù)據(jù),必須將備份數(shù)據(jù)恢復(fù)到另一平臺(tái),非常耗時(shí),如果在HyperScale上則可以通過API標(biāo)準(zhǔn)直接訪問,供測試環(huán)境使用,并在瞬間完成訪問。蔡報(bào)永認(rèn)為這是次級(jí)數(shù)據(jù)保護(hù)和使用的重大改變,從傳統(tǒng)的只供災(zāi)難恢復(fù)來用,到現(xiàn)在的以測試開發(fā)、即開即用的方式開放給大數(shù)據(jù)分析平臺(tái),而無需臨時(shí)存儲(chǔ),讓企業(yè)能夠更加便捷地在完整的數(shù)據(jù)平臺(tái)上進(jìn)行數(shù)據(jù)加工和數(shù)據(jù)挖掘。
Commvault大中華區(qū)技術(shù)總監(jiān)蔡報(bào)永
云和Hadoop天生的容錯(cuò)能力并非絕對安全
無論是云還是Hadoop,都是分布式架構(gòu),其多副本的模式擁有一定的硬件容錯(cuò)能力,但是企業(yè)的數(shù)據(jù)放在云上或Hadoop上并非絕對安全。蔡報(bào)永提到,有些金融公司用Hadoop平臺(tái)也存在數(shù)據(jù)丟失的情況,2017年全球***的云服務(wù)提供商AWS的云存儲(chǔ)服務(wù)也曾發(fā)生宕機(jī)事件,由此可以看出,多個(gè)副本相互拷貝,任何一個(gè)副本壞掉,所有的副本都會(huì)壞掉,并不像數(shù)據(jù)管理軟件那樣可以保證將某個(gè)時(shí)間點(diǎn)的數(shù)據(jù)副本保存好。由云計(jì)算的發(fā)展趨勢可以看出,過去的云服務(wù)商***的賣點(diǎn)是計(jì)算資源和存儲(chǔ)資源,而如今,很多云服務(wù)商開始用云服務(wù)的基礎(chǔ)架構(gòu)為用戶提供數(shù)據(jù)保護(hù)。
統(tǒng)計(jì)數(shù)據(jù)顯示,AWS及Azure等主流的云存儲(chǔ)資源中,有30%到40%的數(shù)據(jù)是客戶的備份數(shù)據(jù),而這些主流的云服務(wù)商并未承諾任何的備份服務(wù),這也提醒企業(yè)在上云的同時(shí)仍需要考慮數(shù)據(jù)保護(hù)和備份。蔡報(bào)永提醒,云上的數(shù)據(jù)并不那么安全,甚至比在本地更糟糕,因?yàn)楸镜刂灰獋浞菀环?,壞了還可以遷移數(shù)據(jù),如果完全依賴云服務(wù)商的話就沒有數(shù)據(jù)可供恢復(fù)啦。因此,盡管你用了云服務(wù),還是需要單獨(dú)的數(shù)據(jù)管理和數(shù)據(jù)保護(hù)服務(wù)。
蔡報(bào)永在采訪時(shí)列舉了兩個(gè)云上容災(zāi)備份做得比較好的例子。***個(gè)例子是一家大型的跨國零售企業(yè),在全球各地?fù)碛卸嗉覕?shù)據(jù)中心,這家企業(yè)已經(jīng)開始將一部分應(yīng)用架構(gòu)在云上,同時(shí)將數(shù)據(jù)保護(hù)在云上,如生產(chǎn)系統(tǒng)在本地,云上備份數(shù)據(jù)的同時(shí),將云上的數(shù)據(jù)不間斷的恢復(fù)到云主機(jī)上,當(dāng)作容災(zāi)平臺(tái)來使用,當(dāng)本地?cái)?shù)據(jù)中心出現(xiàn)問題時(shí),直接在云平臺(tái)上開通虛機(jī)即可將數(shù)據(jù)疊加上去,就可以開通業(yè)務(wù),無需自建數(shù)據(jù)容災(zāi)中心。據(jù)介紹,這家客戶選用的是微軟的Azure平臺(tái),Commvault與微軟云平臺(tái)有天然的集成功能,既可以把數(shù)據(jù)遷移到Azure平臺(tái)上,又可以在Azure平臺(tái)自動(dòng)開啟云主機(jī)服務(wù),把數(shù)據(jù)恢復(fù)上去,實(shí)現(xiàn)了客戶的容災(zāi)自動(dòng)化。第二個(gè)例子采用異地備份的形式,將本地?cái)?shù)據(jù)中心備份的數(shù)據(jù)快速傳輸?shù)疆惖?,并快速恢?fù)到虛擬化的環(huán)境中,用虛擬機(jī)來備份數(shù)據(jù),當(dāng)容災(zāi)出現(xiàn)時(shí)也能很方便的去對接原來的生產(chǎn)業(yè)務(wù)。
據(jù)介紹,在云存儲(chǔ)層面,Commvault與AWS、Azure、中國移動(dòng)云、阿里云以及華為云等45家云存儲(chǔ)廠商實(shí)現(xiàn)對接;在云主機(jī)方面,目前Commvault支持AWS、Azure、Google Cloud、Oracle Cloud以及所有基于OpenStack架構(gòu)的相關(guān)公有云。
【51CTO原創(chuàng)稿件,合作站點(diǎn)轉(zhuǎn)載請注明原文作者和出處為51CTO.com】