哪些企業(yè)適合采用重復數(shù)據刪除技術
導讀:隨著企業(yè)對數(shù)據安全的重視程度加強,適合企業(yè)不同特性的從存儲備份方案也應運而生。重復刪除技術就是其中的一種。在這篇中就跟大家談談,什么樣的企業(yè)適合采用重復數(shù)據刪除技術。以便各個企業(yè)在選擇采用重復數(shù)據刪除技術時不盲目的去采用。
一、數(shù)據量大、且冗余大的企業(yè)適合使用重復數(shù)據刪除技術。
在對企業(yè)的信息化數(shù)據進行存儲與備份時,超大的容量一直是項目管理員比較頭疼的問題。有不少企業(yè),可能一年就需要升級一下存儲設備的容量。在這種情況下,采用重復數(shù)據刪除技術能夠起到一定的效果。
通常情況下,當企業(yè)的數(shù)據量越大,備份數(shù)據中所包含的冗余部分也就越多。雖然說增量的數(shù)據備份策略只是備份哪些有變化的文件,可以在一定程度上提高備份的效率、縮小磁盤空間。但是這個贈量備份策略通常也會包含比較多的冗余的數(shù)據塊。為此對節(jié)省磁盤空間的效果并不是很理想。
此時企業(yè)可以嘗試使用重復數(shù)據刪除技術來消除冗余的數(shù)據塊。通常情況下重復數(shù)據刪除技術的核心優(yōu)勢就是保存***一份備份數(shù)據的數(shù)據段。簡單的說,當數(shù)據寫入到備份設備時,數(shù)據會被分割成可變長度的數(shù)據段。重復數(shù)據刪除解決方案會實時的將該數(shù)據段與已經存儲的各個數(shù)據段進行對比。如此的話,就可以保證每個***的數(shù)據段在存儲設備上只保留一份。因為重復數(shù)據刪出技術可以在文件內或者文件間,甚至數(shù)據塊內發(fā)現(xiàn)重復的文件和數(shù)據段,所以實際所需要的存儲空間也就比所需要保存的數(shù)據量低一個數(shù)據級別。容量優(yōu)化效率的高低主要取決于所采采用的算法。
為此如果企業(yè)想大幅度的降低其存儲容量,并且企業(yè)的數(shù)據存在比較大的冗余(如2011年的報表是在2010年的基礎上延續(xù)下去的),此時就可以使用重復數(shù)據刪出技術來解決存儲容量過大的問題。
不過這里需要提醒的是,其數(shù)據壓縮的效果直接跟其所采用的算法相關?,F(xiàn)在針對重復數(shù)據刪除解決方案,有不少對應的算法。在選型時,需要評估各種算法的優(yōu)劣。甚至可以直接測試一下,看看其容量優(yōu)化效果到底有多大。然后再根據實際情況來選型。
二、數(shù)據恢復時要客戶增量備份所帶來的困擾。
增量備份只備份有變化的文件或者數(shù)據。其可以在一定程度上降低備份的開銷、提高備份的效率。但是其也存在一些負面的效應。如以Oracle數(shù)據庫為例,有時候全備份方式的備份恢復執(zhí)行起來要比增量備份快。這主要是因為在增量備份過程中經常要對整個數(shù)據庫進行掃描,以便發(fā)現(xiàn)改變的數(shù)據塊。而且增量方式在數(shù)據恢復時還需要一個完全備份和多個增量備份文件。此時就會增加數(shù)據恢復的復雜性、降低數(shù)據恢復的速度。如果企業(yè)的數(shù)據管理員,正在為增量備份所帶來的這些問題所困擾,那么可以試著使用以下重復數(shù)據刪出技術,看看能否幫你解決問題。
筆者還是以Oracle數(shù)據庫為例。如果現(xiàn)在我們利用重復數(shù)據刪除技術對Oracle數(shù)據庫文件進行備份,會有什么樣的改善呢?此時數(shù)據庫文件備份所需要的時間是由遍歷數(shù)據塊的時間和數(shù)據時間所構成的。對于增量備份來說,數(shù)據塊的遍歷是對數(shù)據庫進行全表掃描,以便發(fā)現(xiàn)改變的數(shù)據塊。這往往需要比較長的時間。而且其所需要的時間與數(shù)據庫的容量成正比。而以磁盤為介質的備份設備具有高性能和在線重復數(shù)據刪除的功能。為此在對Oracle數(shù)據庫進行多個完全備份時,只用了很少的存儲空間(因為消除了冗余的數(shù)據塊)。此時企業(yè)進行完全備份和數(shù)據塊級的增量備份所占用的存儲空間基本相同。而與普通的備份設備相比,使用重復數(shù)據刪除技術的設備做完全備份時,可以節(jié)省95%以上的存儲空間消耗。在某些場合中,其磁盤節(jié)省的效率比增量備份還要高。
簡單的說,從數(shù)據存儲空間、備份效率等綜合效果來看,重復刪除技術+完全備份〉增量備份。如果企業(yè)采用了重復刪除技術的存儲設備,那么就不需要再對數(shù)據庫進新增量備份,而直接采用完全備份即可。此時即不用擔心磁盤空間的問題,也不用再顧慮采用增量備份時所帶來的負面作用。
三、對數(shù)據進行異地備份。
在數(shù)據安全要求比較高的企業(yè),光本地備份還不行,往往還需要對數(shù)據進行異地備份。如現(xiàn)在的電子商務網站,其可能在北京、上海各有分支機構。為了數(shù)據的安全,不同分支機構的數(shù)據要進行相互之間的異地備份,以提高數(shù)據的安全性。在進行異地備份時,數(shù)據管理人員最關心的莫過于數(shù)據的容量。當數(shù)據的容量比較大時,不僅需要比較多的備份空間,而且在異地備份時對于帶寬的要求也比較高。正是由于這種原因,異地備份需要企業(yè)比較高的成本。這也限制了異地備份策略在企業(yè)中的應用。
數(shù)據重復刪除技術很好的解決了這個問題。因為采用了重復數(shù)據刪除技術之后,其備份文件的容量已經非常的小。此時即時每幾個小時進行一次完全備份也只需要少量的磁盤容量。然后將這個備份文件通過互聯(lián)網進行傳輸時,還可以大大的節(jié)省網絡帶寬。從而可以幫助企業(yè)降低遠程備份的成本。
在遠程數(shù)據同步作業(yè)中,重復數(shù)據刪除技術也非常的有用。如筆者有一家客戶,他們就將備份數(shù)據的在線復制當成異地磁帶存儲的替代解決方案。簡單的說,就是其服務器在北京,然后在上海在設置一臺備份服務器。然A服務器的數(shù)據與上海備份服務器的數(shù)據進行同步。正常情況下使用北京的A服務器。等到A服務器因為某種原因出現(xiàn)故障時,則立即利用上海的服務器代替。此時由于采用了重復數(shù)據刪除技術,大大縮小了備份文件的容量,加快了網絡的傳輸能力。
四、要與現(xiàn)有設備與系統(tǒng)進行有效的整合。
不少企業(yè)在采用新的信息化應用時,需要考慮如何與原有的信息化設備與系統(tǒng)進行有效的整合,即要考慮系統(tǒng)與設備之間的兼容性問題。在采用重復數(shù)據刪除技術時也存在這種情況。不過不用擔心,重復數(shù)據刪除方案提供了不同的解決方案,以提高這個方案與企業(yè)現(xiàn)有環(huán)境的兼容性。
如重復數(shù)據刪除解決方案現(xiàn)在有兩種解決思路:基于硬件的解決方案和基于軟件的解決方案。如果企業(yè)現(xiàn)在還沒有專業(yè)的存儲設備,那么就可以采用基于硬建的解決方案。簡單的說,就是軟件與硬件一起購買。如果企業(yè)已經有了存儲設備,此時想節(jié)省磁盤空間的話,那么就可以購買軟件的解決方案?,F(xiàn)在不少的提供商已經江重復數(shù)據解決方案可以以軟件包的形式提哦能夠給客戶。
【編輯推薦】