測試:Data Domain拔得重復(fù)數(shù)據(jù)刪除頭籌
【W(wǎng)atchStor獨家譯文】重復(fù)數(shù)據(jù)刪除技術(shù)不僅能夠提高企業(yè)存儲效率,而且可以減少購買磁帶或者磁盤等存儲設(shè)備的需求,從而進一步節(jié)省了數(shù)據(jù)中心空間、能源和冷卻資源。
從廣義上講,重復(fù)數(shù)據(jù)刪除是一項分析數(shù)據(jù)文件、找出和刪除冗余信息塊、并且采用了g-zip或者LZ等壓縮算法的技術(shù)。一般來講,那些經(jīng)常被編輯但是變更很少的文件是重復(fù)數(shù)據(jù)刪除的理想對象。因此,不少企業(yè)開始考慮采用重復(fù)數(shù)據(jù)刪除解決方案來減少企業(yè)數(shù)據(jù)庫、電子郵件、服務(wù)器信息以及虛擬機鏡像的備份和歸檔所需的存儲空間。
Data Domain是重復(fù)數(shù)據(jù)刪除市場的***之一,所以我們就先來看一看這家廠商的產(chǎn)品。其他主要廠商還包括NetApp、IBM、EMC和昆騰。一般來說,對產(chǎn)品的概覽都是將重點放在重復(fù)數(shù)據(jù)刪除水平或者重復(fù)數(shù)據(jù)刪除節(jié)省下原始磁盤空間的比例上的。不僅吞吐性能和易于安裝性等重要指標(biāo),而且包括空間節(jié)約都是在實驗室環(huán)境下(例如在幾個月或者幾年時間內(nèi)許多用戶不會同時對實時數(shù)據(jù)進行頻繁而細(xì)微的變更)非常難以測量出來的。
而這次我們希望從一個不同的角度來考量重復(fù)數(shù)據(jù)刪除產(chǎn)品。我們選擇把重點放在應(yīng)用的簡便性和可能存在的問題、吞吐性能、可管理性以及功能特性。我們將先在位于紐約市的存儲實驗室進行測試,然后采訪Data Domain的用戶了解他們的實際應(yīng)用情況,從而掌握更準(zhǔn)確的實際重復(fù)數(shù)據(jù)刪除率。我們的主要目標(biāo)是評估Data Domain解決方案在多站點業(yè)務(wù)連續(xù)性方面的穩(wěn)定性。
我們的測試模擬了一個擁有一個數(shù)據(jù)中心、地區(qū)總部和分支機構(gòu)的企業(yè)。該分支機構(gòu)將350GB內(nèi)部存儲備份到本地一個DD120中,地區(qū)總部將1.2TB的內(nèi)部存儲備份到一個DD510中,而各個部門將數(shù)據(jù)中心兩個封裝了10TB存儲的外置驅(qū)動器備份到一個DD690中。每個設(shè)備都設(shè)計有***冗余性的電源、NIC、光纖通道控制器以及RAID 6磁盤陣列。我們采用了兩種方法,***個是使用Symantec Veritas NetBackup軟件進行本地備份,然后使用Data Domain的復(fù)制技術(shù)在不同Data Domain設(shè)備之間進行復(fù)制;第二種方法是采用Data Domain的OST來控制NetBackUp的所有備份和復(fù)制流程。我們發(fā)現(xiàn)一個有趣的現(xiàn)象,如果你的企業(yè)已經(jīng)采用了NBU,那么你可以保留所有陳舊的工作和規(guī)則,只要將他們直接從磁帶驅(qū)動器遷移到Data Domain驅(qū)動器中就可以了。
雖然配置過程并不簡單,但是有些方面更注重企業(yè)存儲技術(shù),而不是全面IT技術(shù)。通過遠(yuǎn)程登陸或者附加KVM使用CLI來完成安裝。我發(fā)現(xiàn),在***次登陸的時候是必須要更改默認(rèn)密碼的。我們安裝了存儲設(shè)備、復(fù)制和OST的許可,然后架構(gòu)網(wǎng)絡(luò)、文件系統(tǒng)、系統(tǒng)和管理設(shè)置。確認(rèn)設(shè)置完成之后重啟系統(tǒng),再開始安裝CIFS和NFS共享。
CLI可以幫助你結(jié)束命令、運行命令樹以及提供幫助。然而,它仍然只是CLI,而我更傾向于選擇更好一些的Web GUI。不過我認(rèn)為這是Data Domain一個最主要的缺點——雖然GUI能夠完成任務(wù),但是卻并不完善。我可以在一個屏幕下監(jiān)控所有這三個部分的運作情況,但是在真正管理的過程中就必須使用CLI。Data Domain有關(guān)負(fù)責(zé)人表示,他們的大多數(shù)用戶都是使用CLI的(這一點也在我們的調(diào)查過程中得到了證實),下一步他們將研究升級加入Web GUI的應(yīng)用。
文件資料組織縝密且信息詳盡,這遠(yuǎn)不會降低向數(shù)據(jù)中心增加新技術(shù)可能存在的問題。例如,我們使用擴展套件對DD510進行升級,在10分鐘內(nèi)配置6個250GB附加驅(qū)動器,這就組成了一個由8個磁盤構(gòu)成的RAID組、一個由6個磁盤構(gòu)成的RAID組以及能夠被每個組使用的熱備份盤。
我們的實驗室測試過程中發(fā)現(xiàn),重復(fù)數(shù)據(jù)刪除率從5倍到99倍不等,主要取決于文件類型和相同內(nèi)容備份的次數(shù)。一般來說,在你完成***次備份之后,由于壓縮的原因不會釋放太多空間,然后在接下來的備份中能夠節(jié)省下的空間慢慢增多。許多企業(yè)在備份、歸檔和業(yè)務(wù)連續(xù)性流程方面的配置與我們沒有太大區(qū)別。在通過WAN連接復(fù)制之前高效重復(fù)數(shù)據(jù)刪除所能節(jié)省下的成本和時間是非常驚人的。
在完成實驗室測試之后,我們開始對Data Domain進行走訪來了解實際應(yīng)用過程中的重復(fù)數(shù)據(jù)刪除率。我們采訪了一家名為The Rockefeller Group的公司,這是一家提供商業(yè)地產(chǎn)、地產(chǎn)服務(wù)和電信服務(wù)的公司。該公司高級IT服務(wù)工程師Sanja Kaljanac表示,他們數(shù)據(jù)中心在DD565上可以達到100倍的數(shù)據(jù)刪除率,在分支機構(gòu)的DD120上可以達到67.5倍的數(shù)據(jù)刪除率。在對其他Data Domain用戶提供的日志文件進行分析后我們發(fā)現(xiàn),壓縮率從10倍到40倍不等,DD690上的***吞吐量在每秒300~500MB之間。除了Rockefeller Group之外,其他采用了Data Domain產(chǎn)品的地產(chǎn)公司還包括Land America Financial Group and Skidmore和Owings and Merrill。
我們的實驗室測試結(jié)果和實際調(diào)查結(jié)果表明,Data Domain的重復(fù)數(shù)據(jù)刪除技術(shù)在站點間或者通過WAN連接的備份、恢復(fù)和歸檔方面具有一定的優(yōu)勢??紤]到維持多站點企業(yè)業(yè)務(wù)連續(xù)性所需的數(shù)據(jù)量,傳統(tǒng)備份方法被不斷完善甚至是突破了原有的局限性。DD120在分支機構(gòu)的應(yīng)用結(jié)合DD690或者DD510在數(shù)據(jù)中心應(yīng)用不僅能夠消除局限性,而且還會讓你對現(xiàn)有業(yè)務(wù)連續(xù)性流程進行重新評估。
l 測試產(chǎn)品總價格:293540美元
l DD690(帶有擴展架的基本架構(gòu)):210000美元
l DD510:19000美元
l DD510擴展套件:13000美元
l DD120(帶有復(fù)制功能):12500美元
l DD690復(fù)制軟件許可:35000美元
l DD510復(fù)制軟件許可:2540美元
l DD510復(fù)制軟件許可:1500美元
【W(wǎng)atchStor獨家譯稿,未經(jīng)許可禁止轉(zhuǎn)載。合作伙伴請注明原作者及出處為WatchStor.com】