重復數(shù)據(jù)刪除技術實施主存儲優(yōu)化
主要文件系統(tǒng)存儲優(yōu)化(也就是在同樣的空間塞進更多的數(shù)據(jù))繼續(xù)在日益普及。這里的挑戰(zhàn)是主存儲的重復數(shù)據(jù)刪除并不是沒有規(guī)則的。你不能刪除這個重復的數(shù)據(jù),也不能刪除那個重復的數(shù)據(jù),你必須要認識到刪除重復數(shù)據(jù)之后對設備性能的影響。
EMC已經宣布了在自己的Celerra平臺上刪除重復數(shù)據(jù)的功能。NetApp使用這個功能已經有一段時間了。其它廠商也以積極的方式增加這個功能,其方法是在數(shù)據(jù)不流動之后對數(shù)據(jù)進行壓縮和刪除重復數(shù)據(jù)。然后,Storwize等公司一直以在線實時壓縮的方式提供這種功能。
正如存儲虛擬化和精簡配置已經證明的那樣,當你不必妥協(xié)的時候,主存儲將更好。為主存儲強加一些條件的問題是事情會變得更復雜。這種復雜性會導致人們不適用這個技術。技術越透明和越通用,取得成功的機會就越大。
一些主存儲優(yōu)化的挑戰(zhàn)是它基本上依賴于你擁有的數(shù)據(jù)類型和訪問那個數(shù)據(jù)的工作量。刪除重復數(shù)據(jù)要產生一些好處的話,顯然必須要有重復的數(shù)據(jù)。因此,每個星期進行完整的備份是刪除重復數(shù)據(jù)的理想的應用程序。另一方面,主存儲不都是重復的數(shù)據(jù)。
除了主存儲之外,刪除重復數(shù)據(jù)還與繁重的輸入/輸出任務和隨機的讀/寫輸入輸出有關。在這些情況下,用戶也許會感受到應用重復數(shù)據(jù)刪除的性能影響。
因此,大多數(shù)廠商建議把這個技術的應用限制在家目錄(home directories)和VMware鏡像方面,因為這些地方數(shù)據(jù)重復的可能性非常高,工作量主要是讀數(shù)據(jù)。
特別是不要在數(shù)據(jù)庫中使用刪除重復數(shù)據(jù)的功能。人們擔心,數(shù)據(jù)庫中有大量的重復的數(shù)據(jù),刪除重復的數(shù)據(jù)會對性能產生影響。正如我們在數(shù)據(jù)庫存儲優(yōu)化的文章中指出的那樣,減少甲骨文數(shù)據(jù)庫數(shù)據(jù)、聯(lián)機和實施壓縮解決方案也許更適合這里。數(shù)據(jù)庫是最適合壓縮的,無論是否有重復的數(shù)據(jù),實時的壓縮在大多數(shù)情況下都不會對性能產生直接的影響。
隨著數(shù)據(jù)增長繼續(xù)加快,將需要更多的數(shù)據(jù)優(yōu)化。使用多種技術也許是阻止這個潮流的唯一途徑。壓縮也許會廣泛地應用。作為應該應用于具體工作量的刪除重復數(shù)據(jù)的補充,這種刪除重復數(shù)據(jù)的做法應該應用于存檔,并且不在主存儲中使用。所有這些都需要能夠提高人員效率和資源效率的工具。
【編輯推薦】