消除重復(fù)數(shù)據(jù)刪除的四大誤區(qū)
導(dǎo)讀:重復(fù)數(shù)據(jù)刪除技術(shù)的產(chǎn)生是有一定的淵源,那就從頭說起,雖然現(xiàn)在存儲(chǔ)介質(zhì)的價(jià)格直線下滑,單位存儲(chǔ)成本已經(jīng)很低。但是仍然跟不上企業(yè)數(shù)據(jù)文件增長(zhǎng)的速度。隨之而來的,能源消耗、數(shù)據(jù)備份管理等等也都成了老大難問題。而且一些重復(fù)的文件也隨著增多了。為此企業(yè)現(xiàn)在迫切需要一門技術(shù),能夠確保在存儲(chǔ)設(shè)備中存儲(chǔ)的是***的文件。在這種背景下,重復(fù)數(shù)據(jù)刪除技術(shù)就應(yīng)運(yùn)而生啦。重復(fù)數(shù)據(jù)刪除技術(shù)的目的很簡(jiǎn)單,就是確保存儲(chǔ)的文件不重復(fù),從而減少數(shù)據(jù)容量。不過在實(shí)際工作中,由于種種原因用戶對(duì)這個(gè)技術(shù)還存在著一些誤解。消除這些誤區(qū),對(duì)于大家正確使用重復(fù)數(shù)據(jù)刪除技術(shù)很關(guān)鍵。
誤區(qū)一:后期處理重復(fù)數(shù)據(jù)刪除技術(shù)的工作時(shí)機(jī)。
重復(fù)數(shù)據(jù)刪除技術(shù)根據(jù)其實(shí)現(xiàn)的方式可以分為“聯(lián)機(jī)重復(fù)數(shù)據(jù)刪除技術(shù)”和“后期處理重復(fù)數(shù)據(jù)刪除技術(shù)”。兩個(gè)技術(shù)各有各的特點(diǎn)。不過由于“后期處理重復(fù)數(shù)據(jù)刪除技術(shù)”這個(gè)名字起得有點(diǎn)其一,所以不少用戶對(duì)此存在著誤解。如一些人會(huì)誤認(rèn)為后期處理重復(fù)數(shù)據(jù)刪除方式是當(dāng)所有數(shù)據(jù)備份過程結(jié)束后才進(jìn)行驗(yàn)證、刪除操作的。如果大家這么認(rèn)為,那么就是大錯(cuò)特錯(cuò)了。
其實(shí)后期處理重復(fù)數(shù)據(jù)刪除技術(shù)通常是在虛擬的磁帶介質(zhì)寫入備份數(shù)據(jù)后就開始進(jìn)行工作了。也就是說實(shí)在等待虛擬磁帶寫滿之后就開始。當(dāng)然這中間根據(jù)需要有一定的延遲。如存儲(chǔ)管理員可以根據(jù)不同的情況對(duì)這個(gè)延遲進(jìn)行設(shè)置??梢灾谎舆t短短的幾分鐘,也可以延遲幾個(gè)小時(shí)。延遲時(shí)間具體為多少,主要還是根據(jù)企業(yè)的實(shí)際情況來選擇。如有些管理員可能會(huì)將這個(gè)作業(yè)放在服務(wù)器比較空閑的時(shí)候進(jìn)行,此時(shí)就會(huì)把這個(gè)延遲設(shè)置的比較長(zhǎng)一點(diǎn),如等到下班后進(jìn)行等等。
這里需要注意的是一般情況下,為了提高數(shù)據(jù)備份的效率,會(huì)對(duì)數(shù)據(jù)備份進(jìn)行分組管理。此時(shí)等待時(shí)間是從***組備份任務(wù)傳送備份數(shù)據(jù)流開始算起。當(dāng)***盤虛擬的備份磁帶寫滿或者***組備份數(shù)據(jù)寫入結(jié)束后,重復(fù)數(shù)據(jù)刪除處理就不存在延遲等待問題。這主要是因?yàn)楫?dāng)系統(tǒng)在進(jìn)行前一組寫入備份數(shù)據(jù)進(jìn)行重復(fù)數(shù)據(jù)刪除處理時(shí),被分系統(tǒng)可以繼續(xù)往后續(xù)虛擬磁帶介質(zhì)中寫入第二組的備份數(shù)據(jù)。簡(jiǎn)單的說,就是重復(fù)數(shù)據(jù)處理作業(yè)與備份數(shù)據(jù)的寫入作業(yè)可以獨(dú)立運(yùn)行。從而提高數(shù)據(jù)處理的效率。
誤區(qū)二:后期處理重復(fù)數(shù)據(jù)刪除方式會(huì)降低整體備份的效率。
如果光從技術(shù)上看,這個(gè)結(jié)論是成立的。一方面重復(fù)刪除方式會(huì)占用服務(wù)器的資源。另一方面,重復(fù)刪除方式存在著一定的延遲。但是這是一個(gè)比較孤立的觀點(diǎn)。因?yàn)楦鶕?jù)現(xiàn)在的重復(fù)數(shù)據(jù)刪除技術(shù),完全可以通過合理的配置來消除這種負(fù)面影響。
在實(shí)際工作中,如果技術(shù)人員發(fā)現(xiàn)后期處理重復(fù)數(shù)據(jù)刪除技術(shù)降低了數(shù)據(jù)備份的效率,那么可以通過如下幾種方式來消除這個(gè)不利影響。一是可以將重復(fù)數(shù)據(jù)刪除技術(shù)分配到多個(gè)單獨(dú)的服務(wù)器上來分擔(dān)服務(wù)器的壓力。一般情況下在對(duì)已寫入的備份數(shù)據(jù)進(jìn)行重復(fù)數(shù)據(jù)刪除時(shí),不同的處理引擎往往會(huì)訪問同一磁盤陣列。不過現(xiàn)在的技術(shù)可以使得他們?cè)L問同一磁盤陣列的不同區(qū)域。換句話說,就是可以實(shí)現(xiàn)高速的并發(fā)處理。這樣的話,就不會(huì)和持續(xù)寫入的備份數(shù)據(jù)流產(chǎn)生任何的沖突,從而不會(huì)影響數(shù)據(jù)備份的效率。二是可以適當(dāng)調(diào)整數(shù)據(jù)延遲的時(shí)間。如可以縮短延遲時(shí)間,或者適當(dāng)延長(zhǎng)延遲時(shí)間避開數(shù)據(jù)備份的高峰時(shí)間等等。
總之,后期處理重復(fù)數(shù)據(jù)刪除技術(shù)在一定程度上確實(shí)會(huì)影響到數(shù)據(jù)備份的整體效率。但是通過合理的配置,可以將這個(gè)負(fù)面影響降低到***的程度。至少與其優(yōu)勢(shì)相比,這個(gè)負(fù)面影響是可以忽略不計(jì)的。
誤區(qū)三:降低備份數(shù)據(jù)流的讀取速度不利于數(shù)據(jù)備份。
從技術(shù)上說,在同等條件下采取重復(fù)刪除技術(shù),肯定會(huì)在一定程度上降低備份數(shù)據(jù)流的讀取速度。但是存儲(chǔ)管理員需要明白一點(diǎn),評(píng)價(jià)一個(gè)技術(shù)是否合適,并不能夠只看一個(gè)指標(biāo),而應(yīng)該從總體上去評(píng)價(jià)。簡(jiǎn)單的說,需要評(píng)價(jià)一下總體的備份時(shí)間是否有所縮
另外值得一提的是,如果采取重復(fù)數(shù)據(jù)刪除技術(shù)的話,一般要求相關(guān)設(shè)備要有比較高的配置或者性能。因?yàn)閺臄?shù)據(jù)備份的任務(wù)來看,其實(shí)包括兩個(gè)部分,分別為數(shù)據(jù)的傳統(tǒng)備份與重復(fù)數(shù)據(jù)刪除作業(yè)。雖然說這兩個(gè)作業(yè)可以獨(dú)立運(yùn)行,但是其運(yùn)行所需要的時(shí)間是不同的。而只有黨重復(fù)數(shù)據(jù)刪除處理結(jié)束之后,整個(gè)備份作業(yè)才算真正完成。故如果后期處理重復(fù)數(shù)據(jù)刪除設(shè)備的性能比較差時(shí),就會(huì)降低系統(tǒng)的重復(fù)數(shù)據(jù)刪除比。故筆者在部署這個(gè)項(xiàng)目的時(shí)候,往往會(huì)對(duì)重復(fù)數(shù)據(jù)刪除設(shè)備進(jìn)行評(píng)估與測(cè)試,看其性能上是否能夠滿足要求。
在現(xiàn)實(shí)工作中有很多案例可以說明,雖然采用重復(fù)數(shù)據(jù)刪除技術(shù)后會(huì)在一定程度上降低存儲(chǔ)數(shù)據(jù)流的讀取速度,但是卻可縮短整個(gè)備份作業(yè)所花的時(shí)間,能夠滿足RTO的需求。有句俗話說的好,只看結(jié)果不看過程。評(píng)價(jià)任何一門技術(shù)都是如此,應(yīng)該從一個(gè)整體上進(jìn)行評(píng)價(jià),而不能夠某幾個(gè)個(gè)別的指標(biāo)。否則的話,就可能會(huì)引起用戶的誤判。
誤區(qū)四:重復(fù)數(shù)據(jù)刪除技術(shù)與備份數(shù)據(jù)流寫入作業(yè)無法同時(shí)運(yùn)行。
如果備份數(shù)據(jù)流在寫入的時(shí)候,只對(duì)同一個(gè)磁盤進(jìn)行操作,那么這個(gè)問題確實(shí)存在。但是在現(xiàn)實(shí)工作中,這是根本不存在的。因?yàn)樵趯?shí)際應(yīng)用中,重復(fù)數(shù)據(jù)刪除技術(shù)往往是跟虛擬存儲(chǔ)等結(jié)合使用的。也就是說,一般會(huì)將備份數(shù)據(jù)流寫入到多盤虛擬磁帶介質(zhì)中。而實(shí)際寫入磁帶的數(shù)量往往會(huì)遠(yuǎn)遠(yuǎn)大于用戶實(shí)際擁有的磁帶驅(qū)動(dòng)總數(shù)。
上文中就是大家可能對(duì)重復(fù)數(shù)據(jù)刪除技術(shù)的誤解,希望大家通過本文的學(xué)習(xí)之后能夠正視重復(fù)數(shù)據(jù)刪除技術(shù),讓重復(fù)數(shù)據(jù)刪除技術(shù)很好的為用戶服務(wù)。
【編輯推薦】