磁帶可能是遵循摩爾定律的最后一種技術(shù),但它是數(shù)據(jù)存儲的未來?
毫不奇怪,大數(shù)據(jù)分析和人工智能的發(fā)展為企業(yè)提供了強大的未來預(yù)期,以提升有關(guān)其業(yè)務(wù)的每個可衡量方面的信息?,F(xiàn)在,相關(guān)法規(guī)要求企業(yè)保留的記錄時間比過去更長。
研究顯示,記錄的數(shù)據(jù)量每年增加30%至40%。與此同時,用于存儲大部分?jǐn)?shù)據(jù)的現(xiàn)代硬盤的容量增長率不到這一速度的一半。幸運的是,大部分信息不需要立即訪問。對于這樣的情況,磁帶是完美的解決方案。
實際上,世界上大部分?jǐn)?shù)據(jù)仍然保留在磁帶上,包括基礎(chǔ)科學(xué)數(shù)據(jù),如粒子物理和天文學(xué),人類遺產(chǎn)和國家檔案,主要電影,銀行,保險,石油勘探等。甚至還有一群人,他們的工作就是不斷改進磁帶存儲。
磁帶已存在很長一段時間了,但該技術(shù)尚未終結(jié)。恰恰相反。像硬盤和晶體管一樣,磁帶在過去幾十年中取得了巨大進步。
第一個商用數(shù)字磁帶存儲系統(tǒng)是IBM的Model 726可以在一卷磁帶上存儲大約1.1兆字節(jié)。今天,現(xiàn)代磁帶盒可容納15TB。一個機器磁帶庫最多可包含278 PB的數(shù)據(jù)。在光盤上存儲大量數(shù)據(jù)將需要超過3.97億個,如果堆疊將形成超過476公里高的塔。
確實,磁帶不能提供硬盤或半導(dǎo)體存儲器的快速訪問速度。不過,媒介的優(yōu)勢很多。首先,磁帶存儲更節(jié)能:一旦記錄了所有數(shù)據(jù),磁帶盒就會安靜地放在磁帶庫的插槽中,根本不消耗任何電能。磁帶也非??煽浚e誤率比硬盤低四到五個數(shù)量級。磁帶非常安全,具有內(nèi)置的動態(tài)加密和介質(zhì)本身提供的額外安全性。畢竟,如果磁帶未安裝在驅(qū)動器中,則無法訪問或修改數(shù)據(jù)。鑒于通過網(wǎng)絡(luò)攻擊導(dǎo)致的數(shù)據(jù)竊不斷增長,這種優(yōu)勢尤其具有吸引力。
磁帶的離線特性還為有缺陷的軟件提供了額外的防線。例如,在2011年,軟件更新中的一個缺陷導(dǎo)致Google意外刪除了大約40000個Gmail帳戶中保存的電子郵件。盡管在多個數(shù)據(jù)中心的硬盤上存儲了多個數(shù)據(jù)副本,但仍然發(fā)生了這種損失。幸運的是,數(shù)據(jù)也記錄在磁帶上,谷歌最終可以從該備份中恢復(fù)所有丟失的數(shù)據(jù)。
2011年的Gmail事件是云服務(wù)提供商首次使用磁帶進行操作的事件之一。最近,微軟讓人們知道它的Azure歸檔存儲使用IBM磁帶存儲設(shè)備。
圖:1951年:磁帶首先用于在計算機(Univac)上記錄數(shù)據(jù)。
盡管如此,企業(yè)使用磁帶的主要原因通常是簡單的經(jīng)濟學(xué)。磁帶存儲的成本是硬盤上保持相同數(shù)據(jù)量所需成本的六分之一,這就是為什么你幾乎可以在任何存儲大量數(shù)據(jù)的地方找到磁帶系統(tǒng)的原因。但由于磁帶現(xiàn)在完全從消費級產(chǎn)品中消失,大多數(shù)人都不知道它的存在,更不用說磁帶錄制技術(shù)近年來取得的巨大進步,并將在可預(yù)見的未來繼續(xù)發(fā)展。
所有這一切都是說磁帶已經(jīng)存在了幾十年,并將在未來幾十年內(nèi)存在。怎么能這么肯定?
磁帶只要有一個根本原因就能存活下來:它很便宜。而且它一直在變得越來越低成本。但總會如此嗎?
你可能期望,如果將更多數(shù)據(jù)塞入硬盤的能力正在減少,那么對于使用相同基本技術(shù)但更老的磁帶來說也是如此。令人驚訝的現(xiàn)實是,對于磁帶而言,這種容量的擴大并沒有顯示出放緩的跡象。事實上,它應(yīng)該以每年約33%的歷史速度持續(xù)多年,這意味著你可以預(yù)期大約每兩到三年就會增加一倍的容量。可以把它想象成摩爾定律的磁帶。
對于那些必須應(yīng)對存儲預(yù)算數(shù)據(jù)爆炸性增長的人來說,這是個好消息。要了解為什么磁帶仍然具有相對于硬盤的潛力,請考慮磁帶和硬盤的發(fā)展方式。
兩者都依賴于相同的基本物理機制來存儲數(shù)字?jǐn)?shù)據(jù)。它們以磁性材料薄膜中的窄軌道的形式這樣做,其中磁性在兩種極性狀態(tài)之間切換。該信息被編碼為一系列比特,由沿軌道的特定點處的磁極過渡的存在或不存在來表示。自20世紀(jì)50年代引入磁帶和硬盤以來,兩者的制造商一直受到“更密集,更快,更便宜”的口號驅(qū)使。結(jié)果,以每千兆字節(jié)容量計算的兩者的成本已經(jīng)下降多個數(shù)量級。
這些成本降低是可以記錄在磁性基板的每平方毫米上的信息密度的指數(shù)增加的結(jié)果。面密度是沿數(shù)據(jù)軌道的記錄密度和垂直方向上這些軌道的密度的乘積。
早期,磁帶和硬盤的面密度相似。但更大的市場規(guī)模和硬盤銷售收入為更大規(guī)模的研發(fā)工作提供了資金,這使得他們的制造商能夠更積極地擴大規(guī)模。因此,大容量硬盤的當(dāng)前面密度約為最新磁帶的100倍。
盡管如此,由于它們具有更大的可用于記錄的表面區(qū)域,因此最先進的磁帶系統(tǒng)可提供高達15 TB的本機盒式磁帶容量,而不是市場上容量最大的硬盤。即使兩種設(shè)備占用大約相同的空間,也是如此。
內(nèi)部和外部:現(xiàn)代線性磁帶開放(LTO)磁帶盒由單個卷軸組成。插入盒式磁帶后,磁帶自動送入驅(qū)動內(nèi)置的卷軸。
除容量外,磁帶和硬盤的性能特征當(dāng)然是非常不同的。盒式磁帶中的長帶,通常為數(shù)百米,導(dǎo)致平均數(shù)據(jù)訪問時間為50到60秒,而硬盤的平均數(shù)據(jù)訪問時間僅為5到10毫秒。但是,令人驚訝的是,將數(shù)據(jù)寫入磁帶的速率是寫入硬盤速度的兩倍多。
在過去幾年中,硬盤上數(shù)據(jù)的面密度縮放已從其歷史平均值每年約40%放緩至10%至15%之間。原因與一些基本物理有關(guān):要在給定區(qū)域中記錄更多數(shù)據(jù),你需要為每個位分配一個較小的區(qū)域。這反過來會減少你閱讀時可以獲得的信號。如果你過多地減少信號,它會因磁盤上涂有磁性顆粒的粒狀特性而產(chǎn)生噪音。
通過減少這些顆粒,可以減少背景噪音。但是很難將磁性顆??s小到一定的尺寸而不會損害它們以穩(wěn)定的方式保持磁性狀態(tài)的能力。用于磁記錄的最小尺寸在該業(yè)務(wù)中被稱為超順磁極限。而硬件制造商已經(jīng)做到了。
直到最近,這種放緩對消費者來說并不明顯,因為硬盤制造商能夠通過為每個單元添加更多的磁頭和盤片來進行補償,從而在相同尺寸的封裝中實現(xiàn)更高的容量。但現(xiàn)在,可用空間和增加更多磁頭和盤片的成本限制了制造商可以獲得的收益。
正在開發(fā)的一些技術(shù)可以使硬盤擴展超出當(dāng)今的超順磁極限。這些包括熱輔助磁記錄(HAMR)和微波輔助磁記錄(MAMR),這些技術(shù)能夠使用較小的顆粒,從而允許磁盤的較小區(qū)域被磁化。但這些方法增加了成本并引入了令人煩惱的工程挑戰(zhàn)。即使它們是成功的,根據(jù)制造商的說法,它們提供的擴展可能仍然有限。例如,西部數(shù)據(jù)最近宣布它將在2019年開始出貨MAMR硬盤,預(yù)計該技術(shù)將使面密度每年僅增加約15%。
相比之下,磁帶存儲設(shè)備目前以遠(yuǎn)低于超順磁極限的面密度工作。因此,磁帶的摩爾定律可以持續(xù)十年或更長時間,而不會遇到基礎(chǔ)物理學(xué)的這些障礙。
磁帶是一種棘手的技術(shù)。它的可拆卸性,使用薄的聚合物基板而不是剛性盤,并行同時記錄多達32個軌道,為設(shè)計人員帶來了重大障礙。這就是為什么我在IBM Research-Zurich實驗室的研究團隊一直在努力尋找能夠通過調(diào)整硬盤技術(shù)或發(fā)明全新方法來實現(xiàn)磁帶持續(xù)擴展的方法。
2015年,我們和FujiFilm公司的合作伙伴表示,通過使用垂直于膠帶定向的超小型鋇鐵氧體顆粒,可以將數(shù)據(jù)記錄為當(dāng)今商業(yè)技術(shù)可達到的密度的12倍以上。最近,與索尼存儲媒體解決方案合作,我們展示了以面密度記錄數(shù)據(jù)的可能性,該密度是目前最先進磁帶數(shù)量的20倍。為了正確看待這一點,如果要將這項技術(shù)商業(yè)化,那么現(xiàn)在可能需要十幾個磁帶盒來存檔大預(yù)算功能的所有數(shù)字組件的電影工作室,能夠?qū)⑺羞@些技術(shù)整合到一個單一的膠帶。
圖:現(xiàn)代磁帶庫可容納數(shù)百PB,而1952年推出的IBM 726可存儲幾兆字節(jié)。
為了實現(xiàn)這種程度的擴展,我們必須做出一系列技術(shù)進步。首先,提高了讀寫磁頭跟隨磁帶上細(xì)長磁道的能力,在最新的演示中,磁道只有100納米左右。
我們還必須減小數(shù)據(jù)讀取器的寬度:用于讀回記錄數(shù)據(jù)軌道的磁阻傳感器,從其當(dāng)前的微米尺寸到小于50納米。結(jié)果,我們用這么小的讀卡器拾取的信號非常嘈雜。我們通過增加介質(zhì)固有的信噪比來補償,這是磁性顆粒的尺寸和取向以及它們的組成以及磁帶表面的光滑度和光滑度的函數(shù)。為了進一步提供幫助,我們改進了設(shè)備所采用的信號處理和糾錯方案。
為了確保我們的新原型介質(zhì)能夠保留記錄數(shù)據(jù)數(shù)十年,我們改變了記錄層中磁性顆粒的性質(zhì),使其更加穩(wěn)定。但是這種改變使得首先記錄數(shù)據(jù)變得更加困難,以至于普通的磁帶傳感器無法可靠地寫入新媒介。因此,我們使用了一種特殊的寫頭,可以產(chǎn)生比傳統(tǒng)磁頭強得多的磁場。
結(jié)合這些技術(shù),我們能夠在我們的實驗室系統(tǒng)中以每英寸818000位的線性密度讀取和寫入數(shù)據(jù)。(由于歷史原因,世界各地的磁帶工程師以英寸為單位測量數(shù)據(jù)密度。)結(jié)合新技術(shù)可以處理的每英寸246200磁道,我們的原型單元的面密度達到每平方英寸201千兆位。假設(shè)一個墨盒可以容納1140米的膠帶,這是一個合理的假設(shè),基于我們使用的新磁帶介質(zhì)的厚度減小,這種面密度對應(yīng)于高達330 TB的墨盒容量。這意味著單個磁帶盒可以記錄與裝滿硬盤的獨輪車一樣多的數(shù)據(jù)。
在2015年,在信息存儲產(chǎn)業(yè)聯(lián)盟,包括惠普企業(yè),IBM,甲骨文和Quantum,與學(xué)術(shù)研究團體發(fā)布了所謂的“國際磁帶存儲路線圖。”這一預(yù)測預(yù)測,到2025年,磁帶存儲的面密度將達到每平方英寸91 Gb。根據(jù)趨勢推斷,到2028年它將超過每平方英寸200 Gb。
該路線圖的作者都對磁帶存儲的未來感興趣。但你不必?fù)?dān)心他們過于樂觀。我和我的同事最近進行的實驗室實驗表明,每平方英寸200 Gb是完全可能的。因此,在我看來,保持磁帶在至少十年的增長路徑上的可行性是非常有把握的。
實際上,磁帶可能是遵循摩爾定律規(guī)模擴展的最后一種信息技術(shù)之一,在未來十年內(nèi),即使不是超越,也能保持這種技術(shù)。而這種連續(xù)性反過來只會增加磁帶相對于硬盤驅(qū)動器和其他存儲技術(shù)的成本優(yōu)勢。