您了解分區(qū)存儲(chǔ)嗎?現(xiàn)在該使用它了
譯文【51CTO.com快譯】我們知道,數(shù)據(jù)繼續(xù)迅猛增加。據(jù)IDC Global Datasphere顯示,未來(lái)三年的數(shù)據(jù)量將超過(guò)以往30年的總量。數(shù)十億聯(lián)網(wǎng)系統(tǒng)將從智能視頻、消費(fèi)者和傳感器生成無(wú)數(shù)的上下文數(shù)據(jù),這些數(shù)據(jù)必須加以捕獲、轉(zhuǎn)換和分析,才能為行業(yè)、企業(yè)和人們帶來(lái)價(jià)值。
存儲(chǔ)是利用數(shù)據(jù)創(chuàng)造價(jià)值的基礎(chǔ)。面臨的挑戰(zhàn)是如何經(jīng)濟(jì)高效地構(gòu)建數(shù)據(jù)存儲(chǔ)基礎(chǔ)架構(gòu),以滿足數(shù)據(jù)需求,同時(shí)降低總體擁有成本(TCO)。
盡管業(yè)界繼續(xù)提高傳統(tǒng)硬盤(HDD)和固態(tài)硬盤(SSD)介質(zhì)的比特密度,以跟上數(shù)據(jù)增長(zhǎng)的步伐,但仍需要新方法來(lái)提高大規(guī)模存儲(chǔ)效率。為了應(yīng)對(duì)澤字節(jié)(ZB)時(shí)代的挑戰(zhàn),現(xiàn)在應(yīng)考慮的一種創(chuàng)新和架構(gòu)就是分區(qū)存儲(chǔ)(Zoned Storage)。
分區(qū)存儲(chǔ)使云服務(wù)提供商和企業(yè)數(shù)據(jù)中心客戶能夠構(gòu)建更高效、可高度擴(kuò)展的數(shù)據(jù)存儲(chǔ)層,以具有競(jìng)爭(zhēng)力的TCO滿足不斷增長(zhǎng)的數(shù)據(jù)需求。分區(qū)存儲(chǔ)得到開放規(guī)范和西部數(shù)據(jù)等公司的支持,將基于標(biāo)準(zhǔn)的工具、庫(kù)、資源和技術(shù)文檔網(wǎng)站Zoned Storage.io結(jié)合在一起,使數(shù)據(jù)中心架構(gòu)師能夠理解和利用分區(qū)塊管理的優(yōu)勢(shì)。分區(qū)塊管理背后的技術(shù)意味著,主機(jī)和存儲(chǔ)應(yīng)用程序都可以智能化地大規(guī)模放置數(shù)據(jù),以充分利用最高的可用存儲(chǔ)容量,通常使用疊瓦式磁記錄(SMR)HDD和最近規(guī)范化的面向NVMe SSD的分區(qū)命名空間(ZNS)標(biāo)準(zhǔn)。
新的工作負(fù)載和新的方法
過(guò)去十年出現(xiàn)了超大規(guī)模業(yè)者,利用規(guī)?;瘉?lái)創(chuàng)建、消費(fèi)、處理和變現(xiàn)數(shù)據(jù)。今天,許多現(xiàn)代大規(guī)模工作負(fù)載被序列化或?qū)懭氲礁蟮捻樞驂K中,包括在線備份和歸檔、視頻監(jiān)控、物聯(lián)網(wǎng)及其他機(jī)器生成的數(shù)據(jù)、確保合規(guī)的數(shù)據(jù)以及其他應(yīng)用。存儲(chǔ)密度、瓦特/TB和TCO是這些工作負(fù)載取得成功的關(guān)鍵參數(shù)。
現(xiàn)在正是求變的大好機(jī)會(huì),但需要以不同的方式訪問(wèn)和管理存儲(chǔ),更清楚地了解數(shù)據(jù)的工作負(fù)載結(jié)構(gòu)以及如何將數(shù)據(jù)放置在介質(zhì)上以獲得最佳效率。分區(qū)存儲(chǔ)為開發(fā)者和架構(gòu)師提供了工具和資源,以便將數(shù)據(jù)智能化地放置在HDD和SSD上,并進(jìn)行優(yōu)化,以獲得更好的性能、更短的延遲、穩(wěn)定的服務(wù)質(zhì)量,以及最重要的是更高的密度和更低的TCO。
分區(qū)存儲(chǔ)的版本
分區(qū)塊管理背后的技術(shù)意味著主機(jī)和存儲(chǔ)應(yīng)用程序都可以智能化地大規(guī)模放置數(shù)據(jù),以充分利用最高的可用存儲(chǔ)容量,通常使用SMR HDD和最近規(guī)范化的面向NVMe SSD的ZNS標(biāo)準(zhǔn)。
SMR專用于HDD,數(shù)據(jù)磁道彼此重疊,利用了讀磁頭比寫磁頭小得多的事實(shí)。通過(guò)將HDD數(shù)據(jù)磁道彼此重疊在一起,可以在同樣的空間獲得高得多的磁錄密度和容量。Dropbox改用了主機(jī)管理的SMR硬盤,與傳統(tǒng)硬盤相比,使用SMR可以多存儲(chǔ)20%的數(shù)據(jù),因而節(jié)省了20%的成本。Dropbox繼續(xù)走這條戰(zhàn)略道路,利用最高的存儲(chǔ)密度和最低的TCO,其云基礎(chǔ)架構(gòu)為6億多在線客戶提供服務(wù)。
ZNS帶來(lái)了最適合多租戶、超高容量硬盤、更高性能、服務(wù)質(zhì)量和利用率的新一代SSD,同時(shí)最大限度地降低了公共云和內(nèi)部企業(yè)基礎(chǔ)架構(gòu)的TCO。
ZNS將SSD劃分為固定大小的區(qū)域,每個(gè)區(qū)域內(nèi)按順序?qū)懭搿5F(xiàn)在這些區(qū)域與NAND本身的底層架構(gòu)緊密相連(晶片、平面、讀取頁(yè)和刪除頁(yè)),因此將數(shù)據(jù)視為塊消除了許多復(fù)雜性。
ZNS SSD和SMR HDD在業(yè)界遵循相似的現(xiàn)有協(xié)同效應(yīng),因此可以在標(biāo)準(zhǔn)化的統(tǒng)一分區(qū)存儲(chǔ)軟件框架下,跨ZNS SSD和SMR HDD使用主機(jī)軟件。
通過(guò)部署ZNS SSD,使用ZNS可將數(shù)據(jù)中心性能提高4倍,將服務(wù)質(zhì)量提高2.5倍。在當(dāng)前基于SSD的傳統(tǒng)部署中,應(yīng)用程序并不將數(shù)據(jù)放置方面的信息從主機(jī)傳遞到SSD。因此,使用傳統(tǒng)SSD部署的應(yīng)用程序常常帶來(lái)更高的WAF(寫入放大),因?yàn)楫?dāng)數(shù)據(jù)通過(guò)直至SSD的應(yīng)用程序堆棧寫入到存儲(chǔ)介質(zhì)時(shí),每一層都獨(dú)立地執(zhí)行垃圾收集操作。這導(dǎo)致部署環(huán)境出現(xiàn)低效現(xiàn)象,從而導(dǎo)致總體性能降低,并降低應(yīng)用程序的服務(wù)質(zhì)量。而在基于ZNS SSD的部署環(huán)境中,應(yīng)用程序可以將數(shù)據(jù)智能化放置到SSD中,只需將數(shù)據(jù)寫入到分區(qū),因而消除了WAF,并為應(yīng)用程序提供一貫很高的服務(wù)質(zhì)量。
為什么現(xiàn)在是使用分區(qū)存儲(chǔ)的時(shí)候?
業(yè)界正處于一個(gè)關(guān)鍵時(shí)刻:存儲(chǔ)效率的提高不僅取決于更高的比特密度,還取決于應(yīng)用程序和操作系統(tǒng)如何將數(shù)據(jù)智能化放置到存儲(chǔ)設(shè)備這方面取得的重大進(jìn)展。降低TCO可以通過(guò)以下方式來(lái)實(shí)現(xiàn):不再將所有存儲(chǔ)設(shè)備視作隨機(jī)I/O、512K/4KB扇區(qū)架構(gòu),并且改動(dòng)擁有順序?qū)懭雺K數(shù)據(jù)(有類似的生命周期)的許多大規(guī)模工作負(fù)載,以適應(yīng)分區(qū)存儲(chǔ)HDD和SSD的實(shí)際物理特性。
分區(qū)存儲(chǔ)為數(shù)據(jù)中心架構(gòu)師提供了現(xiàn)在開始為SMR HDD和ZNS SSD設(shè)計(jì)的能力,不僅可以利用最高容量的數(shù)據(jù)存儲(chǔ)解決方案,還可以從未來(lái)的角度考慮長(zhǎng)期數(shù)據(jù)戰(zhàn)略,并優(yōu)化工作負(fù)載,以最低的TCO獲得更高的效率和性能。通過(guò)充分利用支持SMR HDD和ZNS SSD的統(tǒng)一軟件堆棧,云服務(wù)提供商和數(shù)據(jù)中心架構(gòu)有望收回成本,還可以擴(kuò)大規(guī)模以適應(yīng)未來(lái)數(shù)據(jù)增長(zhǎng)。
原文標(biāo)題:Why Zoned Storage, and Why Now?,作者:Swapna Yasarapu
【51CTO譯稿,合作站點(diǎn)轉(zhuǎn)載請(qǐng)注明原文譯者和出處為51CTO.com】