存儲極客談“如何繞開一堆復(fù)雜技術(shù)參數(shù)評估SSD壽命”
✎✎✎“存儲極客”欄目再次與大家見面啦!在這里,只有一位大咖名叫“存儲”,它的粉絲我們稱為“存儲極客”!
評估存儲系統(tǒng)中SSD的壽命,既不是只有SLC、MLC、TLC之分那么簡單,卻也有辦法繞開那復(fù)雜的一大堆技術(shù)參數(shù)。我們的建議是:了解閃存特性,抓住關(guān)鍵指標(biāo),從應(yīng)用負(fù)載入手作出決策。
在前幾期的《存儲極客》系列連載中,我們跟大家討論過機械硬盤不常被人們注意的一點——讀寫壽命(建議負(fù)載,單位:TB/年)。同時也提到了“閃存有P/E cycle(編程/擦除周期)的限制,也就是通常所說的寫壽命……”
由于SSD相比HDD巨大的性能優(yōu)勢,用戶不再需要為了IOPS而去“堆磁盤”;另外SSD單盤容量(1.92、3.84TB)也已經(jīng)遠(yuǎn)超15000轉(zhuǎn)硬盤(最大600GB)。如今用3D NAND SSD替代同容量的高轉(zhuǎn)速企業(yè)級HDD,考慮到節(jié)省的盤柜空間,已經(jīng)成本更低了。在這種情況下閃存想不流行都難。
以SSD/閃存為介質(zhì)的存儲系統(tǒng),用戶適當(dāng)關(guān)注其介質(zhì)壽命是正常的。而這就是本文要討論的重點。
不同的閃存單元結(jié)構(gòu),直接影響到編程(擦除/寫入)的時間長短和次數(shù),但最終表現(xiàn)在SSD成品上的還有許多其它因素。
首先是NAND方面,這里有幾個要點:顆粒等級、制造工藝,還有2D/3D之分。比如早期業(yè)內(nèi)共識的一種分類方式是eMLC優(yōu)于MLC(cMLC),Intel用的是另外一種叫法——HET (High Endurance Technology) 和SET (Standard Endurance Technology) 。與其說今天eMLC一詞有點被“濫用”,不如承認(rèn)現(xiàn)在的企業(yè)級SSD寫耐久度范圍確實比較寬,因為還牽涉到一些NAND基礎(chǔ)單元之外的東西。
我們在以前的文章中寫到過“利用多層堆疊封裝,3D NAND能夠提高閃存顆粒的密度。同時,搭配更加成熟3x-50nm半導(dǎo)體工藝,在相同的閃存類型(比如MLC vs. MLC,TLC vs. TLC)上比現(xiàn)今前沿的1x-20nm閃存會有更好的耐久度。眾所周知,隨著cell單元尺寸的不斷縮小,NAND的P/E Cycle(編程/擦除周期)呈不斷下降趨勢,廠商們用更強大的糾錯算法以及下面要講到的“OP”來應(yīng)對。”
同樣的NAND閃存顆粒,制作成SSD閃存盤成品又可以有不同的等級。一個重要的因素是超量配置(Over Provisioning),許多朋友應(yīng)該都知道閃存的寫放大效應(yīng),這里就不詳細(xì)展開了。在其它條件相同的情況下,SSD的OP比例越大,垃圾回收效率一般就越高,控制住寫放大,寫入壽命和性能就會相應(yīng)越高。
所以,最終的結(jié)果有可能是MLC (eMLC) SSD的寫入壽命達到了SLC的水平,3D TLC超過(2D)MLC的也不鮮見。因此,對于大多數(shù)最終用戶而言,我覺得主要關(guān)注DWPD(Drive Writes Per Day)——每天可以寫入整盤容量的幾倍一項指標(biāo)即可,通常指的是5年(x365天),也有按3年標(biāo)的。
注:PBW(生命周期內(nèi)總寫入容量)= SSD容量x DWPD x天數(shù)
好在規(guī)范的企業(yè)級SSD廠商大都比較靠譜,出于對用戶負(fù)責(zé)的態(tài)度這一指標(biāo)也不會亂寫。至于支持閃存/SSD的存儲陣列,早期我看到大家普遍在配件列表中用SLC、eMLC的方式區(qū)分,如今逐漸轉(zhuǎn)向更加合理有效的方式——寫密集型、讀密集型和混合用途SSD(介于前兩者之間),分別對應(yīng)不同的DWPD區(qū)間。
接下來的一個問題是:如何判別陣列上的SSD?對于配置通用SAS接口的產(chǎn)品,一般不難看出其供應(yīng)商和型號;如果是采購之前,就要看陣列廠商的資料和報價說明。在本文中我們“走了個捷徑”,從下面這張圖說起:
眾所周知,SPC-1是評估企業(yè)存儲性能的基準(zhǔn)測試,具體一點說是模擬的OLTP交易型工作負(fù)載。這里引用的報告也不算新聞了,Dell Storage SC4020使用6個SSD,測得SPC-1 IOPS 112,479.81,性價比$0.37/SPC-1 IOPS,數(shù)據(jù)保護為鏡像方式。
為什么我們要列出這一份報告,它與閃存/SSD的等級和壽命計算又有什么關(guān)系呢?
在這個SPC-1報告的配置圖中,注明使用了480GB SAS SSD,并且根據(jù)型號“HUSMR1650ASS200”可以查到供應(yīng)商是HGST。
注:不是每一份SPC報告都會公布使用的驅(qū)動器具體型號,這也是我們使用Dell這個來分析的原因?;旧厦總€存儲系統(tǒng)廠商都會有不只一家SSD供應(yīng)商來源,因此在SC4020中如有480GB SSD來自其他品牌也屬于正常。
根據(jù)詳細(xì)的測試環(huán)境配置,生成負(fù)載的前端主機使用了一臺Dell PowerEdge R720服務(wù)器,安裝了兩顆Intel Xeon(至強)2.0GHz E5-2650 8核CPU。另外雙控的SC4020存儲每個控制器也各有一顆4核Xeon處理器。
了解到全閃存陣列測試性能和SSD配置,為我們在下一篇中繼續(xù)壽命估算和選型建議打下了基礎(chǔ)。
這款SSD屬于使用MLC閃存的Ultrastar SSD1600MR系列,其型號在HGST官網(wǎng)上的資料中對應(yīng)容量為500GB。出于統(tǒng)一的考慮,OEM的型號把SSD容量調(diào)小些也屬于正常(物理閃存容量不變)。性能參數(shù)什么的感覺都在正常范圍內(nèi),而現(xiàn)在我最關(guān)心的是PBW寫入壽命——2.4PB,4KB隨機寫。
前面提到過寫放大,它與寫入方式也有關(guān)系,企業(yè)級SSD通常是按照最差的情況——小數(shù)據(jù)塊隨機寫來考慮。按照5年365天來計算,其DWPD指標(biāo)大約為2.63。細(xì)心的讀者可能會發(fā)現(xiàn)這一數(shù)值要高于400GB和800GB的DWPD=2。
按照行業(yè)慣例的分類,這個系列SSD屬于讀密集型產(chǎn)品。
不知是否有讀者朋友和我一樣有類似的習(xí)慣——400、800GB這些容量點在企業(yè)級SSD中比480、960GB更好一些?如果前者出現(xiàn)在寫壽命更高的系列中其OP比例往往更大,但現(xiàn)在討論的情況卻表明了一點——在DWPD同級的讀密集型SSD中也可能有400、800GB這樣的型號,此時它們的物理閃存容量與500(480)、1000(960)GB顯然是不同的。
上圖引用自戴爾SC陣列上支持的SSD分類,而我們的討論并不限于某家存儲廠商。除了容量點之外,不同類別之間的最大差別就是寫入壽命和性能。無論寫密集型SSD采用SLC還是MLC,讀密集型采用MLC還是3D TLC,其DWPD值仍然保持在原來的范圍內(nèi)。
這個表里既有業(yè)內(nèi)通用的劃分方法,也補充進我了解到的情況(橙色字體)。盡管企業(yè)級讀密集型SSD的DWPD可以在0.1-3之間,但實際上DWPD<1的型號主要用于服務(wù)器啟動盤和一些寫入較少的“冷”存儲應(yīng)用(曾看到Intel有種分類將其稱為數(shù)據(jù)中心SSD,區(qū)別于傳統(tǒng)意義上的企業(yè)級)。
我們看到用于企業(yè)級閃存陣列上的SSD,一般至少要達到DWPD 1-3的范圍。
此外,據(jù)了解采用SLC閃存和5年DWPD>20的SSD會慢慢淡出主流市場。不過我們無需因此對閃存壽命有太多擔(dān)心,因為按照半導(dǎo)體存儲介質(zhì)自身的特點,生命周期總寫入量(PBW)又和SSD容量成正比,DWPD低可以用容量來補。比如說目前DWPD=25的SSD常見容量有400GB,其總寫入量為18.25PB;DWPD=10的SSD容量已達1600GB,總寫入量已高達29.2PB。
本文到此先告一段落,在下篇中將繼續(xù)分析全閃存陣列的寫入負(fù)載,包括SPC-1這樣的極限性能測試,以及更加貼近大多數(shù)用戶的計算模型。希望能夠?qū)Υ蠹疫x擇不同等級/容量的SSD帶來參考。