存儲(chǔ)極客 | 普及閃存知識(shí)：搞懂那些晦澀難懂的名詞

作者：佚名 2015-12-28 15:46:08

存儲(chǔ) 存儲(chǔ)軟件

“存儲(chǔ)極客”欄目再次與大家見(jiàn)面啦!在這里，只有一位大咖名叫“存儲(chǔ)”，它的粉絲我們稱為“存儲(chǔ)極客”!

存儲(chǔ)極客

這是一群存儲(chǔ)偏執(zhí)狂

為存儲(chǔ)而生，跟存儲(chǔ)死磕

各具獨(dú)家秘笈

有觀點(diǎn)，有碰撞，有干貨

從8月18起

做客存儲(chǔ)極客欄目

與你分享存儲(chǔ)里的那點(diǎn)事兒

前不久，全球閃存峰會(huì)(Flash Memory Summit，以下簡(jiǎn)稱FMS)的技術(shù)委員會(huì)主席Brian Berg在北京演講時(shí)表示，“摩爾定律是一個(gè)非常偉大的定律，但是在閃存市場(chǎng)，現(xiàn)在看來(lái)閃存技術(shù)的發(fā)展是可以超過(guò)摩爾定律的。”

什么?沒(méi)聽(tīng)錯(cuò)吧?戈登·摩爾那個(gè)偉大的摩爾定律，那個(gè)縱貫微處理器乃至整個(gè)半導(dǎo)體行業(yè)技術(shù)發(fā)展的摩爾定律，會(huì)在閃存技術(shù)的發(fā)展中，失效?但是顯然，當(dāng)著會(huì)議現(xiàn)場(chǎng)1000多位聽(tīng)眾，Brian Berg身為全球***閃存、內(nèi)存方面會(huì)議的技術(shù)主席，不會(huì)是信口開(kāi)河，那么，問(wèn)題顯然就轉(zhuǎn)變?yōu)榱耍?ldquo;為什么閃存技術(shù)的發(fā)展會(huì)超過(guò)摩爾定律?”

首先，讓我們先回顧一下摩爾定律：在價(jià)格不變的前提下，集成電路芯片上所集成的電路的數(shù)目，每隔18個(gè)月就翻一番。在過(guò)去的五十年(摩爾定律是1965年提出的)，摩爾定律一直發(fā)揮著效用，但是在最近幾年，隨著制程工藝的進(jìn)步變得越來(lái)越難，認(rèn)為英特爾等處理器供應(yīng)商無(wú)法繼續(xù)延續(xù)摩爾定律發(fā)展的觀點(diǎn)甚囂塵上。但在閃存技術(shù)上，卻截然相反，持Brian Berg同樣觀點(diǎn)的人認(rèn)為：“閃存技術(shù)的發(fā)展正在打破摩爾定律，這種打破，是超越而不是無(wú)法遵從。”

但為什么閃存技術(shù)會(huì)出現(xiàn)超越摩爾定律的情況呢?眾所周知，閃存同樣是一種半導(dǎo)體技術(shù)，其整體容量和性能發(fā)展，應(yīng)當(dāng)充分遵從摩爾定律，特別是閃存技術(shù)(比如NAND Flash)的制程工藝步進(jìn)與處理器是類似的：

NAND閃存制程

還不是很突出

2014年市場(chǎng)上的主流制程技術(shù)是三星和東芝的19nm以及SK海力士和英特爾/美光的20nm;2015年，市場(chǎng)正逐步過(guò)渡到15nm和16nm技術(shù);到2016年第四季度，除東芝將提供13nm左右的制程工藝之外，三星、SK海力士、英特爾/美光將會(huì)把支撐維持在14nm制程級(jí)別——事實(shí)上，英特爾的14nm制程處理器上市已經(jīng)有很長(zhǎng)一段時(shí)間了，閃存技術(shù)到2016年如果采用14nm制程的話，要比英特爾的微處理器晚了接近3年的時(shí)間。

但事實(shí)卻是，閃存技術(shù)的發(fā)展，特別是企業(yè)級(jí)產(chǎn)品的普及速度確實(shí)超乎想象的快：如今在不考慮壓縮或重復(fù)數(shù)據(jù)刪除技術(shù)的前提下，以戴爾為例，其全閃存陣列的每GB裸容量已經(jīng)能夠降低到1.5-1.6美元這個(gè)區(qū)間，也就是說(shuō)，大約一年的時(shí)間，企業(yè)級(jí)全閃存陣列的價(jià)格最多降低了60-70%。

另一方面，我們來(lái)看企業(yè)級(jí)SSD，同樣是一年前，業(yè)界主流產(chǎn)品的***容量是3.84TB，現(xiàn)在這一數(shù)字是6.4TB，也就是大約提高了一倍，而單盤(pán)價(jià)格實(shí)際上還略微下降;而據(jù)三星在今年8月份在FMS上展示的路線圖顯示，最早今年年底，最遲明年上半年，三星將可以在2.5英寸封裝中提供約16TB的容量(15.36TB)。

閃存容量的提高顯然是和NAND Flash的單位容量及密度有關(guān)的，單顆NAND Flash芯片的容量越高，或者說(shuō)單位面積上的NAND Flash的容量密度越高，SSD的容量(以2.5英寸封裝的SAS、SATA或SFF-8639盤(pán)為標(biāo)準(zhǔn))也就越高。

3D TLC NAND Flash：

這么多前綴，怎么解釋?

在閃存技術(shù)最開(kāi)始興起的那幾年，我們最常見(jiàn)到的閃存是SLC和MLC，前者即Single-Level Cell，每NAND Flash Cell上都存儲(chǔ)1bit的數(shù)據(jù)，壽命、性能***，但也更貴，后者即Multi-Level Cell，即2bit/cell，壽命和性能相比SLC有所下降，但成本大約只是SLC的30%左右。

所謂3D TLC NAND Flash中的TLC，與SLC、MLC所描述的對(duì)象是相同的，即Trinary-Level Cell，即3bit/cell，在一個(gè)Cell上做到存儲(chǔ)3bit的數(shù)據(jù)是一件相對(duì)比較難的事情，成本只是每單元2bit的MLC閃存的約三分之二，速度和壽命表現(xiàn)雖然相比MLC有所下降，但相對(duì)傳統(tǒng)HDD而言，仍然是天壤之別。

但為什么TLC要比MLC更難實(shí)現(xiàn)呢?這就要說(shuō)下NAND Flash的“存儲(chǔ)機(jī)制”，或者說(shuō)是“如何存儲(chǔ)數(shù)據(jù)”：眾所周知，計(jì)算機(jī)存儲(chǔ)的數(shù)據(jù)是二進(jìn)制，也就是1和0，在半導(dǎo)體上，這實(shí)際上可以簡(jiǎn)單地理解為“有電”“沒(méi)電”或是“電壓高”“電壓低”，也就是只要有可以通過(guò)電位表達(dá)“非黑即白”就可以了。

所以，對(duì)NAND Flash寫(xiě)入1，就是控制Control Gate去充電，使得存儲(chǔ)的電荷夠多，超過(guò)閾值Vth，就表示1了，而對(duì)于寫(xiě)入0，就是將其放電，電荷減少到小于Vth，就表示0了——在MLC中，其實(shí)現(xiàn)機(jī)制就是，通過(guò)控制內(nèi)部電荷的多少，分成多個(gè)閾值，從而儲(chǔ)存為不同的數(shù)據(jù)。

試想，在2bit/Cell的MLC中要分為幾個(gè)閾值?要是3bit/Cell呢?事實(shí)上，理論上簡(jiǎn)單的事情，在實(shí)際中就顯得比較麻煩了：相比SLC來(lái)說(shuō)，MLC已經(jīng)需要控制4個(gè)狀態(tài)，即00、01、10、11，TLC就需要控制多達(dá)8個(gè)狀態(tài)，顯然這是一個(gè)非常困難的事情，每Cell的bit數(shù)量越多，閾值越多、狀態(tài)越多，更為重要的是，閾值之間的電壓差也就越小(總不能內(nèi)部搞個(gè)幾萬(wàn)伏高壓吧……)，出錯(cuò)的概率自然也就越高。

需要補(bǔ)充的是，業(yè)界還是有一些“瘋子”是不相信自己做不到任何事情的，某些供應(yīng)商正在考慮4bit的NAND Flash，從來(lái)自NAND Flash生產(chǎn)設(shè)備供應(yīng)商的消息顯示，東芝很可能是4bit技術(shù)的主要推動(dòng)者，但就東芝方面的消息表示，“這個(gè)東西基本上做出來(lái)，很難。”

接下來(lái)就要說(shuō)到3D TLC NAND Flash中的3D，這就涉及到NAND Flash的Die的設(shè)計(jì)，而在此之前，我們要對(duì)NAND Flash的幾個(gè)主要名詞做個(gè)解釋。

在NAND Flash中，每一個(gè)“芯片”分為Die、Plane、Block和Page，這里所說(shuō)的芯片，即每一個(gè)封裝好的Chip，Die則是晶圓上的小方塊，在一個(gè)NAND Flash芯片中，可以封裝多個(gè)Die，無(wú)論工藝、技術(shù)有如何不同，Die的概念都是基本相同的。

Plane則是NAND Flash能夠根據(jù)讀、寫(xiě)、擦除等命令進(jìn)行操作的最小單位，一個(gè)Plane里面以矩陣的形式包含了若干個(gè)Block，這是NAND Flash的最小擦除單位，其中包含了若干個(gè)Page，這是NAND Flash的最小讀寫(xiě)單位(其中包含若干個(gè)Byte)。

說(shuō)回到“3D”，為什么叫3D呢?這是因?yàn)檫^(guò)去NAND Flash主要是以2D的形式，也就是在平面上排列NAND Flash Cell(存儲(chǔ)單元)，但三星、東芝等公司后來(lái)發(fā)現(xiàn)，完全可以采用多層堆疊的方式，于是也就出現(xiàn)了32層乃至48層堆疊的NAND Flash。以三星采用的3D Charge Trap Flash(簡(jiǎn)稱CTF)結(jié)構(gòu)設(shè)計(jì)的3D TLC V-NAND Flash為例，其精密程度已經(jīng)邁入到每顆芯片包含853億個(gè)Cell，以3bit/Cell來(lái)計(jì)算，一共能存儲(chǔ)約2560億bit數(shù)據(jù)。也就是說(shuō)，在一個(gè)指尖大小的NAND Flash芯片上，可以存儲(chǔ)256Gb的數(shù)據(jù)，而晶圓密度是上一代產(chǎn)品的1.4倍。

東芝NAND Flash業(yè)務(wù)高層Shigeo Ohshima曾透露，NAND Flash的容量會(huì)有“持續(xù)的、爆發(fā)式的、翻倍的增長(zhǎng)”，他認(rèn)為，2016年，體積不變的情況下(2.5英寸封裝)容量可以達(dá)到32TB，2017年是64TB，2018年是128TB(歷史同期來(lái)看，傳統(tǒng)HDD的容量增長(zhǎng)預(yù)測(cè)是到2020年20-40TB)。

相比東芝計(jì)劃開(kāi)戰(zhàn)4bit/Cell的NAND Flash，三星則熱衷于“堆積木”，這家公司對(duì)當(dāng)前的32層、48層NAND Flash都不太滿意，放言“2、3年內(nèi)會(huì)出現(xiàn)100層以上堆疊的NAND Flash”，不知道到時(shí)候東芝心情如何?

說(shuō)了這么多美麗的遠(yuǎn)景，看起來(lái)NAND Flash市場(chǎng)是光明一片，至少對(duì)三星、美光、SK海力士、東芝等供應(yīng)商來(lái)說(shuō)，摩爾定律基本上不夠這些公司通過(guò)3bit、4bit、32層、48層等技術(shù)來(lái)進(jìn)行追趕的了，但摩爾定律的關(guān)鍵在于：既然是“在價(jià)格不變的前提下”。那么技術(shù)先進(jìn)了這么多，密度提高了這么多，成本也自然會(huì)下降這么多，那什么時(shí)候NAND Flash會(huì)出現(xiàn)大規(guī)模的降價(jià)呢?

熬著不降價(jià)?

等到2016年再看!

3、4年前，市場(chǎng)上對(duì)NAND Flash的降價(jià)可謂是“一往情深”，NAND Flash供應(yīng)商也好，企業(yè)級(jí)存儲(chǔ)系統(tǒng)的供應(yīng)商也罷，媒體、分析機(jī)構(gòu)、渠道，都認(rèn)為“NAND Flash會(huì)馬上進(jìn)入快速價(jià)格下降通道”，從而快速的取代傳統(tǒng)HDD在高端、高性能存儲(chǔ)介質(zhì)層的位置。

換句話說(shuō)，市場(chǎng)非常相信摩爾定律的“魔力”在NAND Flash市場(chǎng)上也能夠發(fā)揮如同處理器一樣的功效，快速取代過(guò)去近三十年發(fā)展速度遠(yuǎn)遠(yuǎn)追趕不上處理器、內(nèi)存的傳統(tǒng)HDD存儲(chǔ)介質(zhì)，可惜，市場(chǎng)告訴我們：真相永遠(yuǎn)只有一個(gè)，并且這一個(gè)永遠(yuǎn)都是最殘酷的那個(gè)。

根據(jù)市場(chǎng)調(diào)查機(jī)構(gòu)的數(shù)據(jù)，2009年至2014年，NAND Flash市場(chǎng)的每GB價(jià)格年均跌幅，只有2009年、2011年和2012年超過(guò)了30%，在2010年、2013年和2014年，每GB成本下降都只有15%、18%和27%;在2015年至2016年，這一數(shù)字實(shí)際上預(yù)期也只是維持在25%-30%的水平上，這一降幅，離摩爾定律所說(shuō)的“每18個(gè)月翻(降)一番”，可是遠(yuǎn)得很!

事實(shí)上，這也就是為什么過(guò)去3-4年，NAND Flash的出貨量一直維持在年均增長(zhǎng)40-50%這樣一個(gè)水平線上的主要原因，那么，為什么價(jià)格一直遲遲不能真的遵守摩爾定律呢?

這里面的原因非常多也非常復(fù)雜，但總的來(lái)說(shuō)，核心原因有兩個(gè)：第一，在東芝、三星、SK海力士之間的競(jìng)爭(zhēng)中，幾乎所有的NAND Flash供應(yīng)商都被卷在了這個(gè)漩渦中，制程工藝從20nm、16nm到14nm快速推進(jìn)，1bit、2bit、3bit的介質(zhì)不斷更新，32層、48層的堆疊快速成型，這些技術(shù)上的進(jìn)步都影響著這些NAND Flash供應(yīng)商的生產(chǎn)線升級(jí)、產(chǎn)品設(shè)計(jì)生產(chǎn)、供貨產(chǎn)業(yè)鏈以及市場(chǎng)推廣和渠道費(fèi)用，有一位三星的內(nèi)部人士曾經(jīng)這樣認(rèn)為：“原本3年內(nèi)要拿出來(lái)的產(chǎn)品，被壓縮到2年，再壓縮到18個(gè)月，相當(dāng)于用兩代產(chǎn)品的成本去獲取1代產(chǎn)品的收入”，所以在如此巨大的成本壓力之下，NAND Flash供應(yīng)商要承受的壓力可想而知。

第二個(gè)原因和前一個(gè)息息相關(guān)，那就是NAND Flash供應(yīng)商希望能夠在閃存市場(chǎng)上持續(xù)獲得“與性能提升成正比的利潤(rùn)率提升”，就像三星將傳統(tǒng)HDD業(yè)務(wù)出售之后，他們不僅希望高利潤(rùn)能夠緩解產(chǎn)品迭代所造成的成本壓力，更希望能夠從NAND Flash和傳統(tǒng)HDD之間巨大的性能差距上獲得高額利潤(rùn)，這也是NAND Flash供應(yīng)商遲遲不愿意降價(jià)的主要原因。

從上述的原因說(shuō)明來(lái)看，阻礙NAND Flash價(jià)格下降的原因，主要是出在NAND Flash供應(yīng)商本身，這意味著降價(jià)空間實(shí)際上是比較大的，根據(jù)市場(chǎng)分析機(jī)構(gòu)的預(yù)計(jì)，各大NAND Flash供應(yīng)商的成本承受能力，大約在2016年上半年會(huì)基本上被充分釋放，也就是說(shuō)，2016年下半年，NAND Flash會(huì)迎來(lái)一波比較大的價(jià)格下降，預(yù)計(jì)2016年全年的NAND Flash價(jià)格下滑能夠超過(guò)40%，逼近50%。

提前釋放降價(jià)空間，

須保證性能和可靠性

通過(guò)率先引入企業(yè)級(jí)TLC 3D NAND SSD，戴爾能夠提供更具價(jià)格競(jìng)爭(zhēng)力的全閃存陣列，并在維護(hù)期內(nèi)無(wú)條件更換故障SSD(不計(jì)數(shù)據(jù)寫(xiě)入量/磨損程度)。這種承諾在顯示出技術(shù)信心的同時(shí)，也讓用戶更加放心。

不過(guò)，對(duì)企業(yè)級(jí)存儲(chǔ)系統(tǒng)的用戶來(lái)說(shuō)，大可不必等到2016年，前面我們說(shuō)過(guò)，戴爾已經(jīng)將全閃存陣列的價(jià)格推進(jìn)到每GB物理容量1.66美元(僅供參考，與具體配置有關(guān))。需要指出的一點(diǎn)是，某些存儲(chǔ)系統(tǒng)供應(yīng)商雖然也通過(guò)數(shù)據(jù)縮減技術(shù)給出了更好看的數(shù)字，但其中一些會(huì)影響到性能。而戴爾SC陣列還支持增強(qiáng)型壓縮，其***特點(diǎn)是通過(guò)與備受好評(píng)的自動(dòng)分層存儲(chǔ)巧妙結(jié)合，其壓縮動(dòng)作成為定期執(zhí)行的后臺(tái)任務(wù)，從而有效避免了對(duì)寫(xiě)入性能的影響。同時(shí)，在不額外添加專用硬件的情況下，高效壓縮算法保證了讀性能不下降。

3D NAND在一定程度上改善了TLC的寫(xiě)入壽命，而戴爾SC還能通過(guò)獨(dú)特的自動(dòng)分層存儲(chǔ)技術(shù)，在讀密集型閃存和寫(xiě)密集型閃存之間做讀/寫(xiě)分離，進(jìn)一步保障經(jīng)濟(jì)型企業(yè)級(jí)閃存的可靠性。只需要加入一個(gè)高寫(xiě)入耐久度的SLC/eMLC SSD分層承擔(dān)所有寫(xiě)入負(fù)載，既保障了性能，又使隨機(jī)/重復(fù)的數(shù)據(jù)IO能夠合并優(yōu)化地導(dǎo)入至TLC SSD，達(dá)到了“少花錢(qián)，多辦事”的目的。

上圖來(lái)自本月在美國(guó)舉行的閃存峰會(huì)上一場(chǎng)戴爾的演講《Redefining the Economics of Enterprise Storage》。根據(jù)其中的統(tǒng)計(jì)數(shù)據(jù)，在20多個(gè)月的服務(wù)監(jiān)測(cè)周期內(nèi)，Tier 2分層中66%的SSD驅(qū)動(dòng)器只有不到0.1 DWPD的寫(xiě)入壓力。進(jìn)一步的說(shuō)明包括：

1.所有進(jìn)來(lái)的寫(xiě)入被引導(dǎo)至Tier 1，數(shù)據(jù)只是按需移動(dòng);(注：取決于用戶實(shí)際寫(xiě)入量和Replay快照設(shè)置的周期)

2.Tier 2 SSD的規(guī)格是每天1次完整寫(xiě)入(1 DWPD);

3.在服務(wù)期內(nèi)，沒(méi)有驅(qū)動(dòng)器的年平均寫(xiě)入量超過(guò)1 DWPD。

從某些方面來(lái)說(shuō)，企業(yè)級(jí)存儲(chǔ)系統(tǒng)的供應(yīng)商為了搶占市場(chǎng)，從2014年底至今，開(kāi)展了一輪又一輪的“降價(jià)”活動(dòng)，通過(guò)其自身與NAND Flash供應(yīng)商巨大的議價(jià)能力、新技術(shù)的快速采用以及軟件管理控制能力，提供了比NAND Flash價(jià)格下降幅度更大的降價(jià)空間。換句話說(shuō)，2016年下半年的NAND Flash降幅，早就在2015年被企業(yè)級(jí)存儲(chǔ)系統(tǒng)供應(yīng)商們提前釋放了。