存儲(chǔ)極客 | 普及閃存知識(shí):搞懂那些晦澀難懂的名詞
“存儲(chǔ)極客”欄目再次與大家見(jiàn)面啦!在這里,只有一位大咖名叫“存儲(chǔ)”,它的粉絲我們稱為“存儲(chǔ)極客”!
存儲(chǔ)極客
這是一群存儲(chǔ)偏執(zhí)狂
為存儲(chǔ)而生,跟存儲(chǔ)死磕
各具獨(dú)家秘笈
有觀點(diǎn),有碰撞,有干貨
從8月18起
做客存儲(chǔ)極客欄目
與你分享存儲(chǔ)里的那點(diǎn)事兒
前不久,全球閃存峰會(huì)(Flash Memory Summit,以下簡(jiǎn)稱FMS)的技術(shù)委員會(huì)主席Brian Berg在北京演講時(shí)表示,“摩爾定律是一個(gè)非常偉大的定律,但是在閃存市場(chǎng),現(xiàn)在看來(lái)閃存技術(shù)的發(fā)展是可以超過(guò)摩爾定律的。”
什么?沒(méi)聽(tīng)錯(cuò)吧?戈登·摩爾那個(gè)偉大的摩爾定律,那個(gè)縱貫微處理器乃至整個(gè)半導(dǎo)體行業(yè)技術(shù)發(fā)展的摩爾定律,會(huì)在閃存技術(shù)的發(fā)展中,失效?但是顯然,當(dāng)著會(huì)議現(xiàn)場(chǎng)1000多位聽(tīng)眾,Brian Berg身為全球***閃存、內(nèi)存方面會(huì)議的技術(shù)主席,不會(huì)是信口開(kāi)河,那么,問(wèn)題顯然就轉(zhuǎn)變?yōu)榱耍?ldquo;為什么閃存技術(shù)的發(fā)展會(huì)超過(guò)摩爾定律?”
首先,讓我們先回顧一下摩爾定律:在價(jià)格不變的前提下,集成電路芯片上所集成的電路的數(shù)目,每隔18個(gè)月就翻一番。在過(guò)去的五十年(摩爾定律是1965年提出的),摩爾定律一直發(fā)揮著效用,但是在最近幾年,隨著制程工藝的進(jìn)步變得越來(lái)越難,認(rèn)為英特爾等處理器供應(yīng)商無(wú)法繼續(xù)延續(xù)摩爾定律發(fā)展的觀點(diǎn)甚囂塵上。但在閃存技術(shù)上,卻截然相反,持Brian Berg同樣觀點(diǎn)的人認(rèn)為:“閃存技術(shù)的發(fā)展正在打破摩爾定律,這種打破,是超越而不是無(wú)法遵從。”
但為什么閃存技術(shù)會(huì)出現(xiàn)超越摩爾定律的情況呢?眾所周知,閃存同樣是一種半導(dǎo)體技術(shù),其整體容量和性能發(fā)展,應(yīng)當(dāng)充分遵從摩爾定律,特別是閃存技術(shù)(比如NAND Flash)的制程工藝步進(jìn)與處理器是類似的:
NAND閃存制程
還不是很突出
2014年市場(chǎng)上的主流制程技術(shù)是三星和東芝的19nm以及SK海力士和英特爾/美光的20nm;2015年,市場(chǎng)正逐步過(guò)渡到15nm和16nm技術(shù);到2016年第四季度,除東芝將提供13nm左右的制程工藝之外,三星、SK海力士、英特爾/美光將會(huì)把支撐維持在14nm制程級(jí)別——事實(shí)上,英特爾的14nm制程處理器上市已經(jīng)有很長(zhǎng)一段時(shí)間了,閃存技術(shù)到2016年如果采用14nm制程的話,要比英特爾的微處理器晚了接近3年的時(shí)間。

但事實(shí)卻是,閃存技術(shù)的發(fā)展,特別是企業(yè)級(jí)產(chǎn)品的普及速度確實(shí)超乎想象的快:如今在不考慮壓縮或重復(fù)數(shù)據(jù)刪除技術(shù)的前提下,以戴爾為例,其全閃存陣列的每GB裸容量已經(jīng)能夠降低到1.5-1.6美元這個(gè)區(qū)間,也就是說(shuō),大約一年的時(shí)間,企業(yè)級(jí)全閃存陣列的價(jià)格最多降低了60-70%。
另一方面,我們來(lái)看企業(yè)級(jí)SSD,同樣是一年前,業(yè)界主流產(chǎn)品的***容量是3.84TB,現(xiàn)在這一數(shù)字是6.4TB,也就是大約提高了一倍,而單盤(pán)價(jià)格實(shí)際上還略微下降;而據(jù)三星在今年8月份在FMS上展示的路線圖顯示,最早今年年底,最遲明年上半年,三星將可以在2.5英寸封裝中提供約16TB的容量(15.36TB)。
閃存容量的提高顯然是和NAND Flash的單位容量及密度有關(guān)的,單顆NAND Flash芯片的容量越高,或者說(shuō)單位面積上的NAND Flash的容量密度越高,SSD的容量(以2.5英寸封裝的SAS、SATA或SFF-8639盤(pán)為標(biāo)準(zhǔn))也就越高。
3D TLC NAND Flash:
這么多前綴,怎么解釋?
在閃存技術(shù)最開(kāi)始興起的那幾年,我們最常見(jiàn)到的閃存是SLC和MLC,前者即Single-Level Cell,每NAND Flash Cell上都存儲(chǔ)1bit的數(shù)據(jù),壽命、性能***,但也更貴,后者即Multi-Level Cell,即2bit/cell,壽命和性能相比SLC有所下降,但成本大約只是SLC的30%左右。
所謂3D TLC NAND Flash中的TLC,與SLC、MLC所描述的對(duì)象是相同的,即Trinary-Level Cell,即3bit/cell,在一個(gè)Cell上做到存儲(chǔ)3bit的數(shù)據(jù)是一件相對(duì)比較難的事情,成本只是每單元2bit的MLC閃存的約三分之二,速度和壽命表現(xiàn)雖然相比MLC有所下降,但相對(duì)傳統(tǒng)HDD而言,仍然是天壤之別。
但為什么TLC要比MLC更難實(shí)現(xiàn)呢?這就要說(shuō)下NAND Flash的“存儲(chǔ)機(jī)制”,或者說(shuō)是“如何存儲(chǔ)數(shù)據(jù)”:眾所周知,計(jì)算機(jī)存儲(chǔ)的數(shù)據(jù)是二進(jìn)制,也就是1和0,在半導(dǎo)體上,這實(shí)際上可以簡(jiǎn)單地理解為“有電”“沒(méi)電”或是“電壓高”“電壓低”,也就是只要有可以通過(guò)電位表達(dá)“非黑即白”就可以了。
所以,對(duì)NAND Flash寫(xiě)入1,就是控制Control Gate去充電,使得存儲(chǔ)的電荷夠多,超過(guò)閾值Vth,就表示1了,而對(duì)于寫(xiě)入0,就是將其放電,電荷減少到小于Vth,就表示0了——在MLC中,其實(shí)現(xiàn)機(jī)制就是,通過(guò)控制內(nèi)部電荷 的多少,分成多個(gè)閾值,從而儲(chǔ)存為不同的數(shù)據(jù)。
試想,在2bit/Cell的MLC中要分為幾個(gè)閾值?要是3bit/Cell呢?事實(shí)上,理論上簡(jiǎn)單的事情,在實(shí)際中就顯得比較麻煩了:相比SLC來(lái)說(shuō),MLC已經(jīng)需要控制4個(gè)狀態(tài),即00、01、10、11,TLC就需要控制多達(dá)8個(gè)狀態(tài),顯然這是一個(gè)非常困難的事情,每Cell的bit數(shù)量越多,閾值越多、狀態(tài)越多,更為重要的是,閾值之間的電壓差也就越小(總不能內(nèi)部搞個(gè)幾萬(wàn)伏高壓吧……),出錯(cuò)的概率自然也就越高。
需要補(bǔ)充的是,業(yè)界還是有一些“瘋子”是不相信自己做不到任何事情的,某些供應(yīng)商正在考慮4bit的NAND Flash,從來(lái)自NAND Flash生產(chǎn)設(shè)備供應(yīng)商的消息顯示,東芝很可能是4bit技術(shù)的主要推動(dòng)者,但就東芝方面的消息表示,“這個(gè)東西基本上做出來(lái),很難。”
接下來(lái)就要說(shuō)到3D TLC NAND Flash中的3D,這就涉及到NAND Flash的Die的設(shè)計(jì),而在此之前,我們要對(duì)NAND Flash的幾個(gè)主要名詞做個(gè)解釋。
在NAND Flash中,每一個(gè)“芯片”分為Die、Plane、Block和Page,這里所說(shuō)的芯片,即每一個(gè)封裝好的Chip,Die則是晶圓上的小方塊,在一個(gè)NAND Flash芯片中,可以封裝多個(gè)Die,無(wú)論工藝、技術(shù)有如何不同,Die的概念都是基本相同的。
Plane則是NAND Flash能夠根據(jù)讀、寫(xiě)、擦除等命令進(jìn)行操作的最小單位,一個(gè)Plane里面以矩陣的形式包含了若干個(gè)Block,這是NAND Flash的最小擦除單位,其中包含了若干個(gè)Page,這是NAND Flash的最小讀寫(xiě)單位(其中包含若干個(gè)Byte)。

說(shuō)回到“3D”,為什么叫3D呢?這是因?yàn)檫^(guò)去NAND Flash主要是以2D的形式,也就是在平面上排列NAND Flash Cell(存儲(chǔ)單元),但三星、東芝等公司后來(lái)發(fā)現(xiàn),完全可以采用多層堆疊的方式,于是也就出現(xiàn)了32層乃至48層堆疊的NAND Flash。以三星采用的3D Charge Trap Flash(簡(jiǎn)稱CTF)結(jié)構(gòu)設(shè)計(jì)的3D TLC V-NAND Flash為例,其精密程度已經(jīng)邁入到每顆芯片包含853億個(gè)Cell,以3bit/Cell來(lái)計(jì)算,一共能存儲(chǔ)約2560億bit數(shù)據(jù)。也就是說(shuō),在一個(gè)指尖大小的NAND Flash芯片上,可以存儲(chǔ)256Gb的數(shù)據(jù),而晶圓密度是上一代產(chǎn)品的1.4倍。
東芝NAND Flash業(yè)務(wù)高層Shigeo Ohshima曾透露,NAND Flash的容量會(huì)有“持續(xù)的、爆發(fā)式的、翻倍的增長(zhǎng)”,他認(rèn)為,2016年,體積不變的情況下(2.5英寸封裝)容量可以達(dá)到32TB,2017年是64TB,2018年是128TB(歷史同期來(lái)看,傳統(tǒng)HDD的容量增長(zhǎng)預(yù)測(cè)是到2020年20-40TB)。
相比東芝計(jì)劃開(kāi)戰(zhàn)4bit/Cell的NAND Flash,三星則熱衷于“堆積木”,這家公司對(duì)當(dāng)前的32層、48層NAND Flash都不太滿意,放言“2、3年內(nèi)會(huì)出現(xiàn)100層以上堆疊的NAND Flash”,不知道到時(shí)候東芝心情如何?
說(shuō)了這么多美麗的遠(yuǎn)景,看起來(lái)NAND Flash市場(chǎng)是光明一片,至少對(duì)三星、美光、SK海力士、東芝等供應(yīng)商來(lái)說(shuō),摩爾定律基本上不夠這些公司通過(guò)3bit、4bit、32層、48層等技術(shù)來(lái)進(jìn)行追趕的了,但摩爾定律的關(guān)鍵在于:既然是“在價(jià)格不變的前提下”。那么技術(shù)先進(jìn)了這么多,密度提高了這么多,成本也自然會(huì)下降這么多,那什么時(shí)候NAND Flash會(huì)出現(xiàn)大規(guī)模的降價(jià)呢?
熬著不降價(jià)?
等到2016年再看!
3、4年前,市場(chǎng)上對(duì)NAND Flash的降價(jià)可謂是“一往情深”,NAND Flash供應(yīng)商也好,企業(yè)級(jí)存儲(chǔ)系統(tǒng)的供應(yīng)商也罷,媒體、分析機(jī)構(gòu)、渠道,都認(rèn)為“NAND Flash會(huì)馬上進(jìn)入快速價(jià)格下降通道”,從而快速的取代傳統(tǒng)HDD在高端、高性能存儲(chǔ)介質(zhì)層的位置。
換句話說(shuō),市場(chǎng)非常相信摩爾定律的“魔力”在NAND Flash市場(chǎng)上也能夠發(fā)揮如同處理器一樣的功效,快速取代過(guò)去近三十年發(fā)展速度遠(yuǎn)遠(yuǎn)追趕不上處理器、內(nèi)存的傳統(tǒng)HDD存儲(chǔ)介質(zhì),可惜,市場(chǎng)告訴我們:真相永遠(yuǎn)只有一個(gè),并且這一個(gè)永遠(yuǎn)都是最殘酷的那個(gè)。
根據(jù)市場(chǎng)調(diào)查機(jī)構(gòu)的數(shù)據(jù),2009年至2014年,NAND Flash市場(chǎng)的每GB價(jià)格年均跌幅,只有2009年、2011年和2012年超過(guò)了30%,在2010年、2013年和2014年,每GB成本下降都只有15%、18%和27%;在2015年至2016年,這一數(shù)字實(shí)際上預(yù)期也只是維持在25%-30%的水平上,這一降幅,離摩爾定律所說(shuō)的“每18個(gè)月翻(降)一番”,可是遠(yuǎn)得很!
事實(shí)上,這也就是為什么過(guò)去3-4年,NAND Flash的出貨量一直維持在年均增長(zhǎng)40-50%這樣一個(gè)水平線上的主要原因,那么,為什么價(jià)格一直遲遲不能真的遵守摩爾定律呢?
這里面的原因非常多也非常復(fù)雜,但總的來(lái)說(shuō),核心原因有兩個(gè):第一,在東芝、三星、SK海力士之間的競(jìng)爭(zhēng)中,幾乎所有的NAND Flash供應(yīng)商都被卷在了這個(gè)漩渦中,制程工藝從20nm、16nm到14nm快速推進(jìn),1bit、2bit、3bit的介質(zhì)不斷更新,32層、48層的堆疊快速成型,這些技術(shù)上的進(jìn)步都影響著這些NAND Flash供應(yīng)商的生產(chǎn)線升級(jí)、產(chǎn)品設(shè)計(jì)生產(chǎn)、供貨產(chǎn)業(yè)鏈以及市場(chǎng)推廣和渠道費(fèi)用,有一位三星的內(nèi)部人士曾經(jīng)這樣認(rèn)為:“原本3年內(nèi)要拿出來(lái)的產(chǎn)品,被壓縮到2年,再壓縮到18個(gè)月,相當(dāng)于用兩代產(chǎn)品的成本去獲取1代產(chǎn)品的收入”,所以在如此巨大的成本壓力之下,NAND Flash供應(yīng)商要承受的壓力可想而知。
第二個(gè)原因和前一個(gè)息息相關(guān),那就是NAND Flash供應(yīng)商希望能夠在閃存市場(chǎng)上持續(xù)獲得“與性能提升成正比的利潤(rùn)率提升”,就像三星將傳統(tǒng)HDD業(yè)務(wù)出售之后,他們不僅希望高利潤(rùn)能夠緩解產(chǎn)品迭代所造成的成本壓力,更希望能夠從NAND Flash和傳統(tǒng)HDD之間巨大的性能差距上獲得高額利潤(rùn),這也是NAND Flash供應(yīng)商遲遲不愿意降價(jià)的主要原因。
從上述的原因說(shuō)明來(lái)看,阻礙NAND Flash價(jià)格下降的原因,主要是出在NAND Flash供應(yīng)商本身,這意味著降價(jià)空間實(shí)際上是比較大的,根據(jù)市場(chǎng)分析機(jī)構(gòu)的預(yù)計(jì),各大NAND Flash供應(yīng)商的成本承受能力,大約在2016年上半年會(huì)基本上被充分釋放,也就是說(shuō),2016年下半年,NAND Flash會(huì)迎來(lái)一波比較大的價(jià)格下降,預(yù)計(jì)2016年全年的NAND Flash價(jià)格下滑能夠超過(guò)40%,逼近50%。
提前釋放降價(jià)空間,
須保證性能和可靠性

通過(guò)率先引入企業(yè)級(jí)TLC 3D NAND SSD,戴爾能夠提供更具價(jià)格競(jìng)爭(zhēng)力的全閃存陣列,并在維護(hù)期內(nèi)無(wú)條件更換故障SSD(不計(jì)數(shù)據(jù)寫(xiě)入量/磨損程度)。這種承諾在顯示出技術(shù)信心的同時(shí),也讓用戶更加放心。
不過(guò),對(duì)企業(yè)級(jí)存儲(chǔ)系統(tǒng)的用戶來(lái)說(shuō),大可不必等到2016年,前面我們說(shuō)過(guò),戴爾已經(jīng)將全閃存陣列的價(jià)格推進(jìn)到每GB物理容量1.66美元(僅供參考,與具體配置有關(guān))。需要指出的一點(diǎn)是,某些存儲(chǔ)系統(tǒng)供應(yīng)商雖然也通過(guò)數(shù)據(jù)縮減技術(shù)給出了更好看的數(shù)字,但其中一些會(huì)影響到性能。而戴爾SC陣列還支持增強(qiáng)型壓縮,其***特點(diǎn)是通過(guò)與備受好評(píng)的自動(dòng)分層存儲(chǔ)巧妙結(jié)合,其壓縮動(dòng)作成為定期執(zhí)行的后臺(tái)任務(wù),從而有效避免了對(duì)寫(xiě)入性能的影響。同時(shí),在不額外添加專用硬件的情況下,高效壓縮算法保證了讀性能不下降。
3D NAND在一定程度上改善了TLC的寫(xiě)入壽命,而戴爾SC還能通過(guò)獨(dú)特的自動(dòng)分層存儲(chǔ)技術(shù),在讀密集型閃存和寫(xiě)密集型閃存之間做讀/寫(xiě)分離,進(jìn)一步保障經(jīng)濟(jì)型企業(yè)級(jí)閃存的可靠性。只需要加入一個(gè)高寫(xiě)入耐久度的SLC/eMLC SSD分層承擔(dān)所有寫(xiě)入負(fù)載,既保障了性能,又使隨機(jī)/重復(fù)的數(shù)據(jù)IO能夠合并優(yōu)化地導(dǎo)入至TLC SSD,達(dá)到了“少花錢(qián),多辦事”的目的。

上圖來(lái)自本月在美國(guó)舉行的閃存峰會(huì)上一場(chǎng)戴爾的演講《Redefining the Economics of Enterprise Storage》。根據(jù)其中的統(tǒng)計(jì)數(shù)據(jù),在20多個(gè)月的服務(wù)監(jiān)測(cè)周期內(nèi),Tier 2分層中66%的SSD驅(qū)動(dòng)器只有不到0.1 DWPD的寫(xiě)入壓力。進(jìn)一步的說(shuō)明包括:
1.所有進(jìn)來(lái)的寫(xiě)入被引導(dǎo)至Tier 1,數(shù)據(jù)只是按需移動(dòng);(注:取決于用戶實(shí)際寫(xiě)入量和Replay快照設(shè)置的周期)
2.Tier 2 SSD的規(guī)格是每天1次完整寫(xiě)入(1 DWPD);
3.在服務(wù)期內(nèi),沒(méi)有驅(qū)動(dòng)器的年平均寫(xiě)入量超過(guò)1 DWPD。
從某些方面來(lái)說(shuō),企業(yè)級(jí)存儲(chǔ)系統(tǒng)的供應(yīng)商為了搶占市場(chǎng),從2014年底至今,開(kāi)展了一輪又一輪的“降價(jià)”活動(dòng),通過(guò)其自身與NAND Flash供應(yīng)商巨大的議價(jià)能力、新技術(shù)的快速采用以及軟件管理控制能力,提供了比NAND Flash價(jià)格下降幅度更大的降價(jià)空間。換句話說(shuō),2016年下半年的NAND Flash降幅,早就在2015年被企業(yè)級(jí)存儲(chǔ)系統(tǒng)供應(yīng)商們提前釋放了。