存儲分層金字塔是啥玩意兒?
這年頭IT市場充斥著各種忽悠詞匯,我舉個例子,當客戶或是終端使用者問到SSD(固態(tài)硬盤)以及HDD(機械硬盤)彼此之間該怎么最有效的使用時,大部分的原廠銷售代表就拿出個下像面的圖并用幾句話帶過,不外乎就是SSD會被放在比較上層處理小IO的應(yīng)用,大塊數(shù)據(jù)就是扔到HDD上,結(jié)束。說實在的,連我自己搞技術(shù)營銷的都說服不了自己,我還不敢給客戶這樣說呢……
圖1: 存儲分層金字塔
在一個加班準備吃夜宵的餐館中,遇到了幾位大嬸阿姨,一直稱贊咱們東芝做的冰箱很耐用,問我做什么的,于是想了個法子來解釋給他們聽聽我平常在銷售的是什么。
圖2: 像廚房一般的存儲分層
如果平時存放的資料就像是食物的話,那保存食物的地方不外乎就是幾個,廚房里的冰箱、冷凍庫、微波爐、烤箱甚至咖啡機。平時煮菜或是備料時,也都會考量到何時要用到食材而分門別類的放置:又或是根據(jù)急迫性來分類,例如濃縮咖啡機的快速沖泡、加班的人們速速微波便當準備敢下個會議等等。
具體來說,數(shù)據(jù)中心的存儲設(shè)備就有如這個all in one廚房設(shè)備一樣,保存者食物也時不時地江餐點端上桌。大致來講,從三個面向來探討。
一、比例原則
也不是所有的資料都是硬梆梆的只放在HDD或是SSD這兩種二分法而已,而是都會放或是都會待過。而由于應(yīng)用軟件所側(cè)重的性質(zhì)不同,其資料放置在SSD或HDD的比例有所區(qū)隔而已。舉個例子,近期在我是歌手很火紅的視頻-蕭敬騰所翻唱的以后別做朋友,由于太火了,大部分個省份的人都會想要即時點播來看,這時候可能像騰訊視頻、Bilibili等軟件就會把這段視頻先緩存起來,放置在各區(qū)域的CDN服務(wù)器當中,以利各家視頻軟件達到所謂“秒級點播“的服務(wù)。等過一陣子空間得重新配置或有更火的視頻出來之后,蕭敬騰這段視頻就會慢慢由上往下移到HDD中存放,讓各位粉絲們回溯尋找。
二、應(yīng)用導向
從圖2我們看到,在線交易(OLTP)、推薦系統(tǒng)或金融支付這幾類講求實時性以及低延遲的應(yīng)用,就會要求較多的數(shù)據(jù)緩存在PCIe SSD類別類,因為其軟件性質(zhì)要求的速度和延遲下,必須得用這個級別的SSD才能達到,所以有一部分的企業(yè)級應(yīng)用標榜著QoS協(xié)議,也是跟其后臺租用這類服務(wù)器有關(guān)。在舉個例子,很多國內(nèi)BAT數(shù)據(jù)中心都會使用分布式運算,Hadoop可能是目前***宗的,其在資料分開運算的過程中,會產(chǎn)生大量的臨時性文件( temporary data ),需要超越2.5″ SAS HDD能耐的東西但又不需要太高端的速度,因此有幾家則是使用SATA SSD作為這個媒介,大量又快速的存儲下去之后又馬上洗掉,就好像西餐廳里的牛排一樣,用完餐之后洗乾凈在服務(wù)下一位客戶。
三、熱度頻率
前面也稍微提過,應(yīng)用軟件的性質(zhì)會決定了大部分的資料在什么層級的存儲進行。試者想想當我們要看在5年前微信朋友圈中發(fā)生了什么事,那個往上滑而不斷讀取的圓圈進度條一直在轉(zhuǎn),就是在朝騰訊放冷存儲的HDD集群們撈你的資料,畢竟在現(xiàn)今互連網(wǎng)的風潮之下,大家都不記得(或是不在乎)前幾天中餐吃了哪家餐館的時候,很少有人沒事一直看自己還是18歲時候的照片,跟使用的熱度或是一般會訪問的頻率有關(guān)。另外,政府機構(gòu)其實很要求這些互連網(wǎng)巨頭、電信運營商將資料都保存十年以上,可能是讓一切都有憑有據(jù)的準備也有可能是秋后要大算帳……。但就是跟使用行為、訪問頻率、群體熱度有關(guān)連。
結(jié)語:從粗放農(nóng)業(yè)過渡到精致農(nóng)業(yè)
各家數(shù)據(jù)中心目前算盤打的愈來愈精了,從冷卻、用電、通風、人員管理、資安以及硬件資源的配用,都已經(jīng)快到出神入化的程度(甚至是自己做SSD了)。也連帶的讓數(shù)據(jù)中心在系統(tǒng)設(shè)計的架構(gòu)上、采購行為和配置考量點都與傳統(tǒng)IT完全不同。企業(yè)內(nèi)部的私有云架構(gòu)可能還像是粗放農(nóng)業(yè)一般,有些許的資源閑置在那邊或是大材小用,然侯數(shù)據(jù)中心就是運算、網(wǎng)路、存儲都切的很開并且分配的很細致,盡量不要有一絲的浪費!
對了,大嬸們聽的如吃如醉,略微張開的嘴巴與越過眼鏡上緣看著我的神情讓我愈說愈自得其樂,而***也得到阿姨們的贊賞:東芝的冰箱真的好用又不會壞啦!