數(shù)據(jù)中心存儲必備三大件是什么?
信息技術(shù)不斷進(jìn)步,全球數(shù)據(jù)量逐年遞增。據(jù)IDC公布的調(diào)查數(shù)據(jù)顯示,未來全球數(shù)據(jù)將維持50%左右的增長率,到2020年,全球數(shù)據(jù)總量將達(dá)到44ZB(十萬億億字節(jié)),中國將達(dá)到8.6ZB,占全球的21%。在數(shù)據(jù)量快速增長的背景下,容易生出一個疑問:這么多的數(shù)據(jù),究竟都被存放在何處?今天小編想跟大家分享一下存儲這一塊的變化。
過去的存儲三大件,我歸納一下是三個東西。首先是購買一個SAN存儲做數(shù)據(jù)庫等業(yè)務(wù);文件存儲和共享一般會選擇NAS;備份和歸檔一般會選擇帶庫。現(xiàn)在很多傳統(tǒng)的數(shù)據(jù)中心,基本還是這個存儲三大件。
那么現(xiàn)代數(shù)據(jù)中心存儲三大件是什么呢?我們先回過頭來看一下企業(yè)CIO面臨的挑戰(zhàn)是什么,接下來再來看存儲三大件。
首先,Gartner指出,現(xiàn)在是雙活I(lǐng)T的時代,“模式一”強(qiáng)調(diào)傳統(tǒng)應(yīng)用穩(wěn)定、可靠,“模式二”強(qiáng)調(diào)快速、敏捷。我們知道一個世界冠軍既是百米冠軍,又是馬拉松冠軍,現(xiàn)在好像還沒有,一個產(chǎn)品同時滿足這兩種場景也是很難的。
IDC提到了我們現(xiàn)在說的第三平臺?,F(xiàn)在都是在從第二平臺像第三平臺轉(zhuǎn)型,EMC創(chuàng)造了一個概念——2.5平臺,這是一個轉(zhuǎn)型平臺。第二平臺相當(dāng)于Gartner說的模式一,第三平臺對應(yīng)的是模式二。目前,很多企業(yè)的投資都集中在第三平臺上,而第二平臺基本處于萎縮狀態(tài),但是依舊占了很大的比例。而存儲在數(shù)據(jù)中心里面也比較重要,新的數(shù)字化轉(zhuǎn)型要求IT務(wù)部門要去思考一些新的需求。所以說,我認(rèn)為數(shù)據(jù)中心三大件是服務(wù)器、網(wǎng)絡(luò)、存儲,而存儲應(yīng)該是最重的。為什么?存儲在整個數(shù)據(jù)中心里的投資也許不是***的,但是它確實(shí)最“重”的,因?yàn)橛脖P很沉。當(dāng)企業(yè)數(shù)據(jù)量不是太大的時候,你也許沒有什么感覺。但是以后物聯(lián)網(wǎng)的發(fā)展會越來越快,數(shù)據(jù)量也會膨脹的越來越快。據(jù)分析師預(yù)測,每年數(shù)據(jù)會翻一倍。此時你會發(fā)現(xiàn),更換存儲解決方案或存儲廠商非常困難。因?yàn)樵跀?shù)據(jù)遷移時,保證業(yè)務(wù)不中斷非常難。
第三平臺
下面我們來看一下存儲技術(shù)發(fā)展到了何種程度。IDC表示,企業(yè)存儲技術(shù)正在面臨閃存、軟件定義、融合、云計算四大變革。如果我們還繼續(xù)沿用過去的SAN、NAS、磁帶庫三大件,就不太符合現(xiàn)在的發(fā)展趨勢了。再看Gartner的存儲的成熟度曲線,我們看一下存儲三大件和這里面的哪些技術(shù)有關(guān)系。首先,變革性的技術(shù)有三個,正好符合三大件。***個是固態(tài)陣列,被認(rèn)為是***變革的技術(shù)。第二個是數(shù)據(jù)重刪,他只是一項技術(shù),被運(yùn)用在不同的產(chǎn)品中。第三個是軟件定義存儲,先來看一個曲線圖,在這個Gartner的曲線圖當(dāng)中,相比2015年有個很大的變化,它把軟件定義分為兩塊。一個是管理系統(tǒng)軟件定義,主要解決運(yùn)維管理的問題,并不能真正解決“存”的問題。第二個是Infrastructure SDS,就是我常說的Server SAN,真正解決了“存”的問題。
第三個是什么呢?我們先繼續(xù)看這張曲線圖,每年的變化都會不同。2015年,這張上有個FCOE,今年消失了,那么就有兩種可能性,出局或者技術(shù)成熟,他就是前者。
2016年存儲技術(shù)成熟度曲線
剛才提到了全閃存,其實(shí)全閃存的發(fā)展比我們想象的要快很多。2016年9月的美國的閃存峰會,各個廠商都發(fā)布了全新的是硬盤。東芝要發(fā)布100TB的硬盤,其寫壽命為一個顆??梢员粚?次,因此我判斷這個硬盤會很便宜。其量產(chǎn)后,裸容量也許比硬盤每GB的成本還要低,可被用于歸檔和備份等。
現(xiàn)在我們可以看到閃存的拐點(diǎn)比想象的要快。原來全閃存陣列只能用在一些性能的場景,如虛擬機(jī)、VDI、數(shù)據(jù)庫?,F(xiàn)在全閃存的已經(jīng)應(yīng)用到一些通用場景,而且價格很低。備份歸檔,磁帶庫也許以后都不需要了。很多分析師都認(rèn)為,2020年以后所有的生產(chǎn)數(shù)據(jù)都會放在閃存上。只有到了歸檔和備份階段,才會放到其他介質(zhì)上。
下面我們看一下Server SAN的發(fā)展。紅色的部分是傳統(tǒng)存儲,趨勢也在收窄。Server SAN也分兩個方向。一個是企業(yè)用的,另外一個是互聯(lián)網(wǎng)用的。互聯(lián)網(wǎng)廠商很少購買存儲,他們基本都在使用Server SAN?,F(xiàn)在在企業(yè)里面還比較少,但是未來會是一個方向,因?yàn)樗且粋€變革的技術(shù)。
Server SAN是2014年年初提出的一個概念,它集合了閃存、軟件、超大規(guī)模的優(yōu)點(diǎn),它代表了一個比較好的方向。很多時候我們認(rèn)為使用Server SAN會很便宜,但實(shí)際應(yīng)用中發(fā)現(xiàn)并不是這樣。但是它的彈性非常好,擴(kuò)容非常簡單,響應(yīng)時間快。比如業(yè)務(wù)部門對IT部門的要求是有很高的響應(yīng)速度,你就需要考慮一個Server SAN的架構(gòu)來滿足他們的要求。
接下來我們要想想數(shù)字化轉(zhuǎn)型的問題,數(shù)字化轉(zhuǎn)型其實(shí)很重要,當(dāng)你把企業(yè)的全部業(yè)務(wù)數(shù)字化以后,那么你對可靠性的要求就高了。EMC全球數(shù)據(jù)索引顯示,11%的用戶將雙活用作數(shù)據(jù)的可用性手段。比如原來做一個備份就可以了,然而這種要求已經(jīng)不能滿足目前的需求了?,F(xiàn)在很多企業(yè)都是互聯(lián)網(wǎng)企業(yè),要求業(yè)務(wù)24小時不能中斷。我個人比較推崇還是陣列的雙核?,F(xiàn)在很多雙活是由網(wǎng)關(guān)來做,然而網(wǎng)關(guān)都比較復(fù)雜,比如用EMC的雙活,下面的高端存儲使用華為SmatriX,上面用Vplex。從管理的角度來看比較復(fù)雜,因?yàn)樗菍儆趦商讝|西。如果是陣列雙活的話,硬件和軟件的維護(hù)都是一套東西,管理起來比較方便。目前日立率先做了雙活,華為、EMC也做了雙核,EMC還做了網(wǎng)關(guān)雙活和陣列雙活兩種模式。所以從高端存儲方面來看,雙活這部分我認(rèn)為做得比較完善一些。
分析了這么多確實(shí),我的觀點(diǎn)其實(shí)已經(jīng)很清楚了,我總結(jié)的現(xiàn)代數(shù)據(jù)中心存儲必備的三大件是高端存儲、全閃存陣列、全融合SDS。他們幾乎完成了99%的需求。下面我為大家解釋一下為什么必須是三大件。
高端存儲到現(xiàn)在已經(jīng)有25年歷史,從1990年EMC的SmatriX推出來到現(xiàn)在歷史超過25年。從Gartner報告看,高端存儲8項能力的得分,華為比較晚做高端存儲,評分也比較高。我們看到這個表里面,每個特性標(biāo)桿基本上都超過4分,很少有3分,八大功能里面做得***基本都超過4分,基本是成熟的產(chǎn)品。
閃存陣列只有五年歷史,剛開始是2010年***代廠商,F(xiàn)usion-io、tms、Violin MEMORY在做閃存陣列,但是沒有重刪和壓縮的功能。2012年,第二代全閃存陣列推出,增加了重刪和壓縮的功能,因此成本也降下來了。2014年,主流廠商紛紛推出全閃存陣列,可靠性方面也增強(qiáng)了,以及一些企業(yè)特性如加密、復(fù)制等功能。所以說我們看到看到Gartner對固態(tài)存儲的這個評價,相對高端存儲會有一些差距。***分只有3.9分,給了SolidFire。
所以說,對于我個人對于全閃存陣列的意見是,全閃存陣列很好,但是如果你的業(yè)務(wù)很關(guān)鍵,但是在搭建時還是使用高端存儲比較好。如果你6個9的存儲需求,建議你使用高端存儲。如果是5個9的需求,可以考慮使用全閃存陣列。當(dāng)然高端存儲也可以考慮使用全閃存,其響應(yīng)時間基本在1毫秒。如果采用全閃存,在重刪和壓縮全部打開的情況下,響應(yīng)時間一般低于0.5毫秒。所以說時延還是不一樣的。
我們看一下一般關(guān)鍵場景(OLTP場景),我們把高端存儲和全閃存OLTP場景各個廠商的分?jǐn)?shù)拿出來對比一下。高端存儲的***分是4.16分,全閃存是3.73分。也就是說在關(guān)鍵應(yīng)用的場景下,閃存還是有一些差距的。
接下來我說一下軟件定義存儲,現(xiàn)在很多廠商都選擇開源廠商ceph,它的特點(diǎn)就是塊、文件、對象基本都可以支持。企業(yè)中這三個需求都會有,如果是三套管理相對比較復(fù)雜。
下面我總結(jié)一下我的觀點(diǎn):
如果現(xiàn)代數(shù)據(jù)中心存儲只讓你選擇三大件。我認(rèn)為要把關(guān)鍵的應(yīng)用篩選出來,第二平臺的應(yīng)用,如計費(fèi)ERP還是要放到高端存儲上,可以搭配全閃存和雙活的安全應(yīng)用。以及第三中心,保證它的可靠性,因?yàn)樗谐墒鞌?shù)據(jù)服務(wù),25年的歷史,支持傳統(tǒng)業(yè)務(wù)的穩(wěn)定運(yùn)行。但是,它的時延一般只能在1毫秒以下,而且一般不支持重刪、壓縮。所以針對第三平臺應(yīng)用,使用全閃存陣列就可以滿足敏捷快速的要求。第三大件,就是統(tǒng)一資源池,采用SDS全融合云存儲。便于管理,支持塊、文件和對象接口,ZB級別規(guī)模,支持重刪壓縮,跨地域保護(hù)。
因此,我認(rèn)為如果要建數(shù)據(jù)中心,我就會選擇這三大件,90%的以上需求都會滿足。當(dāng)然如果希望做得更好,還可以選擇管理性的SDS,實(shí)現(xiàn)自動化的運(yùn)維。