15萬買到64萬? 一臺全閃陣列的生意經(jīng)
作者:佚名
作為存儲管理員,以前只要守衛(wèi)技術(shù)象牙塔,真是怎么爽由自己!
偶爾被拉進(jìn)一個什么銷售動員大會,還可以教育臺下一眾“技術(shù)小白”,講一講我們存儲的技術(shù)原理、管理流程,讓他們明白,所謂的促銷戰(zhàn)役對于我們存儲來說,是極為不靠譜的!
可是現(xiàn)在,連平常甚少逛街的我都發(fā)現(xiàn)了,電商還真是“多快好省”?。〉f歸說,那些銷售部門分分鐘搞出來的造節(jié)、大促,對于IT部門仍然是“被戰(zhàn)役”!要上線新服務(wù),提供新的存儲卷,做數(shù)據(jù)分析,真真一個“燙手山芋”啊!
短暫的糾結(jié)過后,還得面對現(xiàn)實,畢竟“互聯(lián)網(wǎng)+”給各行各業(yè)帶來的沖擊是有目共睹的!作為企業(yè)的IT管理人員,豈能坐視不理?
該干的活兒還得咱自己想辦法!找個專業(yè)人士咨詢則個!
第一個想到的,便是去拜訪主張“加速促進(jìn)新解決方案落地”的企事錄團(tuán)隊,聯(lián)合創(chuàng)始人曾智強在企業(yè)級存儲領(lǐng)域有很多獨到見解,想必能給我一些中肯的建議!
果然,了解我的問題與困惑以后,曾智強迅速把解決方案鎖定為全閃存陣列,“你要的是性能,又不太重容量”,而且,“一臺配6個SSD的全閃才15萬起步,每IOPS才一塊錢!”
后來的溝通證實,這個建議背后源于企事錄團(tuán)隊剛剛做過的一輪全閃存陣列評測,針對目前企業(yè)存儲的挑戰(zhàn)與存儲管理員的困惑,猶如剝筍一般層層分解,最終得來“金句”。
一起來看專業(yè)評測如何剝筍吧,有圖有真相!
拓?fù)鋱D顯示,整個測試環(huán)境采用傳統(tǒng)的SAN架構(gòu),最上是戴爾PowerEdge R930四路服務(wù)器(72物理核心512GB內(nèi)存),安裝Oracle Linux 6.6和Oracle 12c,通過兩塊雙端口FC HBA與中間的Brocade 6505 16Gb/s FC交換機(jī)相連接,因為是測試環(huán)境,交換機(jī)只有一臺,并沒有冗余設(shè)置。
最下即全閃存陣列,來自戴爾的Storage SC4020,配備了20塊200GB容量的SSD,一塊為熱備盤,19塊盤以一種類似于RAID 10的方式冗余。
據(jù)說,戴爾官方售價15萬8千8百8十8的SC4020全閃配置的是6塊容量為480GB的SSD,可以根據(jù)用戶需求以“頗為驚喜的代價”升級為6塊容量為1.92TB的SSD,曾經(jīng)的“新貴”甩掉偶像包袱啦!
一個小插曲是,測試中前端Oracle數(shù)據(jù)庫服務(wù)器上插的兩塊FC HBA卡,卻只有3條FC通道,企事錄團(tuán)隊的解釋是一個光模塊出了點問題,實驗室里面也沒有適合的備件。
這個問題倒是很常見,光模塊跟HBA卡、FC交換機(jī)不是同一家廠商供貨,指不定就有鏈路不通,或者帶寬降低等兼容性問題。
看過價格和架構(gòu),重點來看數(shù)據(jù)庫性能,見下圖“8K數(shù)據(jù)塊的隨機(jī)讀性能”▼
測試8KB數(shù)據(jù)塊隨機(jī)讀取獲得的結(jié)果:最大IOPS接近29萬,平均響應(yīng)時間在1ms(毫秒)以內(nèi),突發(fā)響應(yīng)時間(最大延遲)在32ms左右,這樣看來,性能非常好。我現(xiàn)在使用的高端存儲,配了幾百塊盤,加上優(yōu)化以及緩存的作用,IOPS也不過才幾萬。
同一個測試中的另一組成績,8KB隨機(jī)讀的帶寬最高到2264MB/s,考慮到服務(wù)器只是用了3條8Gb/s FC通道,理論帶寬是2400 MB/s,已經(jīng)可以認(rèn)為是到達(dá)FC通道的極限了。
來自測試團(tuán)隊的另一組數(shù)據(jù)證實了我的想法,果然是服務(wù)器與FC交換機(jī)之間的帶寬瓶頸。
128KB數(shù)據(jù)順序讀測試結(jié)果,最大帶寬2268MB/s,與8KB隨機(jī)讀帶寬2264MB/s相差無幾,確認(rèn)帶寬是瓶頸
想必你也想知道“15萬8的全閃存極限性能在哪里”,企事錄團(tuán)隊的測試結(jié)果,如下面這張統(tǒng)計圖顯示▼
4KB數(shù)據(jù)塊隨機(jī)讀取測試結(jié)果,IOPS接近37萬,平均響應(yīng)時間在1ms以內(nèi),最大延遲也在32ms左右,變化不大。
3條8Gb/s FC達(dá)到37萬IOPS,但FC通道仍有成為瓶頸的可能。
而國外某權(quán)威機(jī)構(gòu)有用6塊SSD測試,IOPS超過10萬。通過我們的驗證,排除一塊熱備盤,國外機(jī)構(gòu)實際使用5塊SSD。企事錄測試團(tuán)隊實際使用了19塊SSD,接近4倍的盤數(shù)量獲得了接近4倍的性能。
這個基準(zhǔn)測試成績跟應(yīng)用性能的差距有多大?
我們調(diào)出Oracle性能測試成績來驗證一下▼
Oracle數(shù)據(jù)庫性能測試主要考慮三個指標(biāo),即TPM(Transactions Per Minute,每分鐘在線事務(wù)處理數(shù))、TPS(Transactions Per Second,每秒在線事務(wù)處理數(shù))和響應(yīng)時間(ms)。
從上圖可以看出:
峰值TPM最大為64.5萬,平均TPM約為61.5萬;
峰值TPS超過1.1萬,平均TPS在1萬以上;
性能較好,基本與前面基準(zhǔn)測試中的8K數(shù)據(jù)塊隨機(jī)讀取的性能相吻合。并且,其平均響應(yīng)時間為36ms,突發(fā)響應(yīng)時間為250ms,性能的穩(wěn)定性很好。
單看性能數(shù)字,也許對業(yè)務(wù)部門并不“帶感”,放在具體的業(yè)務(wù)情景來分析一下:
在今年雙十一開始的頭30分鐘,天貓每秒交易峰值17.5萬筆,相當(dāng)于17.5萬的峰值TPS;每秒支付峰值12萬筆則相當(dāng)于12萬峰值TPS。這兩者加起來差不多要接近30萬TPS性能!
簡單換算,不考慮其他因素影響,差不多30臺同等配置的SC4020全閃存陣列就能滿足天貓交易和支付的性能需求(登錄、瀏覽等操作不在此列)。
當(dāng)然,這個簡單換算只是為了有一個直觀印象,并不反映實際情況。畢竟“雙十一”是全球最大規(guī)模的“購物狂歡”,系統(tǒng)架構(gòu)將是其性能發(fā)揮的關(guān)鍵。絕大多數(shù)企業(yè)也不需要達(dá)到那么高的交易性能,在能夠完成任務(wù)的前提下,,設(shè)備越少,其架構(gòu)的復(fù)雜度越小,運維也更加方便。
搞清楚技術(shù)問題的種種只是開端,更重要的是,曾經(jīng)“高富帥”而又甩掉了偶像包袱的全閃存,為存儲重新定義了經(jīng)濟(jì)效益,具體來說,有以下幾個方面:
更低的實際功耗:按照企事錄團(tuán)隊的算法,目前市面上最快的磁盤是1.5萬轉(zhuǎn)(RPM)的SAS盤,功耗約為8W(實際為7.92W),IOPS大約為200,要達(dá)到10萬IOPS,需要500個硬盤,僅硬盤的功耗就接近4KW(3960W)。也就是說,光是使用磁盤系統(tǒng),一年的電費就夠買好幾臺全閃存陣列了!
某知名硬盤制造商的一款高性能磁盤——15000 RPM、300GB容量的SAS磁盤,紅框中顯示其平均功耗為7.92W。而SC4020的開機(jī)功耗最大為380W左右,10倍于測試配置。
如果使用SC4020這種最大可配置24塊2.5硬盤的2U機(jī)箱的話,500個硬盤需要21個機(jī)箱,正好滿配一個42U機(jī)柜。
而如果要達(dá)到企事錄測試獲得的30萬IOPS(實際4K隨機(jī)為37萬IOPS,8K為29萬IOPS),則需要1500個硬盤,功耗接近12KW,而SC4020正常運行和全速運行時的功耗為260W-280W之間,不到前者的四十分之一。
更小的占地空間:SC4020滿配24塊SSD,提供超過30萬IOPS,只占用2U高機(jī)架空間。而提供10萬IOPS的磁盤系統(tǒng)需要一個滿42U機(jī)柜(500 HDD),而提供30萬IOPS的磁盤系統(tǒng)則需要3個滿42U機(jī)柜。
卓越的單位I/O成本:從成本的角度來看,提供相同的I/O性能,SC4020的成本遠(yuǎn)低于磁盤系統(tǒng)。計算單位IOPS成本,考慮到SC4020在6個SSD的配置下能提供10萬IOPS,而售價才15萬人民幣,相當(dāng)于每IOPS成本1.5元人民幣,不到2元錢。
需要明確一下,與每IOPS成本相對的則是每GB成本。目前而言,按IOPS成本計,閃存占優(yōu),即閃存能夠更好地支撐性能需求型應(yīng)用;而如果應(yīng)用主要需要的是大容量的話,則基于低速(7200RPM及以下)大容量硬盤的系統(tǒng)更占優(yōu)勢,每GB成本更低。
責(zé)任編輯:潤月
來源:
51CTO