單機百萬TPM!用得起的iOe?
2016戴爾科技峰會精彩搶先看之一↓↓
現(xiàn)場真機實測show
12月14日大會當(dāng)天,邀請專業(yè)評測機構(gòu)企事錄在關(guān)鍵業(yè)務(wù)數(shù)據(jù)庫和分布式融合系統(tǒng)領(lǐng)域,搭建了兩套足以顛覆傳統(tǒng)的DEMO方案,讓雙模式IT用戶都可以看到新技術(shù)帶來的性能的突飛猛進。
1.企業(yè)關(guān)鍵業(yè)務(wù)數(shù)據(jù)庫性能實測
企業(yè)關(guān)鍵業(yè)務(wù)數(shù)據(jù)庫系統(tǒng)--今天,只用之前IOE十分之一的價格,四十分之一的功耗,就取得了更好的性能,用戶還完全不必?fù)?dān)心數(shù)據(jù)的安全性和系統(tǒng)的可靠性?
工程師將現(xiàn)場演示在真實的Oracle 12c環(huán)境下是如何跑出64萬TPM的優(yōu)異性能!
2.軟件定義超融合架構(gòu)FX2
軟件定義,硬件重構(gòu)!現(xiàn)場搭建基于Ceph的SDS系統(tǒng),看看軟件定義超融合架構(gòu)FX2是如何在超小空間里提供完整的SDS解決方案?
雙十一那一晚,何止是妹子們的瘋狂夜!
1800萬TPM的天量指標(biāo)
上萬臺服務(wù)器布網(wǎng)火力陣線……
技術(shù)咖們再次將性能峰值推向下一個***
拜科技發(fā)展所賜
現(xiàn)在,只要一臺單機就可獲得***TPM
企事錄的機房為您揭秘
集***TPM、高可用性于一身
爆款“全能王”戴爾PowerEdge R930
在這個世界上,沒有哪家的交易量能比得上中國的雙11狂歡節(jié)了,即便是剛剛在北美結(jié)束的黑五,較雙11的成交量和成交金額都成了一個不起眼的數(shù)字,無他,中國人多,上網(wǎng)剁手也方便。
那一晚,我們說IT
僅僅在雙11的最開始30分鐘,天貓每秒交易峰值17.5萬筆,相當(dāng)于17.5萬的峰值TPS;每秒支付峰值12萬筆則相當(dāng)于12萬峰值TPS。這兩者加起來差不多需要接近30萬TPS性能,簡單換算,不考慮其他因素影響,差不多達(dá)到了1800萬TPM的天量指標(biāo),這對于這個星球上的絕大多數(shù)數(shù)據(jù)庫系統(tǒng)來說,都是一個無法跨越的高山。先不說誰家數(shù)據(jù)庫技術(shù)能滿足天貓雙11的交易和支付性能需求(登錄、瀏覽等操作不在此列),單說阿里為了應(yīng)對“雙11”,應(yīng)該部署了上萬臺服務(wù)器來滿足如此天量的并發(fā)需求。
雖然用1800萬TPM的性能估算天貓的峰值性能并不科學(xué),畢竟“雙11”是全球***規(guī)模的“購物狂歡”,而分布式的系統(tǒng)架構(gòu)也是天貓能承載如此應(yīng)用的關(guān)鍵。在常規(guī)環(huán)境中,絕對大多數(shù)企業(yè)沒有這么天量的需求,也沒有必要維護如此龐大的系統(tǒng)。
【名詞解釋:TPM是Transactions Per Minute的簡稱,即數(shù)據(jù)庫在分鐘內(nèi)可以處理的事務(wù)數(shù)。TPM是用來衡量數(shù)據(jù)庫性能的一個關(guān)鍵指標(biāo)?!?/strong>
那么在開放的x86平臺上,就只能用數(shù)量換取性能和可靠性嗎?答案很明顯——不是。
企事錄經(jīng)過差不多兩年時間的等待,當(dāng)然,除了我們在儲備自己的技術(shù)積累外,還是在等一個外部的機會,那就是新一代的高端x86服務(wù)器和顛覆存儲的新一代SSD。
從IOE到iOe,兩大技術(shù)進步
成就爆款“全能王”
時光機開啟——回退十年!十年之前,屬于你,屬于我……屬于小機、屬于SAN的年代,那時候大家還都在IOE的懷抱里,好溫暖、好舒服,因為他們都是價格巨高、運維巨簡單的設(shè)備(買服務(wù)就好,反正出了問題運維搞不定,也不敢搞),連阿里巴巴都在用。如果一個項目需要部署單機百萬TPM的數(shù)據(jù)系統(tǒng),那么需要準(zhǔn)備什么呢?
哦,性能要求太高,搞不定!
再次乘坐時光機——回到5年前!一個項目需要部署一套單機百萬TPM的數(shù)據(jù)庫系統(tǒng),那么CIO需要考慮什么呢?計算性能是首先要考慮的,百萬TPM起碼需要8路小機來提供計算支持;存儲也是非常重要的環(huán)節(jié),要提供百萬TPM,需要接近百萬IOPS的存儲設(shè)備,那么一套幾千塊硬盤的高端磁盤陣列(SAN)就是必須購買的,F(xiàn)C交換機等網(wǎng)絡(luò)設(shè)備林林總總的也不老少,一套這樣的系統(tǒng),……需要***別的投入!?每年光電費就要幾十萬!?這不可能!沒那么多錢……
于是項目就流產(chǎn)了……
時間來到了2016年底,在企事錄的機房里,我們只花費了區(qū)區(qū)幾十萬,就得到了一個百萬TPM性能的系統(tǒng),只占用4U的機架空間,工作時的功耗竟然只有380瓦。
預(yù)算從***別掉到幾十萬,購置一套性能相同的設(shè)備只需要花掉十年前的電費錢?這樣的落差會讓絕大多數(shù)用戶感到難以理解,憑什么啊?
就憑技術(shù)的發(fā)展!主要總結(jié)為兩條線:
✔ x86的進步讓單機的計算性能超越了小機,一臺4路的至強E7 v4服務(wù)器可以提供多達(dá)192核,12TB內(nèi)存的強悍性能;
✔ 新一代的PCIe NVMe SSD可以輕松獲得50W IOPS以上的I/O性能,直接PK掉傳統(tǒng)SAN存儲;
雙線并行,百萬TPM不是夢!
當(dāng)然,企業(yè)級數(shù)據(jù)庫系統(tǒng)仍然***Oracle,不過已經(jīng)進化到12c版本。O還是那個O,IE已經(jīng)不是那個IE——IBM換成了intel,EMC換成了NVMe——嗯,是ie,或者說,iOe!
機房里爆發(fā)出一陣歡呼“技術(shù)才是時代***音!宇宙無敵的砍價高手啊~~~從千萬砍到幾十萬,剩下的錢都夠在北京買房了!”
嗯,打住,我們還是回來看看為什么以前的百萬TPM那么的貴吧。
眾所周知,作為企業(yè)IT核心的數(shù)據(jù)庫系統(tǒng)主要是由服務(wù)器+數(shù)據(jù)庫+存儲系統(tǒng)三大塊構(gòu)成。其中,數(shù)據(jù)庫系統(tǒng)通常是Oracle數(shù)據(jù)庫,但Oracle數(shù)據(jù)庫這么多年來依然是關(guān)系型數(shù)據(jù)庫領(lǐng)域的霸主,價格一直堅挺,所以價格大幅跳水跟數(shù)據(jù)庫沒什么關(guān)系。
服務(wù)器這塊倒是有顯著變化:五年前Unix服務(wù)器還是比較“傲嬌”的,企業(yè)在搭建數(shù)據(jù)庫這種核心IT系統(tǒng)時***的是小型機,然而,隨著x86服務(wù)器的性能、可靠性以及可用性的突飛猛進,x86服務(wù)器+Oracle數(shù)據(jù)庫的組合變得越來越常見——更不要說,Oracle自己推出的Exadata數(shù)據(jù)庫一體機采用的就是x86服務(wù)器。當(dāng)然,x86服務(wù)器比Unix服務(wù)器價格的確便宜不少,但即便搭配新款小型機的價格也不像以往那么堅挺了,所以從小機遷到x86服務(wù)器,這只是單機百萬TPM數(shù)據(jù)庫系統(tǒng)價格跳水的一個因素。
其實價格跳水的主要大頭在存儲系統(tǒng)。企事錄評測“磚家”曾智強表示,在過去要配備一套超高性能的數(shù)據(jù)庫系統(tǒng),存儲方面的支出就是大頭,因為基于機械硬盤的存儲很難獲得較好的Oracle數(shù)據(jù)庫性能。
“先不說百萬TPM,就說說百萬IOPS需要多少塊硬盤——不加隊列深度的情況下,一塊15000PRM的SAS 硬盤IOPS約為200,也就是說如果要達(dá)到百萬IOPS就需要5000塊性能***的硬盤,所以在傳統(tǒng)SAN時代,***的高端存儲設(shè)備標(biāo)稱可以支持5000+塊硬盤,也就是一百萬IOPS出頭。”曾智強說。
5000塊硬盤什么概念?按一個2U機箱插24塊盤來算,需要占整整八個機柜,一塊硬盤6.8W的功耗,百萬IOPS就需要34KW的供電,怪不得電費一年就幾十萬。
不“傲嬌”的全能王
在企事錄的機房里,戴爾的PowerEdge R930服務(wù)器上,我們的工程師在一臺配備了兩塊PCie SSD的戴爾四路服務(wù)器上跑Oracle數(shù)據(jù)庫就跑出了百萬TPM的好成績。
戴爾PowerEdge R930是一臺4U高度的4路高端x86服務(wù)器,它安裝了4顆至強E7 v3 8880處理器,這個18核36線程的處理器在4路配置時,具有144顆邏輯處理器,當(dāng)然,現(xiàn)在可以無縫支持至強 E7 v4處理器了,可以提供最多192顆邏輯處理器,性能更上一層樓。
看看系統(tǒng)里這么多的核,想想都激動。
E7 v3 8880的主頻為2.3GHz,但是睿頻后能達(dá)到3.1GHz,單顆處理器的TDP 150W,能滿足絕大多數(shù)用戶對計算性能的需求。適合云計算主機、大型虛擬化應(yīng)用環(huán)境和企業(yè)關(guān)鍵業(yè)務(wù)數(shù)據(jù)等環(huán)境的使用。
而且PowerEdge R930***支持12TB DDR4-2133內(nèi)存(單條128GB內(nèi)存),意味著即便是內(nèi)存型數(shù)據(jù)庫也都可以輕松運行。而且支持內(nèi)存鏡像、熱備等多種先進的內(nèi)存工作特性,具備了媲美小機的可靠性。
內(nèi)存搞這么大,性能飆那么高,三天兩頭宕機也吃不消啊!對于高端服務(wù)器來說,有一個關(guān)鍵的指標(biāo)叫做RAS特性,要滿足服務(wù)器99.9%以上的可用性,不是一句話能說明白的,而RAS特性則很好地詮釋了高端x86服務(wù)器是如何提供高可用性的。
RAS——Reliability, Availability and Serviceability(可靠性、可用性、可擴展性)
▌可靠性Reliability
可靠性是降低硬件故障的幾率,除了采用高可靠性的部件,還可以改善硬件的工作環(huán)境;通過增加局部的冗余延長整體的平均故障間隔時間。
戴爾R930在內(nèi)存板、CPU散熱片和擴展卡上大量使用熱管技術(shù),能顯著降低系統(tǒng)關(guān)鍵部件的工作溫度,提升可靠性;R930的背部提供左右兩組4路熱交換電源,支持雙路電源供電。
12厘米大口徑風(fēng)扇2*3設(shè)計,營造了良好的散熱風(fēng)道環(huán)境,全冗余設(shè)計也保證了極端情況下的服務(wù)器散熱
▌可用性Availability
可用性是在出現(xiàn)無法糾正的錯誤時,系統(tǒng)和應(yīng)用程序的運行不會中斷。
戴爾Poweredge R930 基于至強E7 v3計算平臺,在內(nèi)存的可靠性上提供3種硬件層的內(nèi)存可靠性選擇。這些功能是基于E7 v3處理器實現(xiàn)的功能, CPU是直接通過主板的內(nèi)存通道/接口連接內(nèi)存板的。支持內(nèi)存鏡像、熱備和數(shù)據(jù)轉(zhuǎn)移等功能,雖然鏡像和熱備功能會損失最多一半的內(nèi)存容量,但是能大幅增加內(nèi)存部分的可靠性。
▌易維護性Serviceability
易維護性是在正常運行狀態(tài)下對系統(tǒng)進行維護。
戴爾R930前部提供了iDRAC8 顯示屏,能顯示系統(tǒng)重要參數(shù)和信息。通過瀏覽器遠(yuǎn)程訪問iDRAC8能夠完整監(jiān)控和管理R930的方方面面,增強維護便利性,方便用戶。
內(nèi)存板和風(fēng)扇都可以全免工具維護,它們安裝在一個堅固的框架中,在易維護和可靠性上做到了高平衡。戴爾R930機箱帶有把手便于搬運。
總結(jié)
“正是因為戴爾 R930的超強計算性能,附以豐富、先進的RAS特性,支持新一代的企業(yè)級存儲、網(wǎng)絡(luò)設(shè)備,才讓以往百萬TPM能夠在我們簡單的機房環(huán)境中,通過一個普通的市電插座就能實現(xiàn)。這無疑要歸功于技術(shù)的進步,讓我們能用更低的花費獲得更強的數(shù)據(jù)庫處理性能。科技,加速一切想象變成現(xiàn)實的進程!”企事錄聯(lián)合創(chuàng)始人李獻(xiàn)說。