NEC 4D冗余服務(wù)器很有意思
一. 蒙古騎兵和中國(guó)高鐵
蒙古騎兵的“三騎一”。
成吉思汗麾下的鐵騎,每個(gè)騎兵要備三匹馬,征戰(zhàn)時(shí)騎一帶二,輪流騎乘。所以當(dāng)年的蒙古騎兵才可以一日千里縱橫四海。
軌道交通中的“三取二”。
高鐵機(jī)車(chē)計(jì)算機(jī)控制系統(tǒng)里有三臺(tái)一模一樣的電腦,上傳下達(dá)的控制信號(hào)首先要由這三臺(tái)電腦同時(shí)計(jì)算,只有至少兩臺(tái)電腦的計(jì)算結(jié)果一致時(shí),控制信號(hào)才能被認(rèn)可和執(zhí)行,所以數(shù)百公里時(shí)速的高速列車(chē)才能安全無(wú)虞。
那么兩匹馬夠不夠用呢?如果是小媳婦回娘家,只要騎頭驢都?jí)蛄恕?o:p>
兩匹馬不是不可以,可是成吉思汗征服世界就需要三匹馬,關(guān)鍵是有沒(méi)有?
三臺(tái)電腦夠不夠?
如果玩網(wǎng)游,一個(gè)上網(wǎng)本就夠了。
兩臺(tái)電腦容錯(cuò)當(dāng)然可以,所謂HA雙機(jī)容錯(cuò)系統(tǒng)不就是這樣的雙冗余服務(wù)器嗎?可是高鐵為保障高速運(yùn)輸安全就是需要三臺(tái)電腦冗余,問(wèn)題是能不能設(shè)計(jì)得出來(lái)這樣的“三取二”系統(tǒng)?
問(wèn)題繼續(xù)。
四匹馬有沒(méi)有?四臺(tái)電腦冗余行不行?
四匹馬的事只有成吉思汗能回答。至于四臺(tái)電腦能不能做冗余?NEC回答了這個(gè)問(wèn)題。
NEC 最新推出的4D容錯(cuò)服務(wù)器,在一個(gè)2U機(jī)箱里集成了四個(gè)電腦,這四個(gè)計(jì)算單元不僅能進(jìn)行多種形式的冗余配置,而且可以做VMware環(huán)境中的集群管理,而且,能在40度高溫中工作,而且,性能價(jià)格比讓人心動(dòng)。
二. 先說(shuō)一說(shuō)NEC
中國(guó)民間有句古話:要知道一個(gè)姑娘怎么樣, 看看她媽就知道了。
在討論NEC 的4D服務(wù)器之前,我們也先看看NEC。
NEC 這個(gè)公司有點(diǎn)奇怪,在中國(guó)雖不至于陌生,但對(duì)國(guó)人來(lái)說(shuō),也說(shuō)不上有多大了解。
但是NEC在日本可是大名鼎鼎。NEC是日本最大的IT企業(yè)之一,規(guī)模大過(guò)中國(guó)聯(lián)想,電腦銷售穩(wěn)居日本第一,日本商店的POS機(jī)、街邊的加油站計(jì)費(fèi)器都隨處可見(jiàn)NEC的商標(biāo)。
NEC的IT產(chǎn)品線很全面,包括平板電腦、臺(tái)式機(jī)、PC服務(wù)器、容錯(cuò)服務(wù)器、刀片服務(wù)器、HPC超算服務(wù)器、磁盤(pán)陣列、磁帶庫(kù)等,不僅如此,日本國(guó)家地震中心的近百臺(tái)大型計(jì)算機(jī)也是NEC的招牌產(chǎn)品,而且上到衛(wèi)星導(dǎo)航,下到汽車(chē)控制都有NEC的身影。NEC每年在東京舉辦的年度展覽會(huì)是日本IT年度盛會(huì),規(guī)模甚至可以和京交會(huì)媲美。
但NEC的IT研發(fā)思路更是不同尋常。
現(xiàn)在計(jì)算機(jī)的制冷方式大都是風(fēng)冷,而NEC就反其道而行之,成功研發(fā)推廣了水冷靜音服務(wù)器。
風(fēng)冷,很方便;水冷靜音,很人文。
大家都在追求磁盤(pán)陣列內(nèi)的硬盤(pán)數(shù)目時(shí),NEC卻又另辟奇徑,推出了大壓縮比磁盤(pán)陣列,讓你的物理容量以一當(dāng)十。
這就是NEC的另一個(gè)特點(diǎn):你大,我強(qiáng)。
十年前HA雙機(jī)容錯(cuò)系統(tǒng)很是流行,而NEC卻投入巨資研發(fā)成功了IT業(yè)界第一臺(tái)硬容錯(cuò)服務(wù)器,實(shí)現(xiàn)了CPU指令同步和內(nèi)存數(shù)據(jù)保存,終于實(shí)現(xiàn)了零秒百分之百的切換,終結(jié)了雙機(jī)軟容錯(cuò)時(shí)代。
做到極致,這是NEC的又一個(gè)特點(diǎn)
當(dāng)大家都以為NEC徹底摒棄了軟件容錯(cuò)模式時(shí),NEC又推出了這款4D冗余服務(wù)器,在在強(qiáng)調(diào)集成度、性價(jià)比和能耗的同時(shí),將雙機(jī)軟容錯(cuò)的概念一口氣推廣到四機(jī)一體軟容錯(cuò)。
IT產(chǎn)品連成線,同種產(chǎn)品高低配。因?yàn)轭櫩蛷膩?lái)不喜歡只有一樣主菜的菜單。
NEC積極活躍的、精明的、人文的技術(shù)思路也是NEC推陳出新長(zhǎng)盛不衰的保證,對(duì)國(guó)內(nèi)一些IT制造企業(yè)來(lái)說(shuō),NEC的研發(fā)特點(diǎn)或許有很好的借鑒作用。
三. 回到 NEC 4D冗余服務(wù)器
1. 高集成度
2U高度 19英寸寬度的機(jī)箱是個(gè)什么概念?不到10厘米高,50厘米寬,大致相當(dāng)于辦公桌的一個(gè)抽屜。
在這樣的機(jī)箱里集成四臺(tái)電腦,每個(gè)電腦作為一個(gè)計(jì)算單元,包括CPU、內(nèi)存、硬盤(pán)、擴(kuò)展插槽等,這樣的集成度是非常密集的。這種集成方式不同于刀片服務(wù)器,刀片服務(wù)器中每個(gè)刀片是不帶硬盤(pán)和PCI擴(kuò)展槽的,否則刀片服務(wù)器將會(huì)變得很臃腫。
密集集成首要的問(wèn)題是散熱。NEC的4D冗余服務(wù)器在散熱問(wèn)題的解決上境界不低:不僅解決了散熱問(wèn)題,而且保證系統(tǒng)可以在40度高溫中正常運(yùn)行。
同樣的性能,你是喜歡抽屜大小還是冰箱大???更高的性能伴隨更小的物理尺寸,這是IT業(yè)界的潮流,一臺(tái)機(jī)器裝滿半間機(jī)房的時(shí)代已經(jīng)一去不復(fù)返了。
2. 靈活的管控模式
四個(gè)計(jì)算單元這么搭組?NEC從手段上提供了所有的可能,但是其中是有伯仲之分的。
1)4+0: 絕對(duì)追求處理能力
四個(gè)計(jì)算單元全部投入計(jì)算,不考慮容錯(cuò)問(wèn)題。
此時(shí)4D服務(wù)器就有兩種變形可能:
第一種:四個(gè)計(jì)算單元各自承擔(dān)不同的工作;
第二種:可以通過(guò)VMware的虛擬化,將這四個(gè)計(jì)算單元整合成一臺(tái)更強(qiáng)的計(jì)算機(jī),這就是集群概念的具體應(yīng)用,NEC也提供相應(yīng)的集群管理軟件。
2)3+1: 處理能力和容錯(cuò)性能兼顧
根據(jù)以上模式,將四臺(tái)處理單元中的一臺(tái)單獨(dú)拿出來(lái),作為其他三個(gè)單元的備用機(jī)。容錯(cuò)機(jī)制依然是軟件容錯(cuò),備用單元與三個(gè)處理單元分別分成HA雙機(jī)容錯(cuò) 系統(tǒng),三個(gè)處理單元依然可以按上述的兩種工作方式分別工作或組成集群一起工作。
3)2+2: 處理能力和容錯(cuò)性能均分
可以結(jié)成兩組一一對(duì)應(yīng)的HA雙機(jī)軟容錯(cuò)系統(tǒng)。也可以再?gòu)?fù)雜一點(diǎn),兩個(gè)處理單元和兩個(gè)備用單元形成不指定的全局容錯(cuò)對(duì)應(yīng)關(guān)系。
以上三種工作模式中,單從性能價(jià)格比來(lái)說(shuō),最為理想的是第二種,即所謂的“3+1”模式。
四.魚(yú)和熊掌的平衡
一臺(tái)計(jì)算機(jī),從使者的角度來(lái)看,即希望處理速度快,又希望安全穩(wěn)定。
魚(yú)和熊掌可以兼得嗎?
答案是可以兼得,但必須有輕重之分。
硬容錯(cuò)服務(wù)器重點(diǎn)在于安全保障,在最壞情況下(如主單元掉電、CPU故障、內(nèi)存芯片失靈、硬盤(pán)崩潰等),保證作業(yè)零秒無(wú)間隙切換。這是容錯(cuò)的最高境界。在一些特別關(guān)鍵的場(chǎng)合,如關(guān)卡計(jì)費(fèi)、實(shí)時(shí)監(jiān)控、金融交易、生產(chǎn)線、試驗(yàn)場(chǎng)等應(yīng)用中特別適合。
容錯(cuò)服務(wù)器的計(jì)算性能相對(duì)于其安全性,則只能處在次要位置。雖然也可以選擇更多路的CPU、更大的內(nèi)存,但因?yàn)槿蒎e(cuò)服務(wù)器中是需要專門(mén)的容錯(cuò)硬件芯片和容錯(cuò)電路進(jìn)行控制的,其成本也是水漲船高,而且漲幅會(huì)很快。
4D冗余服務(wù)器有更靈活的組合方式,可以組合出更強(qiáng)大的計(jì)算能力,也可以組合出有高可靠性的工作方式。但是我們必須知道,4D冗余服務(wù)器在容錯(cuò)性能上,就像以前的HA雙機(jī)容錯(cuò)系統(tǒng)一樣,是基于軟件進(jìn)行容錯(cuò)的。雖然4D冗余服務(wù)器在結(jié)構(gòu)和性能上相對(duì)HA雙機(jī)軟容錯(cuò)系統(tǒng)有了長(zhǎng)足的長(zhǎng)進(jìn),但是在容錯(cuò)的徹底性上到底還是比不過(guò)硬容錯(cuò)服務(wù)器。
最后需要提及容錯(cuò)技術(shù)中一個(gè)常見(jiàn)的泡沫。
在雙機(jī)軟容錯(cuò)系統(tǒng)中,經(jīng)常見(jiàn)到這樣的介紹:兩臺(tái)機(jī)器平時(shí)可以各自工作,一臺(tái)故障時(shí),故障機(jī)上的作業(yè)可以由容錯(cuò)軟件切換到正常機(jī)上自動(dòng)運(yùn)行。
這是一個(gè)看上去挺美的技術(shù)泡沫,自打二十年前HA雙機(jī)容錯(cuò)誕生時(shí)一直講到今天。
兩個(gè)壯碩的蒙古騎兵,當(dāng)其中一個(gè)的戰(zhàn)馬倒下后,兩個(gè)人再合乘一匹馬繼續(xù)戰(zhàn)斗。
繼續(xù)戰(zhàn)斗?逃跑可能都來(lái)不及了。 戳破泡沫的道理其實(shí)就這么簡(jiǎn)單。