NEC ExpressCluster化解中國電信IT之憂
越是跟生活息息相關的業(yè)務,人民對客戶體驗的要求越高,對出現(xiàn)故障的容忍度越低。在某種程度上說,未來電信運營商取勝的法則不再是電信資源,而是服務和客戶忠誠度,隨著企業(yè)規(guī)模的擴大,業(yè)務類型日趨復雜,其運營過程對信息化依賴程度也日漸加深。電信網(wǎng)絡不容許存在任何單點故障的隱患。
客戶忠誠度取決于什么?產(chǎn)品和商業(yè)模式雖然是最基礎的需求,但是未來的服務和客戶體驗,絕對是超越產(chǎn)品本身的決定性因素。三大通信巨頭的中國電信,就首當其沖的面臨著這一重大問題。
隨著企業(yè)規(guī)模的擴大,業(yè)務類型日趨復雜,中國電信的運營過程對信息化依賴程度也日漸加深。這個中國的大型國有通信公司,每次IT系統(tǒng)的升級改造都是天價的投入,只為了系統(tǒng)再穩(wěn)定一點點,業(yè)務反應再迅捷一點點。系統(tǒng)穩(wěn)定和信息安全重如泰山,不論是主機內(nèi)存、硬盤、CPU還是系統(tǒng)和應用的一絲一毫隱患,都會對電信業(yè)造成致命危機。
電信轉(zhuǎn)型之困 ——如何建立穩(wěn)定連續(xù)的IT架構
電信網(wǎng)絡不容許存在任何單點故障的隱患,而就中國電信本身的發(fā)展而言,目前阻礙通信網(wǎng)絡中的網(wǎng)絡系統(tǒng)的幾大障礙,包括有主機內(nèi)存的損壞,主機硬盤的損壞,主機CPU的損壞以及主機系統(tǒng)受病毒影響而導致宕機。從這四點來看,中國電信,為了維持系統(tǒng)穩(wěn)定性,減少業(yè)務中斷風險,打造雙機互備的共享型集群架構的高可用性方案勢在必行。
從2008年開始,中國電信在不同的部門中和不同的產(chǎn)品線上前前后后對這類雙機互備解決方案做了近2年多嚴格測試,基于兩年來的通力配合效果顯著,在2010年下半年,中國電信與NEC達成了合作,決定采用ExpressCluster解決方案來保護核心網(wǎng)的網(wǎng)管系統(tǒng),這是在系統(tǒng)連續(xù)性上取得的一個重要突破,有別于傳統(tǒng)的雙機或多機熱備方案必須通過磁盤整列共享數(shù)據(jù)的傳統(tǒng)模式。IT系統(tǒng)從原先高成本的人工運營方式向自動化、穩(wěn)定性更高的容災運維模式發(fā)展。
ExpressCluster X的以下特點受到中國電信的青睞:
1. 支持最多32個節(jié)點的集群,這樣可以充分利用服務器資源。
2. 基于Web的遠程監(jiān)視能力,能夠方便地對服務器集群進行管理。
3. 能夠在兩臺服務器之間做數(shù)據(jù)鏡像,實時保護網(wǎng)管和oracle應用,搭建成Active-Standby的熱備結(jié)構,通過高可用集群軟件ExpressCluster X實時監(jiān)控服務器運行環(huán)境。
4. 一旦發(fā)生故障,數(shù)據(jù)庫可以在ExpressCluster X的控制下自動切換到備機運行,避免故障引起的系統(tǒng)停機。
5. 在發(fā)生下列故障時可以自動切換服務器:服務器關機/掉電、OS死機/掛起、存儲I/O異常、應用程序或oracle服務停止、網(wǎng)卡異?;蚓W(wǎng)絡中斷 、ExpressCluster X自身進程異常、特定故障(用戶自定義監(jiān)控程序)。

通過磁盤鏡像技術,中國電信核心業(yè)務系統(tǒng)的高可用性級別達到99.99+%;保證雙機或多機系統(tǒng)中的所有節(jié)點數(shù)據(jù)完全同步,避免了宕機之后的巨額損失;這種數(shù)據(jù)共享的模式在減少磁盤整列采購成本的同時,降低了中國電信整個系統(tǒng)的用電功耗,節(jié)省了機房占地面積,大大提高系統(tǒng)集成度,非常符合當前運營商“綠色運維”的環(huán)保理念。