IP網絡的可視化運營
三個“不可視”
由于IP網絡運維存在三個“不可視”,存在黑匣子現(xiàn)象,導致運維效率低。
首先,承載的業(yè)務品質不可視,不能感知終端用戶體驗。
傳統(tǒng)網管只能提供網絡的性能,看不到內容的承載質量,網絡性能與業(yè)務品質是分離的,業(yè)務部門和網絡部門認識故障的維度不統(tǒng)一,沒有統(tǒng)一的度量尺度,造成故障定位需要跨部門專家協(xié)同工作,人員技能要求高,故障定位效率低,互相推諉責任的現(xiàn)象時有發(fā)生。
其次,路由不可視,看不到業(yè)務路徑。
IP網絡引入動態(tài)路由,三層網絡是一片云,看不到業(yè)務的路徑。路由不可視導致在IP網絡運維過程中,經常出現(xiàn)終端用戶申報了故障,而當運維人員進行故障定位時,故障又消失了,故障無法重現(xiàn),又沒有歷史信息可以查詢,無法找到故障原因,無法徹底解決用戶的問題,造成排除故障隱患困難,并且需要高水平的數(shù)通專家參與故障定位。路由不可視還導致運維人員無法預防路由振蕩引起的全網故障,路由振蕩對網絡的影響是災難性的,最壞可以引起網絡癱瘓。
第三,端到端管道不可視,創(chuàng)建過程復雜,且狀態(tài)不可視。
端到端管道的創(chuàng)建過程需要跨域部署,并且配置內容復雜,傳統(tǒng)的單域網管不能實現(xiàn)可視化的高效下發(fā),下發(fā)后也不能看到IP管道的狀態(tài)。在業(yè)務部署過程中,需要運維人員全盤考慮每個節(jié)點上業(yè)務部署的參數(shù)和參數(shù)之間的相互關系,一旦發(fā)生參數(shù)配置錯誤,也很難檢查和糾正,對IP運維人員的專業(yè)技能要求高。
面對上述難題,運營商的網絡運維部門往往很是頭疼。難道IP網絡的可靠性真的很低嗎?
探索解決方法
其實,IP網絡的可靠性并不是無法解決。在IP網絡運維中,我們需要一個很重要的思想轉變,即從被動運維轉為主動運維。
相比以前接到終端用戶投訴再進行網絡故障檢測的被動運維模式,IP網絡的運維要求更高,需要運營商根據(jù)網絡的日常運行狀況提前預警網絡的薄弱環(huán)節(jié),提前預防。因此,運維模式的轉變在All IP化道路上顯得非常重要,那么到底什么樣的主動運維才符合IP網絡呢?
主動運維要求實現(xiàn)對終端用戶的業(yè)務體驗監(jiān)控,運維人員周期性地收集網絡性能和業(yè)務品質數(shù)據(jù),并通過分析數(shù)據(jù),將其中的趨勢內容挖掘出來,對潛在的故障點和薄弱環(huán)節(jié)進行預判斷,使運營商可以提前感知終端用戶的業(yè)務體驗程度,預先判斷業(yè)務是否會發(fā)生劣化,并提前解決由此帶來的一系列問題,從而降低終端用戶投訴,提高客戶忠誠度,并降低運維成本。
運營商在運維系統(tǒng)的投資驅動力的分布情況,驗證了IP主動運維的必要性。Gartner的調查結果表明,“主動預防網絡性能問題”是當前運營商首要的運維投資驅動力,占整個投資的27%,而“快速網絡故障診斷”、“業(yè)務質量保障SLA”分別排在第二、第三位,其投資驅動力分別為15%、12%。
IP網絡運維有以下三個要求:快速解決故障,即當網絡和業(yè)務出現(xiàn)故障時,需要快速解決問題,實現(xiàn)迅速的故障定界和定位;主動預防問題,即對業(yè)務質量和網絡性能實時監(jiān)控,及時發(fā)現(xiàn)問題,IP承載網的故障需要關聯(lián)到被影響的業(yè)務上,并通過趨勢分析,提前做出預警;網絡日常管理,即建立網絡質量監(jiān)控和健康評估系統(tǒng),通過整套的KQI/KPI指標體系來反映和管理用戶體驗,掌握網絡的實際運行狀態(tài),不斷提高終端用戶的忠誠度。
可度量,才可管理;可管理,才可改進。在網絡IP化后,最先需要解決的問題就是可度量,即IP運維要做到可視。
IP網絡的“儀表盤”
IP網絡的管理方法是多種多樣的,但只有充分跟業(yè)務關聯(lián),關注QoE指標,真正實現(xiàn)IP網絡運維的可視化,才能保證網絡的可靠性,才能更好承載各種業(yè)務。華為開創(chuàng)IP網絡可視化的業(yè)界先河,成功實現(xiàn)IP業(yè)務質量、路徑和部署的可視化,徹底解決IP運維的黑匣子問題。
U2520是華為公司最新推出的IP網絡業(yè)務保障系統(tǒng),支持寬帶承載、移動承載、IP Core解決方案,由業(yè)務監(jiān)控系統(tǒng)和網絡評估單元兩部分組成。
業(yè)務監(jiān)控系統(tǒng)可以實現(xiàn)網絡質量監(jiān)控、業(yè)務質量監(jiān)控、按需測試、閾值告警管理、探針管理、系統(tǒng)管理和報表管理功能。網絡評估單元是盒式外置探針,可以部署在網絡接入層和匯聚層,實現(xiàn)對網絡和業(yè)務性能數(shù)據(jù)的采集并上報給監(jiān)控系統(tǒng)。
華為U2520被譽為IP網絡的“儀表盤”,其技術優(yōu)勢體現(xiàn)在以下兩個方面:
IP轉發(fā)平面可視:感知IP承載業(yè)務品質,全面監(jiān)控IPTV、VoIP、HSI、VPN業(yè)務,真實反映終端用戶的業(yè)務體驗,通過業(yè)務承載質量的逐段對比,實現(xiàn)基于業(yè)務的故障的定界和責任劃分,便于維護人員對IP轉發(fā)平面的故障進行快速處理。IP網絡運維部門和業(yè)務運營部門擁有相同的QoE指標,業(yè)務故障的界定一目了然。
IP控制平面可視:IP業(yè)務有了路徑,自動計算并顯示業(yè)務路徑,監(jiān)聽和分析路由變化,預防路由振蕩引起的全網故障,用于維護人員對IP控制平面的故障進行快速分析、預警和定位。
IP轉發(fā)平面可視和IP控制平面可視相結合,轉發(fā)平面主動模擬業(yè)務報文測試過程,可以結合業(yè)務路徑進行測試。一旦三層業(yè)務路徑發(fā)生變化,轉發(fā)平面的測試也動態(tài)調整,轉發(fā)平面的測試也就可以實現(xiàn)對業(yè)務承載的自動化監(jiān)控管理;一旦發(fā)現(xiàn)業(yè)務承載質量有劣化趨勢,即可自動觸發(fā)智能專家診斷系統(tǒng),在短時間內發(fā)現(xiàn)劣化的根因,并通過專家診斷系統(tǒng)給出問題處理建議,將IP網絡運維效率大幅提升,并可以像SDH網絡運維一樣實現(xiàn)主動運維,通過運維效率的改進,提升網絡競爭力,并有效提高終端用戶的滿意度。
在全面監(jiān)控IP轉發(fā)平面和控制平面的基礎上,華為U2520提供完善的指標體系,提供網絡健康評估系統(tǒng),并提供運維工作的評判標準,提高網絡運維能力。通過指標體系的分析統(tǒng)計,基層運維人員能夠在解決眼前問題的同時,發(fā)現(xiàn)問題產生的根源,并針對性地加以改進,以規(guī)避人為因素導致的一些故障,從而實現(xiàn)運維效率的持續(xù)改進提升。
U2520還能實現(xiàn)業(yè)務監(jiān)控全網化,提供多廠商設備組網的業(yè)務品質監(jiān)控解決方案,滿足運營商各種組網環(huán)境的監(jiān)控要求。
值得一提的是,與U2520共同使用的華為U2000網管系統(tǒng),支持E2E業(yè)務參數(shù)的資源池管理,通過點擊源、宿節(jié)點即可完成E2E業(yè)務的自動創(chuàng)建,系統(tǒng)動態(tài)分配業(yè)務參數(shù),自動管理各網元上E2E業(yè)務參數(shù)之間的邏輯關系,自動檢查配置,自動校驗通斷,一次開通業(yè)務,并支持一站式多網元批量配置,端到端業(yè)務發(fā)放VPN,端到端可視操作,管道質量可視化展現(xiàn),易學易用。
自2009年第三季度正式推向市場后,U2000在全球的應用進入了一個快速增長期,截至目前,已在歐洲、北美、亞太、澳洲等地區(qū)的30多個主流運營商實現(xiàn)了規(guī)模部署,其中包括中國移動、中國聯(lián)通、Vodafone、DT、FT、Telefonica、Swisscom等全球領先運營商。