敏捷網(wǎng)絡(luò),“盡在掌控”的網(wǎng)絡(luò)運維新體驗
凌晨2:00,某跨國公司運維機房內(nèi),IT運維人員們正在緊張地排查分析視頻會議系統(tǒng)為何無法正常使用,按計劃當(dāng)天上午9:00 CEO要召開一個高層的視頻會議,所以視頻會議系統(tǒng)必需要在上班前恢復(fù)正常,運維人員面臨著巨大的壓力。您是否對這樣的場景似曾相識?正如網(wǎng)絡(luò)上流行的一首打油詩 “鋤禾日當(dāng)午,不如運維苦,對著破電腦,一調(diào)一下午”寫出了IT運維人員的心聲。
隨著網(wǎng)絡(luò)規(guī)模越來越大、網(wǎng)絡(luò)中承載的業(yè)務(wù)類型越來越多樣化,當(dāng)用戶業(yè)務(wù)體驗受損時,IT運維人員往往難以判斷是業(yè)務(wù)系統(tǒng)的問題,還是網(wǎng)絡(luò)引起的問題,更不用說定位具體什么問題導(dǎo)致用戶體驗變差,運維人員很多時候都在忙著“救火”。如何掌握業(yè)務(wù)質(zhì)量情況,如何實現(xiàn)網(wǎng)絡(luò)故障快速精準(zhǔn)定位,這些已經(jīng)成為網(wǎng)絡(luò)運維領(lǐng)域急需解決的問題。
影響用戶業(yè)務(wù)體驗的因素有哪些?
如果想準(zhǔn)確定位業(yè)務(wù)體驗變差的原因,首先需要了解哪些因素會對用戶業(yè)務(wù)體驗有影響,這樣才能做到知己知彼百戰(zhàn)不殆。除了人們熟知的網(wǎng)絡(luò)通斷、帶寬不夠會影響業(yè)務(wù)體驗外。還有很多其他因素也在影響用戶的業(yè)務(wù)體驗,例如:設(shè)備老化丟包、網(wǎng)絡(luò)配置錯誤、光纖劣化丟包、網(wǎng)絡(luò)攻擊、流控失效等等,但卻由于缺少有效的檢測方法和技術(shù)而被人們長期忽略。
當(dāng)網(wǎng)絡(luò)中傳輸數(shù)據(jù)類業(yè)務(wù)時,即便網(wǎng)絡(luò)出現(xiàn)了丟包,TCP報文會重傳,用戶會感覺到網(wǎng)絡(luò)訪問比較慢,但并不會造成嚴(yán)重影響。而高清視頻、語音等實時類業(yè)務(wù)對網(wǎng)絡(luò)質(zhì)量提出了更高的要求,以高清視頻業(yè)務(wù)為例,要求丟包率小于10-6 ,也就是說一旦100萬個包里面丟一個包,就會出現(xiàn)視頻馬賽克,而且用戶也能立刻體驗到。為了保證視頻類業(yè)務(wù)的正常使用,有些大型企業(yè)往往會單獨建立一張視頻會議專網(wǎng)。
業(yè)務(wù)質(zhì)量難檢測,網(wǎng)絡(luò)故障難定位的根本原因在哪里?
伴隨著互聯(lián)網(wǎng)的快速發(fā)展,IP網(wǎng)絡(luò)已經(jīng)成為信息承載的基石。大家都知道 IP網(wǎng)絡(luò)是一個面向無連接的網(wǎng)絡(luò),采取“盡力而為”的轉(zhuǎn)發(fā)模式,這成就了IP網(wǎng)絡(luò)的大規(guī)模部署和發(fā)展,為今天豐富多樣的互聯(lián)網(wǎng)業(yè)務(wù)提供了基礎(chǔ)保障,但這同時也是造成業(yè)務(wù)質(zhì)量難檢測,網(wǎng)絡(luò)問題難定位的根本原因。
IP網(wǎng)絡(luò)中傳輸?shù)闹挥袛?shù)據(jù)報文,沒有任何與業(yè)務(wù)相關(guān)的信息,可以說網(wǎng)絡(luò)與業(yè)務(wù)完全割裂,這是造成業(yè)務(wù)質(zhì)量難檢測,網(wǎng)絡(luò)故障難定位的根本原因所在。當(dāng)您在視頻會議中出現(xiàn)馬賽克,體驗變差時,網(wǎng)絡(luò)卻無法快速感知到業(yè)務(wù)質(zhì)量變差并反饋給IT運維人員來進(jìn)一步解決。只有當(dāng)您實在無法忍受并將問題報給IT人員時,他才知道網(wǎng)絡(luò)出現(xiàn)了問題,但基于現(xiàn)有的網(wǎng)絡(luò)質(zhì)量檢測技術(shù)IT人員也很難快速定位出產(chǎn)生問題的具體原因。面對IP網(wǎng)絡(luò)無連接特性而帶來的質(zhì)量檢測難題,現(xiàn)有的網(wǎng)絡(luò)質(zhì)量檢測技術(shù)還未能很好的解決
“盡力而為”轉(zhuǎn)變?yōu)?ldquo;盡在掌控”的敏捷網(wǎng)絡(luò),帶來全新運維體驗
基于以上的分析,我們就在考慮,能否為無連接的IP網(wǎng)絡(luò)增加一個主動的質(zhì)量感知機制。當(dāng)網(wǎng)絡(luò)上運行的業(yè)務(wù)出現(xiàn)問題時,網(wǎng)絡(luò)能夠感知到并將故障點信息快速反饋給IT人員。這就好像我們?nèi)梭w一樣,身體有一個自我感知和反饋的系統(tǒng),當(dāng)受涼感冒時,會通過發(fā)燒、頭痛等癥狀告訴你身體內(nèi)出現(xiàn)了問題,你需要去看醫(yī)生或者吃藥來進(jìn)行進(jìn)一步的治療以防止病情加重。網(wǎng)絡(luò)也同樣需要這樣一個機制。
華為利用專利技術(shù)解決了IP網(wǎng)絡(luò)質(zhì)量難檢測,故障難定位的問題。華為敏捷網(wǎng)絡(luò)利用iPCA(包守恒算法,Packet Conservation Algorithm for Internet)技術(shù),為面向無連接的IP網(wǎng)絡(luò)增加了一個主動的質(zhì)量感知機制,即保留了IP網(wǎng)絡(luò)面向無連接的特性,也實現(xiàn)了網(wǎng)絡(luò)質(zhì)量主動感知,從而可以全面提升網(wǎng)絡(luò)質(zhì)量檢測和故障精確定位能力,降低網(wǎng)絡(luò)運維成本。
那么,iPCA是如何實現(xiàn)網(wǎng)絡(luò)質(zhì)量檢測的呢?對于任何一個網(wǎng)絡(luò)區(qū)域,都存在網(wǎng)絡(luò)邊界,iPCA通過統(tǒng)計一段時間內(nèi)流入與流出該網(wǎng)絡(luò)區(qū)域的報文數(shù)量是否相等,來判斷該網(wǎng)絡(luò)區(qū)域是否存在問題。就像我們要判斷一個容器是否漏水一樣,可以從入口倒些水進(jìn)去,根據(jù)出口接到的水與倒入的水是否一樣多來進(jìn)行判斷。進(jìn)一步類推,如果水從流入到流出經(jīng)過了多個容器和連接的管道,我們也可以采用這種方法來逐段檢測到底是哪個一段漏水或者堵塞了。要真正在網(wǎng)絡(luò)中部署,并實現(xiàn)網(wǎng)絡(luò)質(zhì)量的精準(zhǔn)檢測,還有一些技術(shù)難點需要解決,例如:如何解決多入口多出口網(wǎng)絡(luò)區(qū)域的檢測而不用建立點到點之間連接?如何基于真實業(yè)務(wù)流來檢測并保證檢測的精準(zhǔn)性與實時性?華為基于在網(wǎng)絡(luò)領(lǐng)域的深厚技術(shù)積累已經(jīng)完美解決了上述技術(shù)難點。
借鑒SDN的集中控制思想,集中統(tǒng)計并計算網(wǎng)絡(luò)邊界的多個端口在一段時間內(nèi)流入與流出的報文數(shù)量之差,從而判斷網(wǎng)絡(luò)的丟包情況,基于IP報文進(jìn)行檢測和通信,各檢測點之間無需建立點到點的連接,便于大規(guī)模部署。為了實現(xiàn)網(wǎng)絡(luò)質(zhì)量精準(zhǔn)檢測,iPCA首先采用外部時鐘同步法對各檢測設(shè)備進(jìn)行時鐘同步,并且在網(wǎng)絡(luò)區(qū)域入口處,利用IP報文頭中的保留位對業(yè)務(wù)報文進(jìn)行周期性的“染色”,可以理解為對業(yè)務(wù)報文做了標(biāo)記,在出口處根據(jù)標(biāo)記位來統(tǒng)計收到的報文數(shù)量,實現(xiàn)了基于真實業(yè)務(wù)報文來檢測網(wǎng)絡(luò)質(zhì)量情況,對業(yè)務(wù)無影響。如果報文經(jīng)過多個網(wǎng)絡(luò)設(shè)備及鏈路,利用iPCA技術(shù),還可以檢測出具體是那臺設(shè)備、那段鏈路出現(xiàn)了問題,實現(xiàn)網(wǎng)絡(luò)故障精確定位,幫助運維人員極大提高故障定位效率。
讓我們一起來看看iPCA能為您的日常運維帶來哪些好處。
1、 首先,當(dāng)網(wǎng)絡(luò)中的設(shè)備啟用了iPCA功能時,IT運維人員可以從網(wǎng)管上全面掌握網(wǎng)絡(luò)的質(zhì)量情況。例如:查看關(guān)鍵設(shè)備/鏈路是否有大量丟包、了解某些重要業(yè)務(wù)的質(zhì)量情況。
2、 其次,實現(xiàn)網(wǎng)絡(luò)問題的精準(zhǔn)定界。例如:企業(yè)通過租用運營商專線連接多個分支機構(gòu)時,當(dāng)跨廣域的業(yè)務(wù)出現(xiàn)問題時,可以通過在廣域網(wǎng)邊緣設(shè)備啟用iPCA功能來具體判斷是運營商廣域網(wǎng)、還是企業(yè)自身的園區(qū)網(wǎng)絡(luò)出現(xiàn)了問題,實現(xiàn)網(wǎng)絡(luò)問題精確定界。
3、 最后,實現(xiàn)網(wǎng)絡(luò)問題的精確定位。當(dāng)某網(wǎng)絡(luò)區(qū)域出現(xiàn)大量丟包時,網(wǎng)絡(luò)不僅能主動告知運維人員某類業(yè)務(wù)變差,網(wǎng)絡(luò)出現(xiàn)問題,運維人員還可以進(jìn)一步分析和定位具體是網(wǎng)絡(luò)鏈路上的哪臺設(shè)備、哪個鏈路出現(xiàn)了問題,做到了網(wǎng)絡(luò)問題快速、精準(zhǔn)定位,不用再去逐個設(shè)備排查,徹底解放了運維人員。
華為通過專利技術(shù)解決了IP網(wǎng)絡(luò)質(zhì)量檢測的難題,幫助IT運維人員全面掌握業(yè)務(wù)質(zhì)量情況,實現(xiàn)了IT運維人員的徹底解放。運維人員再也不用加班熬夜來定位網(wǎng)絡(luò)問題,不用天天忙著“救火”了。