網(wǎng)絡故障診斷:網(wǎng)絡延時的診斷和分析
故障現(xiàn)象
1、內部關鍵業(yè)務響應很慢,信息處理不流暢;
2、服務器和交換機的CPU和內存利用率低;
3、無法定位查找到網(wǎng)絡響應慢的原因;
網(wǎng)絡環(huán)境
1、一臺cisco3560交換機;
2、局域網(wǎng)內有8臺服務器,其中4臺是UNIX系統(tǒng),另外4臺是Windows 2003系統(tǒng);
現(xiàn)場診斷
首先做Ping 測試。UNIX系統(tǒng)主機互ping的比較穩(wěn)定,Ping值均小于1MS。而UNIX系統(tǒng)主機去Ping Windows系統(tǒng)主機的Ping值經(jīng)常會出現(xiàn)9-15MS的延時。Windows系統(tǒng)主機之間互Ping值很不穩(wěn)定,在1MS到15MS之間跳躍性出現(xiàn)。
現(xiàn)象分析
該網(wǎng)絡結構簡單清晰,服務器和交換機的性能良好。網(wǎng)絡內經(jīng)常出現(xiàn)大于1MS的延時將會影響到整個網(wǎng)絡正常運行,對關鍵業(yè)務的運行造成影響,要解決該問題首先要找出延時發(fā)生的原因。
眾所周知,一次網(wǎng)絡交易處理過程:由客戶端發(fā)起連接,通過網(wǎng)絡轉發(fā)到服務端,服務端處理后再返回客戶端的。因此,在整個交易過程中的時延可以由三個時間來決定,客戶端響應時間(t1)網(wǎng)絡傳輸所用時間(t2)服務端響應時間(t3)。
現(xiàn)場測試發(fā)現(xiàn)UNIX系統(tǒng)主機之間ping值穩(wěn)定的小于1MS,而Windows系統(tǒng)主機之間、或與UNIX系統(tǒng)主機Ping時出現(xiàn)較大延時。這就表明UNIX系統(tǒng)主機之間通信是良好的,但是與Windows系統(tǒng)主機通信、或Windows系統(tǒng)主機之間互相通訊過程中才會有延時的出現(xiàn)。因此,我們推斷是Windows系統(tǒng)主機響應較慢。為了驗證以上推斷,我們用科來網(wǎng)絡通訊分析系統(tǒng)2009進行診斷。
利用科來網(wǎng)絡通訊分析系統(tǒng)進行網(wǎng)絡診斷
(利用科來網(wǎng)絡通訊分析系統(tǒng)2009進行抓包分析)
首先,打開科來網(wǎng)絡通訊分析系統(tǒng)2009,配置上IP為 190.15.xxx.200,此主機做為ping發(fā)起者,向一臺IP地址為190.15.xxx.218的Windows系統(tǒng)主機進行Ping測試。將該Windows系統(tǒng)主機的交換機端口做一個鏡像,鏡像收發(fā)的流量。然后,用190.15.xxx.200主機去Ping 190.15.xxx.218,用科來網(wǎng)絡通訊分析系統(tǒng)2009進行13分鐘的抓包。
抓包過程中我們發(fā)現(xiàn),190.15.xxx.200主機在Ping 190.15.xxx.218主機的時候會產生9MS的延時,而且頻率較頻繁。而190.15.xxx.200主機Ping UNIX系統(tǒng)主機則都是小于1MS的延時。另外,在鏡像口收到的icmp response 不很穩(wěn)定,而且是1MS與9MS交替出現(xiàn),表明網(wǎng)絡是不停在抖動。
鏡像的位置是Windows系統(tǒng)主機的SW端口,因此在echo response出現(xiàn)的延時可以看做是服務端響應延時,而這個響應經(jīng)常會出現(xiàn)9MS的時延。由此驗證:該網(wǎng)絡時延由win主機的響應慢造成。
然后,登錄到190.15.xxx.218主機,發(fā)現(xiàn)該主機運行了較多的程序,內存和CPU利用較高。我們對該主機進行減壓,在關閉一款殺毒軟件的進程后發(fā)現(xiàn)網(wǎng)絡延時不見了,而完全卸載該殺毒軟件后,網(wǎng)絡ping值全部穩(wěn)定在小于1MS下。
診斷結果
通過科來網(wǎng)絡通訊分析系統(tǒng)2009的抓包診斷,困擾一個月的網(wǎng)絡延時問題終于有了結果。原來該局域網(wǎng)此前一直受蠕蟲病毒困擾,為了進行網(wǎng)絡安全防御,給每個Windows系統(tǒng)主機裝了一款殺毒軟件,并且該殺毒軟件默認開啟了入侵檢測功能。該功能會對每個到達服務器的數(shù)據(jù)包進行檢測后再交給相應程序處理,而這個檢查過程是很消耗時間的,所以產生了9MS的延時。
專業(yè)網(wǎng)絡故障診斷服務簡介
網(wǎng)絡故障診斷服務是由科來軟件專業(yè)網(wǎng)絡分析技術人員提供,利用專業(yè)的網(wǎng)絡分析儀器部署在用戶指定網(wǎng)段,通過網(wǎng)絡數(shù)據(jù)包級的分析,快速定位分析引起網(wǎng)絡故障的原因,并提供相關解決問題建議,從而幫助用戶快速解決問題。
網(wǎng)絡故障診斷服務旨在為客戶提供更加人性化的服務,幫助網(wǎng)絡負責人解決切實的網(wǎng)絡問題,優(yōu)化管理網(wǎng)絡,打造健康安全穩(wěn)定的網(wǎng)絡服務。