網(wǎng)絡(luò)丟包故障處理方案
一、網(wǎng)絡(luò)丟包的定位與處理
出現(xiàn)網(wǎng)絡(luò)丟包現(xiàn)象時,第一步需要確定丟包的網(wǎng)絡(luò)位置,其次是確定丟包的故障原因,然后依據(jù)定位的故障原因再進(jìn)行解決。定位流程大致如圖8-1。
圖8-1 網(wǎng)絡(luò)丟包的定位與處理
本文采用某園區(qū)的丟包故障現(xiàn)象為例,給出部署了交換機的網(wǎng)絡(luò)發(fā)生丟包的定位與處理方法。
例如,某園區(qū)部署的網(wǎng)絡(luò)如圖8-2上連接用戶A、用戶B和用戶C上連接入交換機Switch_3和Switch_2,用戶D和用戶E上連接入交換機Switch_4,之后共同接入到核心交換機Switch_1,并通過防火墻連接到Internet。
圖8-2 某園區(qū)部署網(wǎng)絡(luò)組網(wǎng)圖
用戶A反饋上網(wǎng)很慢,有時甚至打不開網(wǎng)頁,而其他用戶沒有異常反饋。此時在用戶A的PC上直接Ping公網(wǎng)地址有丟包。
二、確認(rèn)發(fā)生網(wǎng)絡(luò)丟包
網(wǎng)絡(luò)丟包的故障現(xiàn)象通常表現(xiàn)為:
用戶上網(wǎng)時:
- 網(wǎng)絡(luò)速度不穩(wěn)定,打開網(wǎng)頁的速度特別的慢,有時候還會出現(xiàn)網(wǎng)頁部分內(nèi)容或是整個頁面無法顯示的問題;
- 觀看視頻業(yè)務(wù)時有馬賽克或花屏等卡頓現(xiàn)象;
- QQ等即時通訊工具等頻繁掉線或提示登錄超時;
- 下載文件速度慢;
交換機工作時:
- 在交換機上執(zhí)行Ping操作,對網(wǎng)絡(luò)進(jìn)行連通性測試,提示超時;
- 端口無法正常轉(zhuǎn)發(fā)數(shù)據(jù);
- 管理用戶登錄交換機,提示超時;
- 業(yè)務(wù)經(jīng)常中斷;
這些故障現(xiàn)象幾乎都跟網(wǎng)絡(luò)丟包有關(guān)。如果現(xiàn)網(wǎng)當(dāng)中出現(xiàn)以上故障現(xiàn)象中的一種或多種,基本可以確認(rèn)發(fā)生了網(wǎng)絡(luò)丟包。
三、排查產(chǎn)生丟包現(xiàn)象的PC
排查產(chǎn)生丟包現(xiàn)象的PC本身問題。
如PC的網(wǎng)卡是否正常、PC連接設(shè)備的線纜是否正常都有可能造成設(shè)備丟包。解決方法:斷開網(wǎng)絡(luò)后給PC查殺病毒、檢查網(wǎng)線重裝操作系統(tǒng)、檢查網(wǎng)卡等。
確認(rèn)PC正常后,如果故障仍然存在,繼續(xù)執(zhí)行下一步。
四、檢查接口物理狀態(tài)是否為Down
一般來說,接口的物理狀態(tài)Down,或接口雙工模式或速率協(xié)商模式與對端不一致,會造成接口的狀態(tài)異常。在設(shè)備上執(zhí)行:
display interface interface-type interface-number命令查看接口運行狀態(tài)是否正常。
這里以檢查Switch_3的GE1/0/2為例。
<HUAWEI> display interface gigabitethernet 1/0/2
GigabitEthernet1/0/2 current state : DOWN //接口當(dāng)前物理狀態(tài)
Line protocol current state : DOWN
Description:
Switch Port, Link-type : access(negotiated),
PVID : 1, TPID : 8100(Hex), The Maximum Frame Length is 9216
IP Sending Frames' Format is PKTFMT_ETHNT_2, Hardware address is 000b-0974-a475
Last physical up time : 2016-08-10 21:09:51 Last physical down time : 2013-08-10 21:10:51
Current system time: 2016-08-10 21:15:06
Port Mode: COMMON FIBER //接口工作模式。COMMON COPPER表示此接口為電接口;COMMON FIBER表示此接口為光接口
Speed : 1000, Loopback: NONE //接口速率、環(huán)回狀態(tài),鏈路兩端需要保持一致
Duplex: FULL, Negotiation: ENABLE //接口雙工模式及自協(xié)商狀態(tài),鏈路兩端需要保持一致
---- More ----
- 輸出信息顯示“current state : UP”,表明接口的運行狀態(tài)正常。請?zhí)^本節(jié),參考下一節(jié)進(jìn)行定位與處理。
- 輸出信息顯示“current state : Administratively down”,表示接口被人為Shutdown。
請在系統(tǒng)視圖下執(zhí)行interface interface-type interface-number進(jìn)入故障接口視圖,然后執(zhí)行display this命令查看接口是否執(zhí)行了shutdown操作,如果是請在接口下執(zhí)行undo shutdown命令。
- 輸出信息顯示“current state : DOWN”,則需要查看接口的協(xié)商狀態(tài)、速率、雙工模式以及網(wǎng)線適應(yīng)方式是否鏈路兩端保持一致。分別在鏈路兩端的設(shè)備執(zhí)行display interface命令查看以上信息,如表8-1所示。
表8-1 檢查鏈路兩端的設(shè)備接口雙工、速率、協(xié)商模式
輸出信息顯示“current state : ERROR DOWN (down-cause)”,表示接口由于錯誤事件而被Shutdown,需要根據(jù)down-cause具體字段信息排查故障。
五、檢查接口入方向是否存在CRC校驗錯誤
檢查報文經(jīng)過的物理端口是否存在CRC校驗錯誤,且錯誤計數(shù)是否在不斷增長。如果輸出信息顯示字段“CRC”有計數(shù),且重復(fù)執(zhí)行命令發(fā)現(xiàn)計數(shù)在不斷增長,說明端口接收到了CRC錯誤報文,即存在CRC校驗錯誤,說明是由于物理鏈路或者設(shè)備問題導(dǎo)致的錯包 。
六、檢查接口出方向是否存在Discard計數(shù)
檢查端口是否存在Discard丟包計數(shù)。
在任意視圖執(zhí)行命令display interface interface-type interface-number,或在接口視圖執(zhí)行命令display this interface,查看設(shè)備連接用戶側(cè)端口出方向報文計數(shù),存在Discard丟包計數(shù)則說明端口曾經(jīng)存在擁塞。在業(yè)務(wù)受到影響時,觀察該Discard是否增加。如果不增加,則業(yè)務(wù)影響與Discard丟包無關(guān)。
七、檢查是否存在環(huán)路
這是最容易造成丟包現(xiàn)象的因素,并且具有比較強的隱蔽性,例如在較大型的網(wǎng)絡(luò)環(huán)境中,管理員很容易把交換機之間的端口連接錯誤,從而引起網(wǎng)絡(luò)環(huán)路,導(dǎo)致丟包。觀察是否出現(xiàn)如下環(huán)路相關(guān)的現(xiàn)象。網(wǎng)絡(luò)出現(xiàn)環(huán)路后,除了產(chǎn)生丟包現(xiàn)象,一般還有如下現(xiàn)象產(chǎn)生:
- 執(zhí)行display interface brief | include up命令,查看所有Up接口下的流量,存在環(huán)路的接口上InUti和OutUti兩個計數(shù)會逐步增加,甚至接近100%,遠(yuǎn)遠(yuǎn)超過業(yè)務(wù)流量。
- 使用display interface命令查看該接口統(tǒng)計信息時,發(fā)現(xiàn)接口收到大量廣播報文。
- 設(shè)備上發(fā)生環(huán)路的VLAN的接口指示燈頻繁閃爍。
- 設(shè)備CPU占用率超過80%