自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

最常見網(wǎng)絡(luò)和用戶體驗(yàn)問題的根本原因分析

運(yùn)維 網(wǎng)絡(luò)運(yùn)維
當(dāng)數(shù)據(jù)速率增加到100G時(shí),故障診斷網(wǎng)絡(luò)問題變得越來越關(guān)鍵。為了成功識(shí)別和補(bǔ)救影響服務(wù)的問題,并降低MTTR(平均解決時(shí)間),ITOps需要實(shí)時(shí)監(jiān)控各種指標(biāo)和數(shù)據(jù)源,包括數(shù)據(jù)包數(shù)據(jù)。

 網(wǎng)絡(luò)基礎(chǔ)設(shè)施故障排除是一個(gè)多層次的過程--從模糊的 "有問題 "到具體問題的根本原因分析。這個(gè)過程越規(guī)范,對網(wǎng)絡(luò)行為和影響終端用戶的問題之間的相關(guān)性理解得越透徹,問題就能越快地得到解決或交給適當(dāng)?shù)膱F(tuán)隊(duì)進(jìn)行補(bǔ)救。

這個(gè)過程中常年面臨的挑戰(zhàn)是,用戶投訴通常是模糊的。用戶(無論是員工、客戶,甚至是對網(wǎng)絡(luò)條件敏感的算法)通常會(huì)遇到三種情況:"我無法連接"、"網(wǎng)絡(luò)太慢 "或 "我的語音/視頻通話質(zhì)量不好"。由于每一種情況都可能是由多個(gè)潛在問題引起的,因此IT團(tuán)隊(duì)往往難以縮小事情的范圍。例如,網(wǎng)絡(luò)速度慢可能是由網(wǎng)絡(luò)、應(yīng)用程序或協(xié)議延遲引起的,其中每一個(gè)都可能通過任何一個(gè)不同的指標(biāo)顯示出來。但對于沮喪的終端用戶來說,這一切看起來都是一樣的--而且很多東西可能會(huì)在轉(zhuǎn)換中丟失。

為了找到根本原因并加快問題的解決,IT團(tuán)隊(duì)不僅需要正確的工具來評估網(wǎng)絡(luò)指標(biāo),還需要清楚地了解用戶體驗(yàn)、可測量的網(wǎng)絡(luò)行為和潛在網(wǎng)絡(luò)問題之間的相關(guān)性。為了說明這一點(diǎn),讓我們來看看故障排除的過程。

 

第一步:收集相關(guān)指標(biāo)

各組織依靠許多來源和類型的網(wǎng)絡(luò)數(shù)據(jù)來為終端用戶的投訴提供背景。他們的基本需求是建立網(wǎng)絡(luò)監(jiān)控基礎(chǔ)設(shè)施,以便IT能夠訪問數(shù)據(jù)包數(shù)據(jù)、流量數(shù)據(jù)、事件和遙測數(shù)據(jù)以及服務(wù)器KPI。這將為他們提供所需的洞察力,以確定各種場景的根本原因。有一些特定的指標(biāo)與具體問題相關(guān)。對于 "網(wǎng)絡(luò)很慢",相關(guān)指標(biāo)將是單向延遲、往返時(shí)間、Z-Win、DNS或HTTP延遲、吞吐量(Gbps)、每秒數(shù)據(jù)包(PPS)、每秒連接數(shù)(CPS)或并發(fā)連接數(shù)(CC)。對于 "質(zhì)量差",要看抖動(dòng)、序列錯(cuò)誤、重傳和碎片。當(dāng) "連接性 "是問題時(shí),檢查ICMP、HTTP和SYN/ACK錯(cuò)誤。

第二步:縮小問題范圍

一旦IT團(tuán)隊(duì)獲得了所需的數(shù)據(jù),他們就可以開始關(guān)聯(lián)各種網(wǎng)絡(luò)行為,以排除可能的原因,并將實(shí)際問題歸為零。這根據(jù)他們所要解決的投訴而有所不同。

網(wǎng)絡(luò)速度慢--這很可能是由網(wǎng)絡(luò)過載引起的,但也有可能是服務(wù)器太忙或DNS服務(wù)器沒有響應(yīng)。正如討論過的,相關(guān)的指標(biāo)是單向延遲(網(wǎng)絡(luò)問題)、往返時(shí)間或Z-Win(應(yīng)用問題),以及DNS或HTTP延遲(協(xié)議問題)。如果網(wǎng)絡(luò)延遲很高,那么要么是網(wǎng)絡(luò)上的整體流量太大,要么是 "爆棚"。觀察整體性能和吞吐量(Gbps)、每秒數(shù)據(jù)包(PPS)、每秒連接數(shù)(CPS)或并發(fā)連接數(shù)(CC)應(yīng)該有助于確定是哪一種。如果應(yīng)用或協(xié)議延遲是原因,那么可以將問題傳遞給相應(yīng)的團(tuán)隊(duì)來解決。觀察數(shù)據(jù)包和流量數(shù)據(jù)對于排除緩慢網(wǎng)絡(luò)的故障尤為重要。流量數(shù)據(jù)可以識(shí)別每秒的頂級通話者或數(shù)據(jù)包,但它無法判斷網(wǎng)絡(luò)的突發(fā)程度或每秒的連接數(shù)--這需要數(shù)據(jù)包數(shù)據(jù)。

質(zhì)量差--IT應(yīng)該監(jiān)控抖動(dòng)、序列錯(cuò)誤、重傳和碎片,以診斷這些投訴。高比率的抖動(dòng)和序列錯(cuò)誤表明問題出在網(wǎng)絡(luò)流上,而重傳和碎片則表明問題出在數(shù)據(jù)包丟失上。這些問題可能是由路由問題或MTU(最大傳輸單元)碎片配置錯(cuò)誤引起的。

連接性 - 這種投訴可能是由認(rèn)證、授權(quán)或設(shè)備的訪問控制列表中的錯(cuò)誤問題引起的。要弄清楚是哪一種,IT團(tuán)隊(duì)?wèi)?yīng)該首先查看相關(guān)設(shè)備的協(xié)議錯(cuò)誤。接下來,他們應(yīng)該檢查連接錯(cuò)誤,比如查看數(shù)據(jù)包數(shù)據(jù)是否有SYN/SYN ACK錯(cuò)誤,以確保客戶端和服務(wù)器之間的TCP/IP三方握手是完整的。

第三步:找出根本原因

至此,IT部門應(yīng)該已經(jīng)找到了問題的根本原因,可以著手進(jìn)行補(bǔ)救。問題經(jīng)常是網(wǎng)絡(luò)配置錯(cuò)誤,但其他的可能性包括網(wǎng)絡(luò)設(shè)備故障、應(yīng)用程序錯(cuò)誤或bug、DDoS攻擊或某些其他安全事件。但是,如果不能訪問廣泛的網(wǎng)絡(luò)指標(biāo)和數(shù)據(jù)包數(shù)據(jù),IT人員將不得不猜測到底是哪個(gè)問題在起作用。

責(zé)任編輯:華軒 來源: 今日頭條
相關(guān)推薦

2023-10-09 10:43:27

2024-07-10 11:43:28

2009-03-09 08:46:28

聯(lián)想柳傳志虧損

2013-04-17 10:59:17

三網(wǎng)融合網(wǎng)絡(luò)技術(shù)

2009-03-10 13:48:00

IT業(yè)生存壓力

2024-07-29 09:38:47

2020-10-25 11:44:21

1024程序員節(jié)程序員

2018-06-03 08:33:19

Siri蘋果語音助手

2022-10-12 17:42:54

MySQL數(shù)據(jù)表磁盤

2015-07-09 10:01:43

創(chuàng)業(yè)者站長

2023-11-15 17:23:30

測試軟件開發(fā)

2015-10-12 17:17:50

用戶體驗(yàn)設(shè)計(jì)錯(cuò)誤

2019-11-12 16:34:12

網(wǎng)絡(luò)安全軟件技術(shù)

2020-09-09 12:59:26

藍(lán)屏驅(qū)動(dòng)內(nèi)存

2021-04-26 08:00:00

DevSecOps安全開發(fā)

2012-12-18 16:18:06

2018-04-09 11:20:40

數(shù)據(jù)科學(xué)項(xiàng)目數(shù)據(jù)

2018-05-04 06:34:50

中興科技5G網(wǎng)絡(luò)

2009-11-16 17:35:57

2011-12-16 16:02:42

Java
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號