基于科來(lái)網(wǎng)絡(luò)分析技術(shù)的網(wǎng)銀系統(tǒng)訪問(wèn)緩慢案例
作者:佚名
某銀行用戶反映銀行網(wǎng)銀系統(tǒng)有時(shí)訪問(wèn)較慢,主要現(xiàn)象為打開(kāi)登錄界面需很長(zhǎng)時(shí)間,通過(guò)科來(lái)網(wǎng)絡(luò)分析技術(shù),找出故障的原因。
案例背景
某銀行用戶反映銀行網(wǎng)銀系統(tǒng)有時(shí)訪問(wèn)較慢,主要現(xiàn)象為打開(kāi)登錄界面需很長(zhǎng)時(shí)間,銀行客戶希望能對(duì)網(wǎng)銀系統(tǒng)做一個(gè)全面的分析,找出故障的原因。
網(wǎng)銀系統(tǒng)的網(wǎng)絡(luò)環(huán)境拓?fù)涫疽鈭D如下:
圖 1 網(wǎng)銀系統(tǒng)網(wǎng)絡(luò)拓?fù)鋱D
客戶端訪問(wèn)網(wǎng)銀系統(tǒng)外網(wǎng)地址,然后經(jīng)過(guò)F5負(fù)載均衡設(shè)備轉(zhuǎn)發(fā)數(shù)據(jù),直接訪問(wèn)SSL加密設(shè)備,再通過(guò)SSL設(shè)備轉(zhuǎn)發(fā)給網(wǎng)銀系統(tǒng)WEB服務(wù)器。
本案例選擇在網(wǎng)絡(luò)出口以及SSL加密設(shè)備出口進(jìn)行部署科來(lái)網(wǎng)絡(luò)回溯系統(tǒng)進(jìn)行抓包分析。
案例分析
結(jié)合網(wǎng)銀系統(tǒng)網(wǎng)絡(luò)拓?fù)浼皵?shù)據(jù)的走向,網(wǎng)銀系統(tǒng)訪問(wèn)較慢的原因有以下幾點(diǎn):
·網(wǎng)銀系統(tǒng)訪問(wèn)流量太大,出口鏈路擁塞;
·網(wǎng)絡(luò)響應(yīng)延時(shí)較大;
·網(wǎng)絡(luò)設(shè)備轉(zhuǎn)發(fā)故障;
·網(wǎng)銀服務(wù)器本身響應(yīng)較慢。
1、整體流量分析
對(duì)1小時(shí)內(nèi)網(wǎng)銀系統(tǒng)外網(wǎng)出口流量進(jìn)行統(tǒng)計(jì),總流量為919MB,峰值流量為5Mbps,平均流量為2.2Mbps。
2、網(wǎng)絡(luò)延時(shí)分析
在TCP的連接過(guò)程中,客戶端和服務(wù)器端在網(wǎng)絡(luò)中共傳輸三個(gè)數(shù)據(jù)包,俗稱三次握手,這三個(gè)數(shù)據(jù)包都是小包,沒(méi)有實(shí)際有效數(shù)據(jù)載荷。服務(wù)器端對(duì)客戶端TCP SYN的請(qǐng)求在系統(tǒng)底層響應(yīng),響應(yīng)非??欤擁憫?yīng)同數(shù)據(jù)包在網(wǎng)絡(luò)中傳輸?shù)难舆t比可忽略,同時(shí)由于都是小包,網(wǎng)絡(luò)傳輸延遲非常小,因此在數(shù)據(jù)包分析中可以通過(guò)三次握手?jǐn)?shù)據(jù)包的時(shí)間間隔來(lái)確定網(wǎng)絡(luò)的傳輸延遲。
隨機(jī)選擇系統(tǒng)外網(wǎng)出口多個(gè)完整的TCP會(huì)話,通過(guò)對(duì)TCP三次握手時(shí)間進(jìn)行分析,發(fā)現(xiàn)服務(wù)端在收到客戶端的三次握手時(shí)間基本在50ms左右,這在互聯(lián)網(wǎng)環(huán)境中屬于比較短的延時(shí),說(shuō)明網(wǎng)銀系統(tǒng)內(nèi)部網(wǎng)絡(luò)和互聯(lián)網(wǎng)鏈路延時(shí)都很正常,網(wǎng)絡(luò)延時(shí)并不是造成系統(tǒng)訪問(wèn)緩慢的原因。
3、網(wǎng)銀系統(tǒng)性能分析
對(duì)外網(wǎng)出口流量進(jìn)行分析,重點(diǎn)分析持續(xù)時(shí)間較長(zhǎng)的TCP會(huì)話,發(fā)現(xiàn)部分會(huì)話存在異常。如下圖:
圖 2 TCP交易時(shí)序圖
通過(guò)TCP交易時(shí)序圖可以看出,服務(wù)端在對(duì)客戶端的***個(gè)請(qǐng)求進(jìn)行確認(rèn)后,經(jīng)過(guò)了7秒才發(fā)出了響應(yīng)數(shù)據(jù)包。這段時(shí)間應(yīng)該就是導(dǎo)致客戶端訪問(wèn)網(wǎng)銀系統(tǒng)緩慢的直接原因。
為了確定這個(gè)延遲產(chǎn)生的具體原因,分析SSL加密設(shè)備進(jìn)出數(shù)據(jù),找出相同源IP的TCP會(huì)話數(shù)據(jù)進(jìn)行對(duì)比,發(fā)現(xiàn)在SSL加密設(shè)備出口處同樣出現(xiàn)服務(wù)器端在很長(zhǎng)時(shí)間后才發(fā)出響應(yīng)數(shù)據(jù)。
外網(wǎng)出口出現(xiàn)的故障現(xiàn)象在SSL加密設(shè)備出口同樣存在,證明這段延遲不是在SSL加密設(shè)備之前產(chǎn)生,F(xiàn)5到SSL加密設(shè)備之間的網(wǎng)絡(luò)正常。
進(jìn)一步分析SSL加密設(shè)備和網(wǎng)銀服務(wù)器交互數(shù)據(jù),由于這部分?jǐn)?shù)據(jù)是沒(méi)有進(jìn)行加密傳輸?shù)模虼藷o(wú)法準(zhǔn)確定位到之前分析的同一個(gè)TCP會(huì)話。而通過(guò)對(duì)大量TCP會(huì)話的對(duì)比分析,發(fā)現(xiàn)SSL加密設(shè)備和網(wǎng)銀服務(wù)器之間的數(shù)據(jù)傳輸很快,所有會(huì)話都是在1S之內(nèi)完成,基本不存在響應(yīng)延時(shí)情況。
根據(jù)SSL協(xié)議規(guī)范,服務(wù)端發(fā)送的一個(gè)數(shù)據(jù)報(bào)文應(yīng)該是服務(wù)器數(shù)字證書(shū)等加密通訊的握手報(bào)文,SSL加密通道的建立過(guò)程應(yīng)由SSL加密設(shè)備處理,因此我們基本可以判定由于SSL加密設(shè)備造成了網(wǎng)銀系統(tǒng)訪問(wèn)緩慢的原因。
結(jié)合故障數(shù)據(jù)包分析,可以發(fā)現(xiàn)出現(xiàn)延時(shí)的數(shù)據(jù)包是由SSL加密設(shè)備向客戶端響應(yīng)的Server hello數(shù)據(jù)包,因此更加可以肯定SSL加密設(shè)備就是造成故障的根本原因。
分析結(jié)論
通過(guò)以上信息,我們可以做出如下判斷:
·鏈路流量值不大,流量趨勢(shì)穩(wěn)定,沒(méi)有明顯的遞增或遞減趨勢(shì),監(jiān)控鏈路不存在持續(xù)性擁塞問(wèn)題;
·網(wǎng)銀系統(tǒng)內(nèi)部網(wǎng)絡(luò)正常,網(wǎng)絡(luò)延時(shí)很小;
·網(wǎng)銀系統(tǒng)訪問(wèn)緩慢,應(yīng)該是由于SSL加密設(shè)備和客戶端進(jìn)行密鑰交互時(shí),SSL加密設(shè)備響應(yīng)延遲導(dǎo)致。
責(zé)任編輯:鳶瑋
來(lái)源:
科來(lái)軟件