網(wǎng)絡(luò)焦點(diǎn)功能 鷹眼拓?fù)涓鎰e網(wǎng)絡(luò)“誤判”
南非世界杯的大幕已經(jīng)落下,在736名球員和數(shù)十億球迷心中,有兩樣?xùn)|西將讓人久久不能忘懷:一是鬧心的“嗚嗚祖啦”;二是足球世界中永遠(yuǎn)不消失的話題“裁判誤判”。誤判的產(chǎn)生,在生活中、企業(yè)管理中、網(wǎng)絡(luò)運(yùn)維中一樣存在,它可能改變我們?nèi)松能壽E、也可能將附著在網(wǎng)絡(luò)上的業(yè)務(wù)體系陷入萬劫不復(fù)的地獄。
摩卡軟件在最新發(fā)布的Mocha BSM 7.5.0中全面擴(kuò)容了網(wǎng)絡(luò)焦點(diǎn)(Network Focus)功能的技術(shù)覆蓋面,延伸至網(wǎng)絡(luò)中的每個(gè)對(duì)象,不但為網(wǎng)絡(luò)運(yùn)維實(shí)現(xiàn)了7*24小時(shí)的自動(dòng)監(jiān)控部署,更增添了 “故障回放”的特性,如同在網(wǎng)絡(luò)中安插“鷹眼”設(shè)備,全面減少了因?yàn)槭止けO(jiān)控運(yùn)維所帶來的誤判結(jié)果產(chǎn)生。
網(wǎng)絡(luò)運(yùn)維為何也需加入鷹眼功能
本屆世界杯中的英德大戰(zhàn),若是蘭帕德的進(jìn)球沒有被漏判,最后可能也不至于英國(guó)的球門被打成篩子一般。但就是這樣的一個(gè)錯(cuò)誤判罰導(dǎo)致了英格蘭隊(duì)全場(chǎng)被動(dòng),最終以恥辱的比分?jǐn)”被丶?,英格蘭球員四年來的努力也因此化為烏有。如果說,1966年的“幽靈進(jìn)球”成為了世界足球史上一樁永恒的懸案,此次國(guó)際足聯(lián)“禁止在球場(chǎng)大屏幕回放本場(chǎng)比賽錄像” 的決定,倒是真讓人匪夷所思了。如今的科技水平完全可以做到這一點(diǎn),在網(wǎng)球和擊劍運(yùn)動(dòng)中早引入了“鷹眼”技術(shù),這種十分精密的即時(shí)回放系統(tǒng),由8個(gè)或10個(gè)高速攝像頭、4臺(tái)電腦和大屏幕組成,它是保障裁判判罰精確性的得力輔助工具。
在回味世界杯的同時(shí),我們不由得想起了網(wǎng)絡(luò)管理和系統(tǒng)運(yùn)維管理中也大量存在的“誤判”。網(wǎng)絡(luò)故障分為物理故障和邏輯故障,物理故障是網(wǎng)絡(luò)連接出現(xiàn)物理上的損壞(如網(wǎng)線斷或交換機(jī)故障),而邏輯故障單獨(dú)依靠手動(dòng)排除,或者利用ICMP包(Ping命令)的回應(yīng)數(shù)值斷定是解決不了的。例如,業(yè)務(wù)部門的員工反映業(yè)務(wù)系統(tǒng)響應(yīng)緩慢,IT人員可能會(huì)判定的路線有:服務(wù)器中毒、客戶端程序故障、網(wǎng)絡(luò)擁堵、服務(wù)器負(fù)載過大、中間件連接錯(cuò)誤、數(shù)據(jù)庫優(yōu)化失敗……如果依靠運(yùn)維經(jīng)驗(yàn),我們甚至需要從最底層(物理層)開始往上排查,每條路線都走一遍之后,我們還需要從漫如汪洋的日志中尋找蛛絲馬跡。即使最后成功地消除了故障影響,而第一步操作中就掩藏的主觀誤導(dǎo)也將大量延遲修復(fù)的時(shí)間,因此產(chǎn)生的業(yè)務(wù)系統(tǒng)的停滯對(duì)企業(yè)的影響也極大。
結(jié)合各大生產(chǎn)網(wǎng)絡(luò)和互聯(lián)網(wǎng)企業(yè)的特點(diǎn),以及現(xiàn)階段IT架構(gòu)運(yùn)維的常用功能,摩卡軟件產(chǎn)品總監(jiān)侯軍認(rèn)為:“不同架構(gòu)和行業(yè)的網(wǎng)絡(luò)中運(yùn)維都存在著各種變數(shù),但綜合起來分析,在基于業(yè)務(wù)體系的運(yùn)維管理中,任何一個(gè)網(wǎng)絡(luò)都需要最基本的三種特殊功能支撐,它們是‘全景地圖’、‘放大鏡’和‘回放器’,對(duì)應(yīng)起來就是拓?fù)涔芾?、資源管理和故障分析。對(duì)應(yīng)球場(chǎng)上的鷹眼功能,這三種功能分別可以解決的就是邊裁要覆蓋球場(chǎng)每個(gè)角落、每個(gè)球員實(shí)時(shí)追蹤,出現(xiàn)進(jìn)球和犯規(guī)時(shí)在大屏幕上立即回放?!?/P>
熟悉比賽規(guī)則 當(dāng)好網(wǎng)絡(luò)的“法官”
決賽選擇了英格蘭光頭裁判韋伯最為恰當(dāng),球場(chǎng)上的裁判常稱作“法官”,他們擁有著至高無上的權(quán)力,擁有決定一支球隊(duì)命運(yùn)的權(quán)力。而網(wǎng)絡(luò)中“裁判”要做的第一件事情就是將企業(yè)的業(yè)務(wù)流程熟記于心,同時(shí)要各司其職。在Mocha BSM 7.5.0的Network Focus中,以業(yè)務(wù)主流程為基礎(chǔ),將使用者劃分為:實(shí)施工程師、用戶工程師、用戶主任、用戶領(lǐng)導(dǎo),這四種角色,每個(gè)角色都以從自己的路線圖進(jìn)入到業(yè)務(wù)流程中去,并且四種角色可以通過業(yè)務(wù)視圖清晰的獲取需要的“職能守則”。
在部署Mocha Network Focus之后,將自動(dòng)收集整個(gè)網(wǎng)絡(luò)的全景布局,形成獨(dú)有的管理拓?fù)?。用戶可以在核心、接入、終端面板上點(diǎn)擊“鷹眼按鈕”切換設(shè)備的展現(xiàn)情況,按照路線圖或定位點(diǎn)監(jiān)控追蹤對(duì)象。通過業(yè)務(wù)主體對(duì)象的邏輯拓?fù)鋱D和物理拓?fù)鋱D的對(duì)應(yīng),利用智能的診斷工具和收集工具,包括業(yè)務(wù)對(duì)象的IP分布、CPU等主要監(jiān)控參數(shù),點(diǎn)擊故障面板上“分析”工具即可自動(dòng)分析故障的原因,快速定位故障點(diǎn),并且系統(tǒng)將嘗試自動(dòng)修復(fù)功能。由于采用立體資源展現(xiàn),所有業(yè)務(wù)對(duì)象拓?fù)渲械幕拘畔?、狀態(tài)、快照,物理位置,組結(jié)點(diǎn)信息等等,都可以自動(dòng)關(guān)聯(lián)。另外,Network Focus還增加自動(dòng)告警功能的基礎(chǔ)上,增加了針對(duì)機(jī)房的巡檢功能。通過維護(hù)機(jī)房的巡檢模板配置,實(shí)時(shí)告警平臺(tái)將列出最近20條告警信息,而1周之內(nèi)的設(shè)備告警,NTA(網(wǎng)絡(luò)流量分析)告警、Syslog告警、鏈路告警、IP-MAC告警等都可以進(jìn)行“歷史回放”,形成業(yè)務(wù)體系健康程度的巡檢統(tǒng)計(jì)報(bào)表。
鷹眼將徹底消除“業(yè)務(wù)承載層”的誤判
與幾年前相比,企業(yè)對(duì)IT的需求已經(jīng)截然不同,隨著企業(yè)業(yè)務(wù)的發(fā)展和 IT 基礎(chǔ)設(shè)施的不斷擴(kuò)張,IT 管理正在從側(cè)重資源管理向側(cè)重于業(yè)務(wù)和服務(wù)管理演進(jìn)。相應(yīng)的,IT 監(jiān)控也從資源監(jiān)控向業(yè)務(wù)監(jiān)控轉(zhuǎn)變,因此構(gòu)建一個(gè)強(qiáng)健的 IT 運(yùn)維監(jiān)控管理體系對(duì)企業(yè)信息化的發(fā)展至關(guān)重要。之前我們可能忽視了網(wǎng)絡(luò)之上的邏輯業(yè)務(wù)的管理,如此一來,就造成了網(wǎng)絡(luò)運(yùn)維和業(yè)務(wù)管理之間的脫節(jié)。經(jīng)過幾年來ITIL和BSM(業(yè)務(wù)服務(wù)管理系統(tǒng))概念的普及和認(rèn)可,很多企業(yè)之前對(duì)于網(wǎng)絡(luò)管理方向的“誤判”得到了修正,如今我們定義的BSM目標(biāo)的方向沒有錯(cuò),這是不是意味底層監(jiān)控就不重要了呢?答案是否定的。
我們知道,如果要展現(xiàn)業(yè)務(wù)的健康狀況,那么承載各種業(yè)務(wù)的硬件設(shè)施和服務(wù)軟件產(chǎn)品信息就必須要首先“精準(zhǔn)”,如果這些業(yè)務(wù)承載層的對(duì)象報(bào)警信息產(chǎn)生誤導(dǎo),何談業(yè)務(wù)管理呢?以現(xiàn)在很多企業(yè)中的核心業(yè)務(wù)承載層為例,雙機(jī)熱備(HA)主機(jī)和負(fù)載群集系統(tǒng)的監(jiān)控很少能有IT運(yùn)維工具監(jiān)管起來。Mocha BSM 7.5.0升級(jí)版本可以對(duì)集群性能整體進(jìn)行監(jiān)管,例如:反映集群服務(wù)的總體運(yùn)行狀況、反映心跳線中數(shù)據(jù)檢測(cè)、反映可能出現(xiàn)服務(wù)器切換的響應(yīng)時(shí)間,并根據(jù)指定的邏輯與給定閥值進(jìn)行比較告警等等,這些都是功能的增加,都是業(yè)務(wù)為主體模型開發(fā)的,其中都蘊(yùn)含了綜合資源監(jiān)控,不遺漏任何死角的研發(fā)思路。
通過以上的分析,不難發(fā)現(xiàn),底層的監(jiān)控依然重要,我們?cè)贐SM中倡導(dǎo)的不是要拋棄底層數(shù)據(jù)的監(jiān)控管理,反而應(yīng)對(duì)基礎(chǔ)信息的收集加重砝碼,避免與業(yè)務(wù)信息脫節(jié)造成的誤判,這才不會(huì)導(dǎo)致把業(yè)務(wù)管理建成一個(gè)無法欣賞的“空中花園”。