海量監(jiān)控的現(xiàn)狀及發(fā)展趨勢(shì)研究
【51CTO.com綜合報(bào)道】近十年來(lái),網(wǎng)絡(luò)化和信息化成為各行各業(yè)發(fā)展的趨勢(shì),相應(yīng)的,大大小小的數(shù)據(jù)中心、信息中心如雨后春筍般在全國(guó)各地建立起來(lái),并且規(guī)模越來(lái)越大、應(yīng)用越來(lái)越復(fù)雜。數(shù)據(jù)中心、信息中心的建立初衷,是以業(yè)務(wù)開(kāi)展為主導(dǎo),為實(shí)現(xiàn)智能管理和自動(dòng)辦公提供各種技術(shù)手段,可以說(shuō)它們是為簡(jiǎn)化或方便管理而誕生的。但隨著數(shù)據(jù)中心、信息中心的不斷發(fā)展,它們自身的監(jiān)控管理越來(lái)越受到重視,成為IT部門(mén)工作中不可缺少的一部分。
目前國(guó)內(nèi)網(wǎng)管市場(chǎng)可以簡(jiǎn)單地劃分為三大陣營(yíng)。***大陣營(yíng)是以HP、IBM為代表的國(guó)外四大家,他們網(wǎng)管產(chǎn)品在對(duì)服務(wù)器監(jiān)測(cè)方面,主要是通過(guò)Agent代理監(jiān)測(cè)的方式來(lái)實(shí)現(xiàn)。這類(lèi)產(chǎn)品的性能穩(wěn)定,占據(jù)了金融、電信市場(chǎng)的半壁江山,但四大家產(chǎn)品的高成本也在一定程度上制約了國(guó)內(nèi)網(wǎng)管市場(chǎng)的發(fā)展。第二大陣營(yíng)以本土廠(chǎng)商為代表,包括MXsoft(美信)、游龍、北塔、摩卡、廣通等企業(yè)。這些企業(yè)依靠相對(duì)便宜的二次開(kāi)發(fā)、本土化的技術(shù)支持和服務(wù)獲得越來(lái)越多的市場(chǎng)占有額。同時(shí),隨著客戶(hù)和項(xiàng)目的積累,產(chǎn)品也逐漸趨于成熟。三線(xiàn)陣營(yíng)中,則由全國(guó)近百家不知名的相關(guān)軟件廠(chǎng)商所組成。
與此同時(shí),網(wǎng)絡(luò)監(jiān)控管理則從最早的自帶工具發(fā)展至現(xiàn)在的全面管理系統(tǒng),其架構(gòu)和技術(shù)都發(fā)生了一系列的變化:
1.在架構(gòu)設(shè)計(jì)上,從單套部署的工具集發(fā)展到以服務(wù)器池為基礎(chǔ)的云網(wǎng)管監(jiān)控架構(gòu);
2.在檢測(cè)手段上,從單一的Agent代理監(jiān)測(cè)、SNMP監(jiān)測(cè)發(fā)展到兼容Agent代理監(jiān)測(cè)和各種非代理監(jiān)測(cè);
3.在拓?fù)涔芾眍I(lǐng)域,從基于子網(wǎng)的拓?fù)浼夹g(shù)發(fā)展到自動(dòng)搜索的物理拓?fù)鋱D,再到手工定制的VISIO拓?fù)鋱D,甚至是多種拓?fù)浼夹g(shù)的融合;
4.在運(yùn)用方面,發(fā)展到能夠支持各種操作系統(tǒng)、數(shù)據(jù)庫(kù)、網(wǎng)絡(luò)設(shè)備和中間件,以及各種業(yè)務(wù)應(yīng)用系統(tǒng);
5.在告警方式上,從單一的界面告警發(fā)展到短信、郵件、聲音和顏色等綜合手段的預(yù)告警。
以上技術(shù)分散在不同的廠(chǎng)商和產(chǎn)品中,在實(shí)踐中體現(xiàn)為以下幾種監(jiān)控方式:設(shè)備網(wǎng)管軟件監(jiān)控、通用網(wǎng)管軟件監(jiān)控和云網(wǎng)管監(jiān)控。
網(wǎng)絡(luò)設(shè)備廠(chǎng)商通過(guò)自帶網(wǎng)管軟件進(jìn)行監(jiān)控,比如思科、H3C等設(shè)備廠(chǎng)商都有專(zhuān)用的網(wǎng)管軟件。不過(guò)由于這些廠(chǎng)商的網(wǎng)管軟件只能對(duì)本廠(chǎng)商的設(shè)備進(jìn)行監(jiān)控,不能對(duì)用戶(hù)的所有設(shè)備、網(wǎng)絡(luò)和應(yīng)用系統(tǒng)進(jìn)行全面、統(tǒng)一監(jiān)控,所以在使用中有很大的局限性。
購(gòu)買(mǎi)通用網(wǎng)管軟件進(jìn)行監(jiān)控。傳統(tǒng)的通用網(wǎng)管產(chǎn)品都是以單套部署的原理來(lái)工作。即一套產(chǎn)品只能安裝在一臺(tái)監(jiān)控服務(wù)器上,這種模式有一定的局限性,其監(jiān)控能力和規(guī)模都受限于這臺(tái)監(jiān)控服務(wù)器的性能。當(dāng)被監(jiān)控規(guī)模超過(guò)這臺(tái)服務(wù)器監(jiān)控極限時(shí),用戶(hù)不得不再購(gòu)買(mǎi)一套產(chǎn)品,安裝在另一臺(tái)監(jiān)控服務(wù)器上,對(duì)超出部分的被監(jiān)控對(duì)象行進(jìn)監(jiān)控。同時(shí),還需要對(duì)用戶(hù)、權(quán)限和預(yù)告警數(shù)值等參數(shù)重新設(shè)置。這無(wú)疑會(huì)大大增加人力、物力上的成本。監(jiān)控的目的是為了提高工作效率,多套傳統(tǒng)網(wǎng)管產(chǎn)品的部署在解決問(wèn)題的同時(shí)卻大大增加了對(duì)管理工作的復(fù)雜度。所以傳統(tǒng)網(wǎng)管產(chǎn)品對(duì)于海量監(jiān)控往往力不從心。而目前,有很大一部分的用戶(hù)需要監(jiān)測(cè)的對(duì)象越來(lái)越多,比較典型的是門(mén)戶(hù)網(wǎng)站、網(wǎng)游公司和銀行、電信等的大型企業(yè),動(dòng)輒就要監(jiān)測(cè)上千臺(tái)服務(wù)器。傳統(tǒng)網(wǎng)管軟件已漸漸無(wú)法滿(mǎn)足這類(lèi)大中型規(guī)模企業(yè)的需求了。
在這種背景下,MXsoft(美信)適時(shí)的推出了CreCloud云網(wǎng)管解決方案,CreCloud云網(wǎng)管將云計(jì)算技術(shù)的虛擬化和擴(kuò)容性恰當(dāng)?shù)貞?yīng)用到了海量監(jiān)控的管理實(shí)踐中,***地解決了海量監(jiān)控的各種問(wèn)題。它的工作原理可以簡(jiǎn)單概括為:將多臺(tái)普通監(jiān)控服務(wù)器虛擬為一臺(tái)計(jì)算能力強(qiáng)、運(yùn)行穩(wěn)定的大型監(jiān)控服務(wù)器,幫助用戶(hù)在低成本的情況下,實(shí)現(xiàn)對(duì)海量設(shè)備、網(wǎng)絡(luò)和應(yīng)用系統(tǒng)的監(jiān)控;同時(shí)可根據(jù)被監(jiān)控對(duì)象的規(guī)模大小動(dòng)態(tài)的增減監(jiān)控服務(wù)器。
比如中石油目前有超過(guò)20000個(gè)加油站,總部需要對(duì)各加油站業(yè)務(wù)系統(tǒng)進(jìn)行管理,實(shí)時(shí)監(jiān)控其網(wǎng)絡(luò)狀況、文件系統(tǒng)、日志、CPU利用率、內(nèi)存使用情況、網(wǎng)口流量、系統(tǒng)crash 、重要業(yè)務(wù)系統(tǒng)進(jìn)程、磁盤(pán)空間分配、網(wǎng)絡(luò)流量等等。需要監(jiān)控的設(shè)備數(shù)量達(dá)到10萬(wàn)臺(tái),監(jiān)測(cè)點(diǎn)則近百萬(wàn)。如何解決這一巨大規(guī)模的監(jiān)控問(wèn)題呢?通過(guò)采用CreCloud云網(wǎng)管監(jiān)控方案,不但性能穩(wěn)定,更能應(yīng)對(duì)今后的擴(kuò)容需求。
中石油通過(guò)實(shí)施MXsoft(美信)的CreCloud云網(wǎng)管監(jiān)控方案實(shí)現(xiàn)以下優(yōu)勢(shì):
虛擬化,大大增強(qiáng)平臺(tái)監(jiān)控能力。將多臺(tái)普通監(jiān)控服務(wù)器虛擬為一臺(tái)計(jì)算能力強(qiáng)、運(yùn)行穩(wěn)定的大型監(jiān)控服務(wù)器,或稱(chēng)之為監(jiān)測(cè)云,可以監(jiān)控目前任何規(guī)模的服務(wù)器群。
動(dòng)態(tài)擴(kuò)容,即支持監(jiān)測(cè)服務(wù)器熱插拔。當(dāng)企業(yè)的監(jiān)控規(guī)模增加或減少時(shí),監(jiān)控管理人員只需要?jiǎng)討B(tài)的增加或減少監(jiān)測(cè)服務(wù)器,即可滿(mǎn)足監(jiān)控需求。
自動(dòng)負(fù)載均衡。主控服務(wù)器會(huì)根據(jù)監(jiān)控服務(wù)器的性能自動(dòng)分配任務(wù),而不需要監(jiān)控管理人員手動(dòng)分配;如果監(jiān)測(cè)服務(wù)器中的某一臺(tái)或幾臺(tái)發(fā)生了宕機(jī),其它監(jiān)測(cè)服務(wù)器就自動(dòng)接管它們的任務(wù),保障業(yè)務(wù)7天*24小時(shí)不間斷運(yùn)行。
秒級(jí)輪詢(xún)。云網(wǎng)管海量監(jiān)測(cè)將監(jiān)測(cè)點(diǎn)的顆粒度精確到秒級(jí),以保證監(jiān)測(cè)數(shù)據(jù)的實(shí)時(shí)性和精確性,做到當(dāng)客戶(hù)關(guān)鍵設(shè)備出現(xiàn)異常時(shí)能在***時(shí)間里發(fā)現(xiàn)問(wèn)題,發(fā)出報(bào)警,為客戶(hù)解決問(wèn)題贏得寶貴的時(shí)間。
在目前的網(wǎng)絡(luò)監(jiān)控管理實(shí)踐中,隨著用戶(hù)業(yè)務(wù)的不斷發(fā)展以及數(shù)據(jù)中心建設(shè)的不斷擴(kuò)大,海量監(jiān)控的需求越來(lái)越突出。特別是門(mén)戶(hù)網(wǎng)站、網(wǎng)絡(luò)游戲、電信、銀行和石化等大中型企業(yè),IT業(yè)務(wù)復(fù)雜、系統(tǒng)龐大、設(shè)備繁多,海量監(jiān)控是勢(shì)在必行的趨勢(shì)。
從2000年到現(xiàn)在,國(guó)內(nèi)網(wǎng)絡(luò)監(jiān)控軟件行業(yè)已經(jīng)走過(guò)了10個(gè)年頭。這10年歷程中,國(guó)內(nèi)網(wǎng)管技術(shù)不斷創(chuàng)新,從對(duì)國(guó)外技術(shù)的簡(jiǎn)單模仿到推陳出新,再到國(guó)際領(lǐng)先,國(guó)內(nèi)網(wǎng)管廠(chǎng)商正在變得越來(lái)越成熟。