助力云環(huán)境標(biāo)準(zhǔn)運行:三種能救急的網(wǎng)絡(luò)監(jiān)控工具
譯文云監(jiān)控服務(wù)可以收集提供商的生態(tài)系統(tǒng)里面服務(wù)器、存儲系統(tǒng)及其他服務(wù)的一系列性能數(shù)據(jù)。遺憾的是,這些工具擁有的網(wǎng)絡(luò)監(jiān)控功能常常很有限,這就意味著它們發(fā)現(xiàn)不了你的云環(huán)境中的嚴(yán)重性能問題。為了密切關(guān)注你的網(wǎng)絡(luò),并且發(fā)現(xiàn)潛在問題,應(yīng)該使用成熟可靠的網(wǎng)絡(luò)監(jiān)控工具,以便跟蹤并報告性能方面更深入的數(shù)據(jù)。
網(wǎng)絡(luò)監(jiān)控工具分為三個類別:基本監(jiān)控、可視化及報告以及高級的異常檢測。先進的產(chǎn)品擁有涵蓋多個類別的功能特性。但是如果你關(guān)注可視化或高級的異常檢測和安全,不妨特別留意單個產(chǎn)品中的那些功能特性。
能完成任務(wù)的基本的網(wǎng)絡(luò)監(jiān)控工具
Nagios是一款開源網(wǎng)絡(luò)監(jiān)控工具,它一向以用起來難度大而著稱,不過功能也很全面。它可以捕獲網(wǎng)絡(luò)協(xié)議,監(jiān)控網(wǎng)絡(luò)服務(wù),并且通過短信、電子郵件或執(zhí)行自定義腳本來生成警報。報告模塊詳細(xì)地記載了以往的服務(wù)停運事件以及這些停運事件的應(yīng)對措施。
對于想要Nagios的監(jiān)控功能,但是又不需要管理方面學(xué)習(xí)新知識的那些用戶來說,基于Nagios的第三方實用工具也許是合適的選擇。借助Opsview Ltd.等公司提供的服務(wù),你就能獲得先進的功能特性、服務(wù)支持以及幾種不同的方案:從免費的開源核心方案到企業(yè)級方案,不一而足。后者包括統(tǒng)一儀表板、企業(yè)報告以及多臺分布式主服務(wù)器整合數(shù)據(jù)的功能。
面向IT基礎(chǔ)設(shè)施(包括網(wǎng)絡(luò)監(jiān)控)的另一種開源方案來自Zabbix ISA。借助Zabbix監(jiān)控工具,管理員就能夠收集服務(wù)器和網(wǎng)絡(luò)設(shè)備方面的詳細(xì)的度量指標(biāo)。它提供了可視化功能,可以顯示采用易于評估的格式的大量數(shù)據(jù)。代理能夠?qū)崿F(xiàn)分布式監(jiān)控,并且同時提供了基于代理的監(jiān)控方案和不需要代理的監(jiān)控方案。
分析大量數(shù)據(jù)的可視化工具
網(wǎng)絡(luò)監(jiān)控服務(wù)面臨的挑戰(zhàn)之一在于,它會生成大量的數(shù)據(jù)。報告工具可以對數(shù)據(jù)進行過濾并整合處理。可視化可以整合大量數(shù)據(jù),并且清楚地呈現(xiàn)數(shù)據(jù),從而顯示存在的顯著關(guān)系。
說到可視化,云管理員可以想使用PRGT之類的開源網(wǎng)絡(luò)監(jiān)控工具,這種基于RRDtool而建的工具可用于數(shù)據(jù)日志和應(yīng)用程序繪圖。Paessler為PRTG提供了商業(yè)支持。Cacti是另一種基于RRDtool的可視化工具,可以從AWS Marketplace合作伙伴JumpBox處獲得。Cacti包括一個界面,可以支持圖形模板和多種數(shù)據(jù)采集方法。
提高更高級網(wǎng)絡(luò)監(jiān)控的異常檢測
不過,光靠可視化手法并不總是夠用。網(wǎng)絡(luò)流量中的一些模式比較細(xì)微。比如說,平均流量模式方面的變化可能表明有問題,但是在典型的管理報表和可視化圖表中并不顯示出來。這就需要采用異常檢測手法。異常檢測應(yīng)用軟件可以識別偏離預(yù)期范圍的網(wǎng)絡(luò)行為,從而提供更高級的搶先式監(jiān)控。
異常檢測對需要應(yīng)用程序和網(wǎng)絡(luò)性能一致的服務(wù)來說很重要。成功的營銷活動會給網(wǎng)絡(luò)帶來訪問量激增的情況。即便部署了負(fù)載均衡系統(tǒng),客戶訪問還是有可能存在延遲增加的問題。像Numenta的Grok這些工具就能識別訪問量激增及其他異?,F(xiàn)象。
理想情況下,如果啟用了自動擴展功能,你的應(yīng)用程序就會自動為起用集群添加節(jié)點,從而處理增加的負(fù)載。諸如Grok之類的工具就能識別潛在的性能問題,讓系統(tǒng)管理員能夠手動添加額外的服務(wù)器,或者確保自動擴展機制能夠積極應(yīng)對增加的負(fù)載。