開(kāi)源還是商用?十大云運(yùn)維監(jiān)控工具測(cè)評(píng)告訴你答案
隨著云計(jì)算和互聯(lián)網(wǎng)的高速發(fā)展,大量應(yīng)用需要橫跨不同網(wǎng)絡(luò)終端,并廣泛接入第三方服務(wù)(如支付、登錄、導(dǎo)航等),IT系統(tǒng)架構(gòu)越來(lái)越復(fù)雜。快速迭代的產(chǎn)品需求和良好的用戶(hù)體驗(yàn),需要IT運(yùn)維管理者時(shí)刻保障核心業(yè)務(wù)穩(wěn)定可用,而企業(yè)運(yùn)維中的痛點(diǎn)和難點(diǎn)也急需解決。
1.面向業(yè)務(wù)的運(yùn)維,不但關(guān)心單點(diǎn)IT資源的運(yùn)行狀態(tài),更關(guān)心整個(gè)業(yè)務(wù)系統(tǒng)的健康狀態(tài)
2.如果企業(yè)使用了大量的API和模塊化應(yīng)用,那么關(guān)注每個(gè)接口的性能變化情況和指標(biāo)
3.對(duì)于運(yùn)維主管及企業(yè)管理層來(lái)說(shuō),特別需要上墻的監(jiān)控大屏
4.運(yùn)維需要每周、每月查看報(bào)告趨勢(shì)分析,但傳統(tǒng)運(yùn)維工具數(shù)據(jù)導(dǎo)出困難
5.需要第一時(shí)間轉(zhuǎn)雀和快速發(fā)現(xiàn)故障節(jié)點(diǎn),減少業(yè)務(wù)中斷帶來(lái)的損失
本文對(duì)業(yè)內(nèi)主流的開(kāi)源運(yùn)維監(jiān)控系統(tǒng)和商業(yè)運(yùn)維監(jiān)控系統(tǒng)進(jìn)行對(duì)比,分析各種產(chǎn)品的定位、目標(biāo)用戶(hù)和功能特點(diǎn),希望幫助廣大運(yùn)維、開(kāi)發(fā)和創(chuàng)業(yè)者找到最適合自己的運(yùn)維工具。
一、開(kāi)源運(yùn)維監(jiān)控產(chǎn)品篇
(一)Zabbix
推薦星級(jí):★★★★★
Zabbix是一個(gè)基于Web界面的提供分布式系統(tǒng)監(jiān)控以及網(wǎng)絡(luò)監(jiān)控功能的企業(yè)級(jí)開(kāi)源運(yùn)維平臺(tái),也是目前國(guó)內(nèi)互聯(lián)網(wǎng)用戶(hù)中使用最廣的監(jiān)控軟件,云智慧遇到的85%以上用戶(hù)在使用Zabbix做監(jiān)控解決方案。
入門(mén)容易、上手簡(jiǎn)單、功能強(qiáng)大并且開(kāi)源免費(fèi)是云智慧對(duì)Zabbix的最直觀評(píng)價(jià)。Zabbix易于管理和配置,能生成比較漂亮的數(shù)據(jù)圖,其自動(dòng)發(fā)現(xiàn)功能大大減輕日常管理的工作量,豐富的數(shù)據(jù)采集方式和API接口可以讓用戶(hù)靈活進(jìn)行數(shù)據(jù)采集,而分布式系統(tǒng)架構(gòu)可以支持監(jiān)控更多的設(shè)備。理論上,通過(guò)Zabbix 提供的插件式架構(gòu),可以滿(mǎn)足企業(yè)的任何需求。
用戶(hù)群:85%以上的泛互聯(lián)網(wǎng)企業(yè)。
優(yōu)點(diǎn):
1.支持多平臺(tái)的企業(yè)級(jí)分布式開(kāi)源監(jiān)控軟件。
2.安裝部署簡(jiǎn)單,多種數(shù)據(jù)采集插件靈活集成。
3.功能強(qiáng)大,可實(shí)現(xiàn)復(fù)雜多條件告警。
4.自帶畫(huà)圖功能,得到的數(shù)據(jù)可以繪成圖形。
5.提供多種API接口,支持調(diào)用腳本。
6.出現(xiàn)問(wèn)題時(shí)可自動(dòng)遠(yuǎn)程執(zhí)行命令(需對(duì)agent設(shè)置執(zhí)行權(quán)限)。
缺點(diǎn):
1.項(xiàng)目批量修改不方便。
2.社區(qū)雖然成熟,但是中文資料相對(duì)較少,服務(wù)支持有限。
3.入門(mén)容易,能實(shí)現(xiàn)基礎(chǔ)的監(jiān)控,但是深層次需求需要非常熟悉Zabbix并進(jìn)行大量的二次定制開(kāi)發(fā),難度較大。
4.系統(tǒng)級(jí)別報(bào)警設(shè)置相對(duì)比較多,如果不篩選的話(huà)報(bào)警郵件會(huì)很多;并且自定義的項(xiàng)目報(bào)警需要自己設(shè)置,過(guò)程比較繁瑣。
5.缺少數(shù)據(jù)匯總功能,如無(wú)法查看一組服務(wù)器平均值,需進(jìn)行二次開(kāi)發(fā)。
6.數(shù)據(jù)報(bào)表需要特殊二次開(kāi)發(fā)定義。
(二)Nagios
推薦星級(jí):★★★★☆
Nagios 是一款開(kāi)源的企業(yè)級(jí)監(jiān)控系統(tǒng),能夠?qū)崿F(xiàn)對(duì)系統(tǒng)CPU、磁盤(pán)、網(wǎng)絡(luò)等方面參數(shù)的基本系統(tǒng)監(jiān)控,以及SMTP,POP3,HTTP,NNTP等各種基本的服務(wù)類(lèi)型。另外通過(guò)安裝插件和編寫(xiě)監(jiān)控腳本,用戶(hù)可以實(shí)現(xiàn)應(yīng)用監(jiān)控,并針對(duì)大量的監(jiān)控主機(jī)和多個(gè)對(duì)象部署層次化監(jiān)控架構(gòu)。
Nagios最大的特點(diǎn)是其強(qiáng)大的管理中心,盡管其功能是監(jiān)控服務(wù)和主機(jī)的,但Nagios自身并不包括這部分功能代碼,所有的監(jiān)控、告警功能都是由相關(guān)插件完成的。
用戶(hù)群:適合復(fù)雜IT環(huán)境的企業(yè)
優(yōu)點(diǎn):
1.出錯(cuò)的服務(wù)器、應(yīng)用和設(shè)備會(huì)自動(dòng)重啟,自動(dòng)日志滾動(dòng)。
2.配置靈活,可以自定義shell腳本,通過(guò)分布式監(jiān)控模式。
3.支持以冗余方式進(jìn)行主機(jī)監(jiān)控,報(bào)警設(shè)置多樣。
4.命令重新加載配置文件無(wú)需打擾Nagios的運(yùn)行。
缺點(diǎn):
1.事件控制臺(tái)功能很弱,插件易用性差。
2.對(duì)性能、流量等指標(biāo)的處理不給力。
3.看不到歷史數(shù)據(jù),只能看到報(bào)警事件,很難追查故障原因。
4.配置復(fù)雜,初學(xué)者投入的時(shí)間、精力和成本比較大。
#p#
?。ㄈ〨anglia
推薦星級(jí):★★★★☆
Ganglia是加州大學(xué)伯克利分校發(fā)起的一個(gè)開(kāi)源集群監(jiān)控項(xiàng)目,設(shè)計(jì)之初是用于監(jiān)控?cái)?shù)以千計(jì)的網(wǎng)絡(luò)節(jié)點(diǎn)。Ganglia是一個(gè)跨平臺(tái)可擴(kuò)展的,高性能計(jì)算系統(tǒng)下的分布式監(jiān)控系統(tǒng)。它已被廣泛移植到各種操作系統(tǒng)和處理器架構(gòu)上。
用戶(hù)群:適用于大型服務(wù)器集群用戶(hù)。
優(yōu)點(diǎn):
1.適合監(jiān)控系統(tǒng)性能,通過(guò)曲線(xiàn)很容易見(jiàn)到每個(gè)節(jié)點(diǎn)的工作狀態(tài)。
2.可以自定義監(jiān)控項(xiàng),監(jiān)控展示有表格和圖像兩種,支持手機(jī)版。
3.部署方便,通過(guò)不同的分層管理上萬(wàn)臺(tái)機(jī)器,無(wú)需逐個(gè)添加配置。
缺點(diǎn):
1.沒(méi)有內(nèi)置的消息通知系統(tǒng)。
2.沒(méi)有報(bào)警機(jī)制,出現(xiàn)問(wèn)題不能夠及時(shí)報(bào)警。
(四)Zenoss
推薦星級(jí):★★★★☆
Zenoss Core是Zenoss的開(kāi)源版本,其商用版本為Zenoss Enterprise。作為企業(yè)級(jí)智能監(jiān)控軟件,Zenoss Core允許IT管理員依靠單一的Web控制臺(tái)來(lái)監(jiān)控網(wǎng)絡(luò)架構(gòu)的狀態(tài)和健康度。Zenoss Core的強(qiáng)大能力來(lái)自于深入的列表與配置管理數(shù)據(jù)庫(kù),以發(fā)現(xiàn)和管理公司IT環(huán)境的各類(lèi)資產(chǎn)。Zenoss同時(shí)提供與CMDB關(guān)聯(lián)的事件和錯(cuò)誤管理系統(tǒng),以協(xié)助提高各類(lèi)事件和提醒的管理效率。
優(yōu)點(diǎn):
1.Zenoss比較出色的地方在于它的Dashboard,可以配置很多portlet。
2.每個(gè)用戶(hù)的界面都是分開(kāi)管理的,自定義dashboard不會(huì)影響其他用戶(hù)。
3.強(qiáng)大監(jiān)控功能支持服務(wù)器、路由交換、防火墻、存儲(chǔ)、數(shù)據(jù)庫(kù)、中間件監(jiān)控。
4.采用基于HBASE的opentsdb存儲(chǔ)任意時(shí)間段的數(shù)據(jù)。
5.將狀態(tài)監(jiān)控,性能監(jiān)控,資源管理,良好的報(bào)告機(jī)制進(jìn)行有機(jī)的整合。
缺點(diǎn):
1.對(duì)資源要求較高,即使只管理少數(shù)幾臺(tái)設(shè)備,也需要消耗大量硬件及內(nèi)存等附加資源。
2.針Windows系統(tǒng),開(kāi)源版只提供SNMP,通過(guò)WMI檢測(cè)CPU,Disk,軟硬件和性能只在收費(fèi)版提供。
(五)Open-falcon
推薦星級(jí):★★★☆☆
Open-falcon是小米運(yùn)維團(tuán)隊(duì)從互聯(lián)網(wǎng)公司的需求出發(fā),根據(jù)多年的運(yùn)維經(jīng)驗(yàn),結(jié)合SRE、SA、DEVS的使用經(jīng)驗(yàn)和反饋,開(kāi)發(fā)的一套面向互聯(lián)網(wǎng)的企業(yè)級(jí)開(kāi)源監(jiān)控產(chǎn)品。
Open-falcon架構(gòu)
用戶(hù)群:目前有幾十家企業(yè)用戶(hù)不同程度使用。
優(yōu)點(diǎn):
1.自動(dòng)發(fā)現(xiàn),支持falcon-agent、snmp、支持用戶(hù)主動(dòng)push、用戶(hù)自定義插件支持。
2.支持每個(gè)周期上億次的數(shù)據(jù)采集、告警判定、歷史數(shù)據(jù)存儲(chǔ)和查詢(xún)。
3.高效的portal、支持策略模板、模板繼承和覆蓋、多種告警方式、支持callback調(diào)用。
4.單機(jī)支撐200萬(wàn)metric的上報(bào)、歸檔、存儲(chǔ)。
5.采用rrdtool的數(shù)據(jù)歸檔策略,秒級(jí)返回上百個(gè)metric一年的歷史數(shù)據(jù)。
6.多維度的數(shù)據(jù)展示,用戶(hù)自定義Screen。
7.通過(guò)各種插件目前支持Linux、Windows、Mysql、Redis、Memache、RabbitMQ和交換機(jī)監(jiān)控。
缺點(diǎn):由于發(fā)布時(shí)間較短,很多基礎(chǔ)的服務(wù)監(jiān)控插件(如Tomcat、apache等)還不支持,很多功能還在不斷完善中,另外由于缺少專(zhuān)門(mén)的支持,雖然有開(kāi)放社區(qū),但是解決問(wèn)題的效率相對(duì)較低。
#p#
二、商用運(yùn)維監(jiān)控系統(tǒng)篇
(一)監(jiān)控寶
推薦星級(jí):★★★★★
監(jiān)控寶是云智慧為用戶(hù)提供IT性能監(jiān)控(IT Performance Monitoring)的SaaS產(chǎn)品,包含網(wǎng)站監(jiān)控、服務(wù)器監(jiān)控、中間件監(jiān)控、數(shù)據(jù)庫(kù)監(jiān)控、應(yīng)用監(jiān)控、API監(jiān)控和頁(yè)面性能監(jiān)控等功能。包含免費(fèi)版、暢享版和企業(yè)版,目前用戶(hù)約40萬(wàn),監(jiān)控寶APP也是國(guó)內(nèi)唯一提供移動(dòng)監(jiān)控服務(wù)的產(chǎn)品。
用戶(hù)群:覆蓋電子商務(wù)、移動(dòng)互聯(lián)網(wǎng)、廣告?zhèn)髅?、在線(xiàn)游戲、教育醫(yī)療等行業(yè)的幾十萬(wàn)用戶(hù),小米、陌陌、高德、用友、金山、途牛、聚美優(yōu)品、陸金所、中國(guó)平安、建行信用卡中心、春雨醫(yī)生、暢游、國(guó)家電網(wǎng)、中國(guó)電信、滴滴打車(chē)、春秋航空、鳳凰網(wǎng)等各行業(yè)領(lǐng)先企業(yè)和中國(guó)互聯(lián)網(wǎng)百?gòu)?qiáng)企業(yè)超過(guò)30%在使用監(jiān)控寶。
優(yōu)點(diǎn):
1.作為國(guó)內(nèi)最早提供基于SaaS服務(wù)的網(wǎng)絡(luò)監(jiān)控平臺(tái),監(jiān)控寶不但為初級(jí)用戶(hù)提供免費(fèi)的標(biāo)準(zhǔn)服務(wù),企業(yè)用戶(hù)還可以按需購(gòu)買(mǎi)所需的監(jiān)控、告警資源,最大限度的節(jié)省企業(yè)運(yùn)維成本。
2.監(jiān)控寶通過(guò)遍布全球的300多個(gè)分布式監(jiān)測(cè)節(jié)點(diǎn),對(duì)網(wǎng)絡(luò)進(jìn)行穩(wěn)定性和可用性的主動(dòng)監(jiān)控和實(shí)時(shí)分析,支持http(https)、ftp、ping、udp、tcp、smtp、traceroute等多種協(xié)議,測(cè)量CDN效果及DNS狀態(tài),全網(wǎng)全地域性能趨勢(shì)分析。
3.實(shí)時(shí)捕捉服務(wù)器深層性能指標(biāo),支持Linux/Unix/Windows系統(tǒng)及云平臺(tái),支持CPU使用率、CPU平均負(fù)載、內(nèi)存使用比例、磁盤(pán)IO、磁盤(pán)空間使用率、網(wǎng)絡(luò)流量和系統(tǒng)進(jìn)程數(shù)統(tǒng)計(jì)等物理指標(biāo)及30多種應(yīng)用服務(wù),云主機(jī)監(jiān)控端一鍵開(kāi)啟,無(wú)需復(fù)雜配置。對(duì)于應(yīng)用服務(wù)的監(jiān)控,監(jiān)控寶已經(jīng)支持常見(jiàn)的應(yīng)用類(lèi)型包括:Apache、Lighttpd、Nginx、Tomcat、IIS、Memcache和Redis,存儲(chǔ)層監(jiān)控支持Hadoop、 MySQL、MongoDB、SQL Server、Oracle的健康狀態(tài)及性能監(jiān)控。
4.監(jiān)控寶是國(guó)內(nèi)目前唯一支持API監(jiān)控的網(wǎng)絡(luò)監(jiān)控產(chǎn)品,通過(guò)API接口調(diào)用模擬用戶(hù)使用過(guò)程,支持對(duì)get、post、put、delete、head、 options六種請(qǐng)求方式進(jìn)行實(shí)時(shí)監(jiān)控;支持JSON、XML、Text、Response Status驗(yàn)證及Postman腳本導(dǎo)入。
5.Docker監(jiān)控也是監(jiān)控寶的獨(dú)家功能,能夠?qū)崟r(shí)監(jiān)控Docker容器的CPU、內(nèi)存、網(wǎng)絡(luò)流量及Swap狀態(tài),讓開(kāi)發(fā)者和運(yùn)維人員在使用Docker時(shí)清晰掌握其資源消耗狀況。
6. 監(jiān)控寶提供頁(yè)面性能管理,基于國(guó)際標(biāo)準(zhǔn)制定頁(yè)面性能指數(shù),識(shí)別加載元素的狀態(tài)及正確性,對(duì)全網(wǎng)全用戶(hù)加載響應(yīng)時(shí)間分析,同時(shí)準(zhǔn)確定位問(wèn)題元素及優(yōu)化建議。
7.及時(shí)有效的告警通知對(duì)運(yùn)維來(lái)說(shuō)至關(guān)重要,監(jiān)控寶可以根據(jù)SLA設(shè)置告警閾值,第一時(shí)間發(fā)送告警通知。監(jiān)控寶覆蓋最全面的告警通知方式:電子郵件、短信、電話(huà)語(yǔ)音、URL回調(diào)通知、App Push等。另外監(jiān)控寶提供分級(jí)告警通知,能夠根據(jù)告警事件的不同等級(jí)將不同的告警推送給不同的人員,支持企業(yè)分層管理!
8.監(jiān)控寶目前對(duì)其Smart Agent進(jìn)行了開(kāi)源,用戶(hù)可以根據(jù)業(yè)務(wù)需求定制化開(kāi)發(fā)Agent,同時(shí)用戶(hù)的數(shù)據(jù)安全得到保障。
9.監(jiān)控寶提供私有化部署解決方案,滿(mǎn)足政企、金融行業(yè)專(zhuān)有網(wǎng)絡(luò)監(jiān)控的需求。
10.來(lái)自Compuware、CA、IBM等企業(yè)IT服務(wù)資深專(zhuān)家,超過(guò)5年的本土化企業(yè)級(jí)SaaS服務(wù)經(jīng)驗(yàn),以及超過(guò)百人的技術(shù)服務(wù)團(tuán)隊(duì),為用戶(hù)提供最佳的服務(wù)保障。
(二)360網(wǎng)站服務(wù)監(jiān)控
推薦星級(jí):★★☆☆☆
360網(wǎng)站服務(wù)監(jiān)控是一款面向廣大站長(zhǎng)的網(wǎng)站監(jiān)控產(chǎn)品,提供免費(fèi)的網(wǎng)站、服務(wù)器監(jiān)控。
用戶(hù)群:個(gè)人站長(zhǎng)
優(yōu)點(diǎn):
1.服務(wù)免費(fèi),支持網(wǎng)站HTTP監(jiān)控、PING監(jiān)控、域名DNS監(jiān)控和服務(wù)器監(jiān)控。
2.提供網(wǎng)站訪(fǎng)問(wèn)全景數(shù)據(jù)和簡(jiǎn)單配置信息。
缺點(diǎn):
1.只支持簡(jiǎn)單的網(wǎng)站和服務(wù)器監(jiān)控,歷史數(shù)據(jù)保留15天,且免費(fèi)監(jiān)控點(diǎn)數(shù)量?jī)H為四個(gè)。
2.最后一次產(chǎn)品更新是2014年9月,目前已停止更新和運(yùn)營(yíng)支持。
(三)阿里云監(jiān)控
推薦星級(jí):★★★★☆
阿里云監(jiān)控是一款免費(fèi)網(wǎng)站監(jiān)控產(chǎn)品,可監(jiān)控站點(diǎn)和服務(wù)器,并提供多種告警方式:短信,旺旺,郵件。
用戶(hù)群:阿里云用戶(hù)
優(yōu)點(diǎn):
1.與阿里云服務(wù)捆綁緊密,允許用戶(hù)自定義數(shù)據(jù)監(jiān)控。
2.阿里云多IDC間內(nèi)網(wǎng)數(shù)據(jù)傳輸,不占用客戶(hù)公網(wǎng)資源。
3.支持對(duì)業(yè)務(wù)數(shù)據(jù)的通用統(tǒng)計(jì),從各個(gè)角度反應(yīng)服務(wù)的運(yùn)行情況。
缺點(diǎn):
1.所有服務(wù)基于阿里云,功能單一,擴(kuò)展性差。
2.功能不夠強(qiáng)大,只能滿(mǎn)足基礎(chǔ)監(jiān)控需求。
(四)百度云觀測(cè)
推薦星級(jí):★★☆☆☆
百度云觀測(cè)是百度推出的一款云服務(wù)產(chǎn)品,類(lèi)似于360云監(jiān)控、阿里云監(jiān)控,主要是為站長(zhǎng)提供免費(fèi)的一站式網(wǎng)站監(jiān)測(cè)、預(yù)警服務(wù),功能覆蓋網(wǎng)站運(yùn)行狀況、安全和訪(fǎng)問(wèn)速度等多個(gè)方面。
用戶(hù)群:個(gè)人站長(zhǎng)
優(yōu)點(diǎn):
1.對(duì)于用戶(hù)每日訪(fǎng)問(wèn)的站點(diǎn)進(jìn)行安全檢測(cè)。
2.國(guó)內(nèi)各大城市云節(jié)點(diǎn)覆蓋,支持CDN、DNS狀態(tài)和主機(jī)監(jiān)控。
缺點(diǎn):
1.需要進(jìn)行網(wǎng)站認(rèn)證。
2.監(jiān)控點(diǎn)少,功能簡(jiǎn)單,只能監(jiān)測(cè)網(wǎng)站狀態(tài),不支持服務(wù)器、應(yīng)用監(jiān)控。
(五)小蜜蜂網(wǎng)站監(jiān)測(cè)
推薦星級(jí):★☆☆☆☆
小蜜蜂網(wǎng)站監(jiān)測(cè)是一款針對(duì)中小企業(yè)需求開(kāi)發(fā)的綜合測(cè)量網(wǎng)站運(yùn)營(yíng)情況線(xiàn)上工具,可以定時(shí)監(jiān)控網(wǎng)站或服務(wù)器器的可用率(Uptime),一旦網(wǎng)站無(wú)法連結(jié)、或是服務(wù)器發(fā)生錯(cuò)誤,即可發(fā)送告警通知。
用戶(hù)群:中小企業(yè)網(wǎng)站管理員
優(yōu)點(diǎn):
1.小蜜蜂通過(guò)探測(cè)節(jié)點(diǎn)和Last Mile兩種模式監(jiān)測(cè)網(wǎng)站可用性,支持多種站點(diǎn)監(jiān)控類(lèi)型和不同的網(wǎng)絡(luò)訪(fǎng)問(wèn)傳輸協(xié)議。
2.提供多樣化監(jiān)控告警設(shè)置,并支持站內(nèi)實(shí)時(shí)告警消息,支持RSS。
缺點(diǎn):
1.只支持基本的網(wǎng)站監(jiān)控,監(jiān)控點(diǎn)不可選,監(jiān)控服務(wù)不穩(wěn)定。
2.網(wǎng)站性能歷史數(shù)據(jù)不夠詳細(xì),且無(wú)法導(dǎo)出。
隨著新技術(shù)的不斷發(fā)展,云服務(wù)已經(jīng)是互聯(lián)網(wǎng)企業(yè)的必須,但是長(zhǎng)期以來(lái)會(huì)存在傳統(tǒng)物理主機(jī)和云主機(jī)、私有云和公有云并存的狀態(tài)。此外,互聯(lián)網(wǎng)企業(yè)的發(fā)展速度非??欤∶?、滴滴出行等很多企業(yè)都是在短短幾年內(nèi)發(fā)展起來(lái)的,因此選擇一款合適的云監(jiān)控產(chǎn)品,伴隨企業(yè)同步成長(zhǎng),是非常必要的。