運(yùn)維經(jīng)驗(yàn)分享:當(dāng) Cacti 遭遇大流量
最近在河南項(xiàng)目的幾臺Windows流媒體服務(wù)器流量使用很高,需要監(jiān)控每天的帶寬使用情況,并根據(jù)具體的情況做相應(yīng)的調(diào)整!前期部署監(jiān)控的系統(tǒng)的時(shí)候網(wǎng)絡(luò)流量方面采用Cacti統(tǒng)一監(jiān)控,服務(wù)方面采用Nagios統(tǒng)一監(jiān)控并報(bào)警!實(shí)際的使用過程中,流媒體帶寬很快就超過了100Mb,Cacti出圖方面的信息極為不準(zhǔn)確,Google一番,類似的情況很多,主要反應(yīng)為Snmp 32位的問題,折騰一番后,問題依舊!
從圖片上看,改為In/Out bits(64-bit Counters)后,就直接不出圖了,In/Out bits則出圖,但數(shù)據(jù)完全不對!隨便看下服務(wù)器的帶寬使用,任何時(shí)刻都超過100Mb。
于是繼續(xù)排查,發(fā)現(xiàn)貌似windows系統(tǒng)本身不支持snmp 64bit counters,參考請看這里:
于是改用Nagios直接監(jiān)控網(wǎng)卡的計(jì)數(shù)器數(shù)據(jù):
- [root@bak ~]# /usr/local/nagios/libexec/check_nt -H "ip address" -p 12489 -v COUNTER -l '\Network Interface(Broadcom NetXtreme Gigabit Ethernet)\Bytes Total/sec',"Total_Bytes/s %f" -w 78643200 -c 85196800
- Total_Bytes/s 21052800.000000 | 'Total_Bytes/s %f'=21052800.000000%;78643200.000000;85196800.000000;
發(fā)現(xiàn)數(shù)據(jù)大致正確,(21052800/1024/1024)*8 = 160Mb,于是直接寫入配置文件,使用check_nrpe插件調(diào)用:
- define service{
- use local-service
- host_name ip address
- service_description Network traffic
- check_command check_nt!COUNTER!-l '\\Network Interface(Broadcom NetXtreme Gigabit Ethernet)\\Bytes Total/sec',"Total_Bytes/s %f" -w 78643200 -c 85196800
- notifications_enabled 1 }