自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

網(wǎng)站運維之道 監(jiān)控與報警機制

運維 系統(tǒng)運維
多數(shù)網(wǎng)站都會傾向于利用開源軟件自行搭建監(jiān)控平臺。筆者一向認為,即使網(wǎng)站只有一臺服務(wù)器,也應(yīng)該搭建監(jiān)控工具,這是保障網(wǎng)站能持續(xù)改進的基石。有些公司的運維團隊喜歡自己寫監(jiān)控工具而不是利用已有的第三方開源工具。這種重復(fù)發(fā)明輪子的做法筆者認為是不可取的。

51CTO編輯注:本文是馮大輝(Fenng)的一個系列博文,《網(wǎng)站運維之道》。本文是系列的第二篇。

監(jiān)控機制

定義了網(wǎng)站可用性指標,如何獲取網(wǎng)站的可用值? 監(jiān)控工具該粉墨登場了。

多數(shù)網(wǎng)站都會傾向于利用開源軟件自行搭建監(jiān)控平臺。筆者一向認為,即使網(wǎng)站有一臺服務(wù)器,也應(yīng)該搭建監(jiān)控工具,這是保障網(wǎng)站能持續(xù)改進的基石。常見的開源監(jiān)控工具有Nagios(www.nagios.org)、monit(www.tildeslash.com/monit)等。Nagios也可能是當前國內(nèi)最被廣泛采用的監(jiān)控軟件了,根據(jù)官方描述,Nagios 是開源的主機、網(wǎng)絡(luò)、服務(wù)監(jiān)控程序,從這個描述能看出,Nagios 的設(shè)計目標是很龐大的。依賴其強大的擴展性,通過分布式監(jiān)控模式,管理上千臺甚至更多的服務(wù)器也不在話下。而對于大型集群環(huán)境,Ganglia (http://ganglia.info/) 是個不錯的選擇。

另外商業(yè)化運作的比較好的開源監(jiān)控工具或框架還有 Zenoss (http://www.zenoss.com/)、Zabbix (http://www.zabbix.com/)、Hyperic (http://www.hyperic.com/)、 OpenNMS(http://opennms.org/) 等。這幾個的定位都是"企業(yè)級"監(jiān)控平臺。當然,功能的確不比 Nagios 差,也有的彌補了 Nagios 的一些不足之處(比如 Zenoss 增強了對 Windows 服務(wù)器的監(jiān)控能力)。但出于種種原因,在國內(nèi)的流行程度并不廣泛。

Nagios_distributed.png
(圖2: Nagios 分布監(jiān)控示意圖
圖片來源: http://images.51cto.com/files/uploadimg/20100812/1729110.png)

如果要滿足日趨靈活的 Web 監(jiān)控需要就不得不提 Nagios 靈活的插件機制,最簡單只需要幾行 Shell 代碼就能實現(xiàn)基本的插件功能。多數(shù)情況下,腳本捕獲系統(tǒng)日志中的特定事件,通過 NSCA Client 發(fā)送給中心監(jiān)控服務(wù)器即可。靈活性是衡量監(jiān)控軟件的一個重要標準,從這一點說,多數(shù)傳統(tǒng)的商業(yè)網(wǎng)管軟件怕是都不如 Nagios 這樣勝任現(xiàn)在日趨復(fù)雜的網(wǎng)站環(huán)境。

提到網(wǎng)管監(jiān)控,必然要談到 SNMP??缙脚_或者針對專有設(shè)備的監(jiān)控離不開SNMP,但有的時候 SNMP 的安全性也的確會帶來嚴重問題。這就需要運維團隊中的安全專家對監(jiān)控系統(tǒng)機制的安全性做整體評估,或是提升運維團隊的安全意識以避免在監(jiān)控過程中引入更多的安全問題。

有些公司的運維團隊喜歡自己寫監(jiān)控工具而不是利用已有的第三方開源工具。這種重復(fù)發(fā)明輪子的做法筆者認為是不可取的。這樣做最明顯的一個缺點是軟件本身的維護成本可能會更高,而且團隊人員變動的時候后續(xù)代碼維護也是個潛在的問題。至于商業(yè)工具的選擇,這里不作評價。

報警機制

光有監(jiān)控而報警機制跟不上,不能及時把緊急情況下的信息傳遞給運維技術(shù)人員,那么監(jiān)控形同虛設(shè)?,F(xiàn)在報警信息發(fā)送途徑主要有郵件、IM、SMS 三種(過去書籍中提到的傳呼方式已是明日黃花)。

這幾個途徑中,郵件告警可能是最簡單的,實現(xiàn)起來容易,一行命令即可做到,但因為郵件本身的異步屬性和郵件服務(wù)器的延時問題,很難讓運維人員及時得知信息。所以,如果比較嚴重的告警信息必須考慮其它實時性比較高的方法。至于發(fā)送到 IM,如果 IM 是支持 Jabber 的,實現(xiàn)起來并不難,可靠性也會有一定保障,而如果 IM 比較封閉,那么可行性就不大了,除非 IM 公司對你開放 API ,否則任何取巧的技巧來發(fā)送消息的方法其可信賴性都不強、SMS 是大家都比較傾向的一種方式,只是有很多人不知道具體如何實現(xiàn),說白了也就是一層窗戶紙。如果有電信服務(wù)提供商(SP)能夠提供基于 Web 的調(diào)用接口給你,那么直接利用 Wget 或是 cURL 工具模擬瀏覽器處理表單信息即可,幾行命令即可搞定。如果不具備這樣的條件,不妨考慮一下短信 Modem,現(xiàn)在市場上這樣的短信 Modem 很多,價格不貴,大多都提供二次開發(fā)的功能,簡單的寫點腳本即可實現(xiàn)目的。至于網(wǎng)上有人推薦的免費短信服務(wù),因為實時性比較差,筆者是不推薦的。天下沒有免費的午餐,這樣的服務(wù)往往信息發(fā)送優(yōu)先級很低,而且,短信到達率很難保障。

值得一提的是,報警服務(wù)器本身也需要監(jiān)控的。建議定期發(fā)送測試郵件、測試短信來驗證告警功能處于正常狀態(tài)。尤其是在節(jié)假日來臨前更要反復(fù)確保該功能是正??捎玫?。

原文:http://www.dbanotes.net/web/web_operations_monitoring_and_alert.html

【網(wǎng)站運維之道全系列】

  1. 網(wǎng)站運維之道 關(guān)于可用性
  2. 網(wǎng)站運維之道 監(jiān)控與報警機制
  3. 網(wǎng)站運維之道 之容量規(guī)劃
  4. 網(wǎng)站運維之道 之流程規(guī)范
  5. 網(wǎng)站運維之道 之知識管理與積累
  6. 網(wǎng)站運維之道 之自動化管理
責任編輯:yangsai 來源: dbanotes.net
相關(guān)推薦

2010-08-12 17:36:58

網(wǎng)站運維知識管理

2010-08-12 17:34:19

網(wǎng)站運維流程規(guī)范

2010-08-12 17:22:06

網(wǎng)站運維可用性

2010-08-12 17:29:39

網(wǎng)站運維容量規(guī)劃

2009-09-28 10:49:13

ITIL摩卡

2010-08-12 17:39:07

網(wǎng)站運維自動化管理

2019-09-05 10:23:34

運維監(jiān)控技術(shù)

2019-10-17 10:15:04

運維監(jiān)控報警

2011-03-21 14:43:42

2009-07-01 09:54:00

運維管理網(wǎng)絡(luò)監(jiān)控變革

2019-03-19 08:41:38

Linux運維變更

2014-09-28 10:42:56

運維

2014-05-28 14:45:00

運維移動數(shù)據(jù)

2020-12-30 08:09:46

運維Prometheus 監(jiān)控

2011-03-25 13:54:00

Nagios

2010-07-09 12:09:34

IT運維Mocha BSM摩卡軟件

2010-01-22 16:08:11

IT運維管理

2009-03-18 10:00:27

電子政務(wù)運維管理廣通信達

2013-04-12 13:30:47

點贊
收藏

51CTO技術(shù)棧公眾號