Nagios監(jiān)控全解-web方式
開源監(jiān)控利器nagios實戰(zhàn)全解:
俗話說:工欲善其事,必先利其器.要做好系統(tǒng)管理,使自己的工作更輕松更有效的話,一個好的監(jiān)控工具是必不可少的了.在這里我向大家推薦一款我使用了4年多的、功能強大、可靈活定制的開源監(jiān)控利器---nagios。
首先,我們來看實際工作中需要監(jiān)控的對象有哪些?在這里我總結出2種類型的監(jiān)控對象:網(wǎng)絡服務監(jiān)控及主機資源監(jiān)控。網(wǎng)絡服務監(jiān)控可包括主機存活檢查、web服務監(jiān)控、ftp服務監(jiān)控、數(shù)據(jù)庫服務監(jiān)控、自定義服務監(jiān)控等;主機資源監(jiān)控可包括系統(tǒng)負載、當前ip鏈接數(shù)、磁盤空間使用情況、當前進程數(shù)以及自定義的資源監(jiān)控等。
其次,我們再來看nagios監(jiān)控的表現(xiàn)形式。監(jiān)控的主要目的是當監(jiān)控的對象發(fā)生故障或資源緊張時及時通知相關人員,以便問題得到迅速的處理。追求的效果就是"在老板和客戶發(fā)現(xiàn)問題之前得到及時、有效的通知",假定故障通知來自老板,我想大家都不會很愉快的。Nagios為了方便我們的管理工作,提供了至少3種表現(xiàn)手段:
1、web方式,即通過瀏覽器觀看被監(jiān)控的對象;如正常狀態(tài)下,其狀態(tài)(status)是以藍色填充并顯示一個OK。
2、郵件通知,發(fā)生故障時,到達設定重試次數(shù)和探測間隔時間后發(fā)送郵件給管理員或相關人員,報告問題的大致情況。
3、手機短信,這是非常有用和及時的功能了;晚上熟睡中,再也沒可能看web頁面或查閱郵件,可以一旦發(fā)生故障,手機短信卻能把你隨時喚醒。
一般情況下,這3者是同時進行的:上班時間開個瀏覽器看頁面顯示、打開郵件程序定時收取郵件、手機24小時在線。
***,我們以一個實際場景來展示nagios的強大功能,希望對大家的系統(tǒng)管理工作有所幫助。
場景描述
為了描述問題方便,我們假定有5個服務器要監(jiān)控(web服務器、數(shù)據(jù)庫服務器、郵件服務器、nfs文件共享服務器),需要對幾個服務器的服務進行監(jiān)控,同時監(jiān)控每個服務器的資源使用情況,包括負載情況、磁盤分區(qū)使用情況、總進程數(shù)、當前ip連接數(shù)這個4個項目(當然你也可以自己寫腳本監(jiān)控更多的資源對象)。
這些服務器除了系統(tǒng)管理員而外,還有其他用戶(如程序員)對各自的服務器進行維護;當發(fā)生故障的時候,維護網(wǎng)站的程序員能收到報警郵件和報警短信,而管理數(shù)據(jù)庫管理員則無需收到這些報警,同時維護程序的用戶可以以自己的帳號登陸監(jiān)控服務器,通過web方式察看自己所管服務器的狀態(tài)(只能看自己的而看不到別人管轄服務器的狀態(tài))。
通過上面的描述,我們可以整理出下面內容:
機器名稱角色可查看狀態(tài)及接受報警信息的用戶所需工具
Nagios服務器監(jiān)控端系統(tǒng)管理員(SA)Apache、nagios、nagios plugin、sendmail、perl等
郵件服務器被監(jiān)控端系統(tǒng)管理員、郵件管理員Nrpe、nagios plugin、自定義腳本等
數(shù)據(jù)庫服務器被監(jiān)控端系統(tǒng)管理員、dbaNrpe、nagios plugin、自定義腳本等
Web服務器被監(jiān)控端系統(tǒng)管理員、webmasterNrpe、nagios plugin、自定義腳本等
Nfs共享服務器被監(jiān)控端系統(tǒng)管理員Nrpe、nagios plugin、自定義腳本等
緩存服務器(squid)被監(jiān)控端系統(tǒng)管理員、webmasterNrpe、nagios plugin、自定義腳本等
配置好nagios和被監(jiān)控機器后,其在瀏覽器里的基本輸出與下圖類似:

本節(jié)講述的是:Nagios監(jiān)控的表現(xiàn)形式web方式 下一節(jié):郵件通知
【編輯推薦】