Linux系統(tǒng)的Nagios網(wǎng)絡(luò)管理模塊的實(shí)現(xiàn)
隨著計(jì)算機(jī)網(wǎng)絡(luò)的普及,網(wǎng)絡(luò)管理已成為信息時代中最重要的問題之一。在現(xiàn)有的技術(shù)條件下,人們希望有一個更加穩(wěn)定可靠的網(wǎng)絡(luò)環(huán)境。計(jì)算機(jī)網(wǎng)絡(luò)管理系統(tǒng)就是應(yīng)這樣的需求而產(chǎn)生的。它對網(wǎng)絡(luò)上的各種設(shè)備進(jìn)行管理,通過監(jiān)視和控制這些設(shè)備,及時地向管理人員報(bào)告網(wǎng)絡(luò)狀態(tài),并且簡化網(wǎng)絡(luò)故障的處理,減少故障造成的損失,提高網(wǎng)絡(luò)的服務(wù)質(zhì)量和效率。面對企業(yè)大大小小的服務(wù)器,單憑某個網(wǎng)管工具或某個人,已經(jīng)不能勝任如此大的工作量同時也無法滿足業(yè)務(wù)緊迫性的要求。各類企業(yè)之間以及企業(yè)內(nèi)部的服務(wù)也越來越普遍,對于企業(yè)管理員的任務(wù)也是隨之更加繁重。即使是一個小公司,在他們所使用的計(jì)算機(jī)系統(tǒng)中,也應(yīng)該包含有不少數(shù)量的,運(yùn)行著許多服務(wù)和軟件包的硬件。大公司則更有成百上千的同類設(shè)施需要管理和運(yùn)行。在管理員不可能及時去注意每一個服務(wù)和軟件的情況下,為了對這些眾多的服務(wù)和軟件進(jìn)行有效的管理。
一般來說,是采取發(fā)生問題后進(jìn)行解決的方法,即基于反應(yīng)的解決方案。但是這種解決方案通常的效率都是非常低的,如果反應(yīng)及時,只需少數(shù)的幾分鐘就可以解決問題,但如果發(fā)現(xiàn)問題晚了,就會浪費(fèi)時間帶來更多損失。比如,察看及時地話,通過日志就可以發(fā)現(xiàn)某個服務(wù)是否運(yùn)行異常,然后解決掉,但如果是在此服務(wù)異常運(yùn)行已經(jīng)很嚴(yán)重時,要恢復(fù)它,不僅困難還會帶來不小的損失。因此,一個完成此類檢測功能的自動化工具對于網(wǎng)絡(luò)管理員就顯得非常重要。Nagios 是一個運(yùn)行于 Linux 系統(tǒng)上的開源網(wǎng)絡(luò)管理監(jiān)測系統(tǒng)。它強(qiáng)大的功能可以實(shí)現(xiàn)對網(wǎng)絡(luò)上的服務(wù)器進(jìn)行全面的監(jiān)控,包括服務(wù)(apache、mysql、ntp、ftp、disk、qmail 和 http 等等)的狀態(tài),服務(wù)器的狀態(tài)。
【編輯推薦】