Nagios監(jiān)控Linux和Unix服務(wù)器-安裝步驟
nagios監(jiān)控Linux和Unix服務(wù)器(ubuntu服務(wù)器安裝實例)
本文講述的是—Nagios監(jiān)控Linux和Unix服務(wù)器:
監(jiān)控原理
3.安裝步驟
配置環(huán)境 ubuntu 8.0
a.前提條件
在Linux服務(wù)器上具有root權(quán)限
允許建立nagios帳號讓遠程訪問
安裝以下包
apt-get install gcc
apt-get install build-essential
apt-get install libssl0.9.8
apt-get install libssl-dev
apt-get install openssl
b.遠程主機配置
創(chuàng)建賬戶nagios并設(shè)定密碼
useradd nagios
password nagios
下載nagios的插件資料,解包安裝
下載
解開nagios plugins的源代碼包
tar xzvf nagios-plugins-1.4.6.tar.gz
cd nagios-plugins-1.4.6
編譯安裝nagios plugins
- ./configura
- make
- make install
改變安裝目錄和文件的用戶和組屬性
- chown nagios.nagios /usr/local/nagios
- chown -R nagios.nagios /usr/local/nagios/libexec
c.安裝NRPE
下載NRPE插件
解壓縮NRPE源代碼
tar -zxvf nrpe-2.8.tar.gz
編譯NRPE
- ./configure
- make all
注意事項: 在ubuntu下面安裝時,需要先確認安裝了openssl libssl0.9.8 libssl-dev
安裝NRPE插件、進程程序和案例進程
- make install-plugin
- make install-daemon
- make install-daemon-config
安裝NRPE到xinet服務(wù)中
- make install-xinetd
編輯/etc/xinetd.d/nrpe 將nagios的服務(wù)器ip添加進去
- only_from= 127.0.0.1
將NRPE進程端口加到/etc/services中
nrpe 5666/tcp
重新啟動xinetd服務(wù)
- service xinetd restart
d. 測試NRPE是否正常
確認nrpe是否在xinetd下運行
- netstat -at |grep nrpe
如果反饋的是以下信息,則表示運行正常。
- tcp 0 0 *:nrpe *:* LISTEN
沒有出現(xiàn)以上信息,則從下面找問題
確認/etc/services中是否添加nrpe的端口描述
在/etc/xinetd.d/nrpe文件中的only_from參數(shù)是否包含了"127.0.0.1"
確認xinetd.d是否安裝和啟動
查看系統(tǒng)日志中涉及xinetd或nrpe的問題,進行修正
確認NRPE進程是否正常運行,利用check_nrpe來做檢測,執(zhí)行指令如下:
- /usr/local/nagios/libexec/check_nrpe -H localhost
正常反饋信息為 NRPE v2.8
e.客制化NRPE指令
編輯/usr/local/nagios/etc/nrpe.cfg
在***的COMMAND部分已經(jīng)定義了部分監(jiān)測的指令,你可以根據(jù)實際情況進行添加修改參數(shù)。
同時,可以用以下指令檢測nrpe調(diào)用nagios插件是否正常
- /usr/local/nagios/libexec/check_nrpe -H localhost -c check_users
- /usr/local/nagios/libexec/check_nrpe -H localhost -c check_load
- /usr/local/nagios/libexec/check_nrpe -H localhost -c check_hda1
- /usr/local/nagios/libexec/check_nrpe -H localhost -c check_total_procs
- /usr/local/nagios/libexec/check_nrpe -H localhost -c check_zombie_procs
f.監(jiān)控服務(wù)器設(shè)置
需要完成內(nèi)容包括
安裝check_nrpe 插件
創(chuàng)建一個Nagios使用check_nrpe插件的指令定義
創(chuàng)佳監(jiān)控遠程主機的Nagios主機和服務(wù)定義
安裝check_nrpe插件步驟
安裝ssl的包
apt-get install libssl-dev
下載nrpe源碼包
解壓縮該包 tar -zxvf nrpe-2.*.tar.gz
- cd nrpe-2.*
- ./configure
- make all
安裝check_nrpe程序到/usr/local/nagiso/libexec/
- make install-plugin
測試與被監(jiān)控主機的nrpe程序的通信狀況
先編輯被監(jiān)控主機的/etc/xinetd.d/nrpe中的only_from的參數(shù)為監(jiān)控服務(wù)器的ip
重新啟動xinetd的服務(wù) service xinetd restart
在監(jiān)控服務(wù)器上,運行 /usr/local/nagios/libexec/check_nrpe -H 被監(jiān)控主機IP
正常反饋信息如下:
NRPE v2.8
如果有問題,用telnet IP地址 5666檢測一下。如果被直接connection closed,則需要查看一下防火墻的規(guī)則和被監(jiān)測主機的nrpe的進程
創(chuàng)建command定義
編輯/usr/local/nagios/etc/objects/commands.cfg增加以下配置信息
- define command{
- command_name check_nrpe
- command_line $USER1$/check_nrpe -H $HOSTADDRESS$ -c $ARG1$
- }
定義主機和服務(wù)設(shè)定
先建立一個模板用于之后的主機監(jiān)控的繼承設(shè)定(在/usr/local/nagios/etc/objects/templates.cfg已經(jīng)有添加了這個模板規(guī)則,只是notification_period不一樣而已,關(guān)于這個的解釋也非常有意思可以自己看看)
- define host{
- name linux-server ; Name of this template
- use generic-host ; Inherit default values
- check_period 24x7
- check_interval 5
- retry_interval 1
- max_check_attempts 10
- check_command check-host-alive
- notification_period 24x7
- notification_interval 30
- notification_options d,r
- contact_groups admins
- register 0 ; DONT REGISTER THIS - ITS A TEMPLATE
- }
編輯/usr/local/nagios/etc/objects/localhost.cfg(也可以自己創(chuàng)建文件,只要在nagios.cfg中添加對應(yīng)配置)
增加被監(jiān)控的主機對象
- define host{
- use linux-server
- host_name web-server ;nrpe check host
- alias ubuntu server (WWW)
- address 192.168.200.244
- }
增加監(jiān)控遠程服務(wù)器的服務(wù)對象
- define service{
- use generic-service
- host_name web-server
- service_description CPU Load
- check_command check_nrpe!check_load
- }
- define service{
- use generic-service
- host_name web-server
- service_description Current Users
- check_command check_nrpe!check_users
- }
磁盤監(jiān)控需要確認自己的硬盤是hda 還是sda,nrpe安裝的默認配置是check_hda1,所以需要你手動修改被監(jiān)控服務(wù)器的/usr/local/nagios/etc/nrpe.cfg,將hda修改為sda。并重新啟動xinetd服務(wù)
- define service{
- use generic-service
- host_name web-server
- service_description /dev/sda1 Free Space
- check_command check_nrpe!check_sda1
- }
- define service{
- use generic-service
- host_name web-server
- service_description Total Processes
- check_command check_nrpe!check_total_procs
- }
- define service{
- use generic-service
- host_name web-server
- service_description Zombie Processes
- check_command check_nrpe!check_zombie_procs
- }
配置完成后,運行/etc/init.d/nagios checkconfig 或
- /usr/local/nagios/bin/nagios -v /usr/local/nagios/etc/nagios.cfg
檢測nagios配置是否正確。
沒有問題,重新啟動nagios服務(wù),則可以通過網(wǎng)頁來查看監(jiān)控結(jié)果了。
【編輯推薦】