自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

Zabbix 如何監(jiān)控服務(wù)器硬件信息?

運(yùn)維 系統(tǒng)運(yùn)維
做為L(zhǎng)inux系統(tǒng)工程師,在服務(wù)器的維護(hù)管理當(dāng)中,除了對(duì)系統(tǒng)進(jìn)行維護(hù)管理之外,最重要的還要對(duì)服務(wù)器的硬件進(jìn)行監(jiān)控,比如服務(wù)器Raid狀態(tài)是否正常(如果Raid卡出問題,會(huì)影響數(shù)據(jù)的讀寫速度),服務(wù)器硬盤是否正常(如果硬盤壞掉,嚴(yán)重的情況會(huì)丟失數(shù)據(jù)),服務(wù)器電源是否有故障等。

做為L(zhǎng)inux系統(tǒng)工程師,在服務(wù)器的維護(hù)管理當(dāng)中,除了對(duì)系統(tǒng)進(jìn)行維護(hù)管理之外,最重要的還要對(duì)服務(wù)器的硬件進(jìn)行監(jiān)控,比如服務(wù)器Raid狀態(tài)是否正常(如果Raid卡出問題,會(huì)影響數(shù)據(jù)的讀寫速度),服務(wù)器硬盤是否正常(如果硬盤壞掉,嚴(yán)重的情況會(huì)丟失數(shù)據(jù)),服務(wù)器電源是否有故障等。除此之外還要對(duì)服務(wù)器的CPU,內(nèi)存,處理器等重要設(shè)備的溫度進(jìn)行監(jiān)控,如果溫度超過服務(wù)器的臨界溫度則進(jìn)行報(bào)警通知。

HP的服務(wù)器在硬件管理方面提供了自己管理工具h(yuǎn)pacucli,通過該工具可以查看HP服務(wù)器的RAID信息,服務(wù)器硬盤等信息。
1)安裝hpacucli工具(下載地址:HP hpacucli管理工具)

 

  1. [root@monitor ~]#rpm -ivh hpacucli-9.40-12.0.x86_64.rpm 

 

2)查看服務(wù)器RAID信息,硬盤是否正常。

  1. [root@monitor~]# hpacucli ctrl all show config 
  2. Smart Array P410i in Slot 0 (Embedded)    (sn: 5001438018042FF0) 
  3.    array A (SAS, Unused Space: 0 MB) 
  4.       logicaldrive 1 (279.4 GB, RAID 1, OK) 
  5.       physicaldrive 1I:1:1 (port 1I:box 1:bay 1, SAS, 300 GB, OK) 
  6.       physicaldrive 1I:1:2 (port 1I:box 1:bay 2, SAS, 300 GB, OK) 

 

3)通過hpacucli ctrl all show config detail命令可以詳細(xì)地查看RAID和硬盤的信息。

  1. [root@monitor ~]# hpacucli ctrl all show config detail 
  2. Smart Array P410i in Slot 0 (Embedded) 
  3.    Bus Interface: PCI 
  4.    Slot: 0 
  5.    Serial Number: 5001438018042FF0 
  6.    Cache Serial Number: PBCDH0CRH1FH62 
  7.    RAID 6 (ADG) Status: Disabled 
  8.    Controller Status: OK 
  9.    Chassis Slot: 
  10.    Hardware Revision: Rev C 
  11.    Firmware Version: 5.14 
  12.    Rebuild Priority: Medium 
  13.    Expand Priority: Medium 
  14.    Surface Scan Delay: 15 secs 
  15.    Monitor and Performance Delay: 60 min 
  16.    Elevator Sort: Enabled 
  17.    Degraded Performance Optimization: Disabled 
  18.    Inconsistency Repair Policy: Disabled 
  19.    Post Prompt Timeout: 0 secs 
  20.    Cache Board Present: True 
  21.    Cache Status: OK 
  22.    Accelerator Ratio: 25% Read / 75% Write 
  23.    Drive Write Cache: Disabled 
  24.    Total Cache Size: 512 MB 
  25.    No-Battery Write Cache: Disabled 
  26.    Cache Backup Power Source: Capacitors 
  27.    Battery/Capacitor Count: 1 
  28.    Battery/Capacitor Status: OK 
  29.    SATA NCQ Supported: True 
  30.    Array: A 
  31.       Interface Type: SAS 
  32.       Unused Space: 0 MB 
  33.       Status: OK 
  34.       Logical Drive: 1 
  35.          Size: 279.4 GB 
  36.          Fault Tolerance: RAID 1 
  37.          Heads: 255 
  38.          Sectors Per Track: 32 
  39.          Cylinders: 65535 
  40.          Stripe Size: 128 KB 
  41.          Status: OK 
  42.          Array Accelerator: Enabled 
  43.          Unique Identifier: 600508B1001034373220202020200002 
  44.          Disk Name: /dev/cciss/c0d0 
  45.          Mount Points: /boot 99 MB 
  46.          Logical Drive Label: A00ADBD9PR7AMU1472     898D 
  47.          Mirror Group 0: 
  48.             physicaldrive 1I:1:1 (port 1I:box 1:bay 1, SAS, 300 GB, OK) 
  49.          Mirror Group 1: 
  50.             physicaldrive 1I:1:2 (port 1I:box 1:bay 2, SAS, 300 GB, OK) 
  51.       physicaldrive 1I:1:1 
  52.          Port: 1I 
  53.          Box: 1 
  54.          Bay: 1 
  55.          Status: OK 
  56.          Drive Type: Data Drive 
  57.          Interface Type: SAS 
  58.          Size: 300 GB 
  59.          Rotational Speed: 10000 
  60.          Firmware Revision: HPD4 
  61.          Serial Number: ECA1PC80GTS31234 
  62.          Model: HP      EG0300FBDSP 
  63.          PHY Count: 2 
  64.          PHY Transfer Rate: 6.0GBPS, Unknown 
  65.       physicaldrive 1I:1:2 
  66.          Port: 1I 
  67.          Box: 1 
  68.          Bay: 2 
  69.          Status: OK 
  70.          Drive Type: Data Drive 
  71.          Interface Type: SAS 
  72.          Size: 300 GB 
  73.          Rotational Speed: 10000 
  74.          Firmware Revision: HPD7 
  75.          Serial Number:         PMX6902D 
  76.          Model: HP      EG0300FBDBR 
  77.          PHY Count: 2 
  78.          PHY Transfer Rate: 6.0GBPS, Unknown 

 

HP官方還有一個(gè)hpasmcli管理工具,可以很詳細(xì)查看服務(wù)器CPU,內(nèi)存,處理器,電源等的溫度信息。

1)安裝hpasmcli工具(下載地址:HP hpasmcli管理工具

 

  1. [root@monitor ~]#rpm -ivh hp-health-9.40-1602.44.rhel6.x86_64.rpm 

 

2)通過工具h(yuǎn)pasmcli可以查看服務(wù)器各部件的溫度信息,其中Temp表示各部件當(dāng)前的溫度,Threshold表示臨界溫度,當(dāng)當(dāng)前溫度超過臨界溫度的時(shí)候就要注意啦。

  1. [root@monitor ~]# hpasmcli -s 'show temp' 
  2. Sensor   Location              Temp       Threshold 
  3. ------   --------              ----       --------- 
  4. #1        AMBIENT              23C/73F    42C/107F 
  5. #2        CPU#1                40C/104F   82C/179F 
  6. #3        CPU#2                40C/104F   82C/179F 
  7. #4        MEMORY_BD            33C/91F    87C/188F 
  8. #5        MEMORY_BD            33C/91F    78C/172F 
  9. #6        MEMORY_BD             -         87C/188F 
  10. #7        MEMORY_BD            32C/89F    78C/172F 
  11. #8        MEMORY_BD            32C/89F    87C/188F 
  12. #9        MEMORY_BD            32C/89F    78C/172F 
  13. #10       MEMORY_BD             -         87C/188F 
  14. #11       MEMORY_BD            32C/89F    78C/172F 
  15. #12       POWER_SUPPLY_BAY     33C/91F    59C/138F 
  16. #13       POWER_SUPPLY_BAY     47C/116F   73C/163F 
  17. #14       MEMORY_BD            29C/84F    72C/161F 
  18. #15       PROCESSOR_ZONE       32C/89F    73C/163F 
  19. #16       PROCESSOR_ZONE       30C/86F    64C/147F 
  20. #17       MEMORY_BD            28C/82F    63C/145F 
  21. #18       PROCESSOR_ZONE       39C/102F   69C/156F 
  22. #19       SYSTEM_BD            35C/95F    69C/156F 
  23. #20       SYSTEM_BD            38C/100F   71C/159F 
  24. #21       SYSTEM_BD            44C/111F   65C/149F 
  25. #22       SYSTEM_BD            45C/113F   71C/159F 
  26. #23       SYSTEM_BD            39C/102F   69C/156F 
  27. #24       SYSTEM_BD            47C/116F   69C/156F 
  28. #25       SYSTEM_BD            35C/95F    63C/145F 
  29. #26       SYSTEM_BD            45C/113F   66C/150F 
  30. #27       SCSI_BACKPLANE_ZONE  35C/95F    60C/140F 
  31. #28       SYSTEM_BD            73C/163F   110C/230F 

 

3)通過hpasmcli -s 'show'查看類似于help的幫助信息,監(jiān)控的時(shí)候要重點(diǎn)關(guān)注 DIMM(內(nèi)存)、FANS(風(fēng)扇)、POWERSUPPLY(電源模塊)、SERVER(系統(tǒng))、CPU、TEMP(溫度)等信息。

  1. [root@monitor ~]# hpasmcli -s 'show' 
  2. Invalid Arguments 
  3.      SHOW ASR 
  4.      SHOW BOOT 
  5.      SHOW DIMM [ SPD ] 
  6.      SHOW F1 
  7.      SHOW FANS 
  8.      SHOW HT 
  9.      SHOW IML 
  10.      SHOW IPL 
  11.      SHOW NAME 
  12.      SHOW PORTMAP 
  13.      SHOW POWERMETER 
  14.      SHOW POWERSUPPLY 
  15.      SHOW PXE 
  16.      SHOW SERIAL [ BIOS | EMBEDDED | VIRTUAL ] 
  17.      SHOW SERVER 
  18.      SHOW TEMP 
  19.      SHOW TPM 
  20.      SHOW UID 
  21.      SHOW WOL 

 

4)hpasmcli幾種常用的例子。

  • 查看內(nèi)存信息:hpasmcli -s 'show dimm'|egrep -i 'module|stat'
  • 查看風(fēng)扇信息:hpasmcli -s 'show fans'
  • 查看硬件溫度:hpasmcli -s 'show temp'
  • 查看電源模塊:hpasmcli -s 'show powersupply'
  • 查看機(jī)器型號(hào),序列號(hào),CPU,內(nèi)存大?。篽pasmcli -s 'show server'

由于各種服務(wù)器的廠商不同,管理工具不同,因此Zabbix對(duì)服務(wù)器硬件方面沒有很詳細(xì),全面的解決方案。之前dl528888寫過zabbix通過omsa工具監(jiān)控DEL服務(wù)器,也是一種很好的思路,我也借鑒過,這里非常感謝。

Zabbix監(jiān)控總結(jié)起來(lái)有兩種思路:第一就是server通過agentd方式獲取數(shù)據(jù),這種方式需要定義UserParameter參數(shù),即KEY。第二就是server通過trapper的方式獲取數(shù)據(jù),即agentd將數(shù)據(jù)主動(dòng)sender給server或者proxy。我這里是通過第二種traper的方式監(jiān)控的。第一種方式server有時(shí)候會(huì)取不到數(shù)據(jù):

  1. became not supported: Received value [] is not suitable for value type [Numeric (unsigned)] and data type [Decimal] 

會(huì)產(chǎn)生上面的錯(cuò)誤。

首先查看我監(jiān)控的腳本,由于是通過traper的思路進(jìn)行監(jiān)控,log_file文件依次定義了要監(jiān)控服務(wù)器的主機(jī)名(hostname),監(jiān)控項(xiàng)key以及監(jiān)控的值。

  1. [root@monitor scripts]# cat hpacuclizabbix.sh 
  2. #!/bin/sh 
  3. #create by sfzhang 20140517 
  4. #This scripts monitoring HP server, such as smart array status,Hardware information and server temperature。 
  5. zabbix_server="*.*.*.*" #IP from Zabbix Server or proxy where data should be send to. 
  6. zabbix_sender="/usr/local/zabbix/bin/zabbix_sender" 
  7. log_file='/tmp/hpacuclizabbix.log' #In the file to define the monitor host, key and value 
  8. hpacucli='/usr/sbin/hpacucli' 
  9. options='ctrl all show config detail' 
  10. hpacucli_log="/tmp/result.log" 
  11. PATH=$PATH:/usr/sbin:/sbin 
  12. ${hpacucli} ${options} > ${hpacucli_log} 
  13. Cache_status=`cat ${hpacucli_log} |awk '/Cache Status:/{print $NF}'` 
  14. Controller_status=`cat ${hpacucli_log} |awk '/Controller Status:/{print $NF}'` 
  15. Battery_capacitor_status=`cat ${hpacucli_log} |awk '/Battery\/Capacitor Status:/{print $NF}'` 
  16. Physicaldrive_status=$(awk -v total=`hpacucli ctrl slot=0 pd all show status |grep physicaldrive |wc -l` -v normal=`hpacucli ctrl slot=0 pd all show status|awk '/physicaldrive/{if($NF=="OK") count+=1}END{print count}'` 'BEGIN{if(total==normal) {print "OK"} else {print "NO"}}') 
  17. Memory_status=$(awk -v total=`hpasmcli -s 'SHOW DIMM'|grep -i 'Status' |wc -l` -v normal=`hpasmcli -s 'SHOW DIMM' |awk '/Status:/{if($NF=="Ok") count+=1}END{print count}'` 'BEGIN{if(total==normal) {print "OK"} else {print "NO"}}') 
  18. Fans_status=$(awk -v total=`hpasmcli -s 'SHOW FANS' |grep "#" |wc -l` -v normal=`hpasmcli -s 'SHOW FANS'  |awk '/#/{if($3=="Yes") count+=1}END{print count}'` 'BEGIN{if(total==normal) {print "OK"} else {print "NO"}}') 
  19. Power_status=$(awk -v total=`hpasmcli -s 'SHOW POWERSUPPLY' |grep "Power supply" |wc -l` -v normal=`hpasmcli -s 'SHOW POWERSUPPLY' |awk '/Condition:/{if ($NF=="Ok") count+=1}END{print count}'` 'BEGIN{if(total==normal) {print "OK"} else {print "NO"}}') 
  20. Processor_status=$(awk -v total=`hpasmcli -s 'SHOW SERVER' |grep "Processor:" |wc -l` -v normal=`hpasmcli -s 'SHOW SERVER' |awk '/Status/{if ($NF=="Ok") count+=1}END{print count}'` 'BEGIN{if(total==normal) {print "OK"} else {print "NO"}}') 
  21. Power_temp_num=$(hpasmcli -s 'SHOW TEMP' |awk '/POWER_SUPPLY_BAY/{print $3}'|awk -F"C" '{print $1}'|awk 'BEGIN {max = 0} {if ($1>max) max=$1 fi} END {print max}') 
  22. Ambient_temp_num=$(hpasmcli -s 'SHOW TEMP' |awk '/AMBIENT/{print $3}'|awk -F"C" '{print $1}') 
  23. Cpu_temp_num=$(hpasmcli -s 'SHOW TEMP' |awk '/CPU/{print $3}'|awk -F"C" '{print $1}' |awk 'BEGIN {max = 0} {if ($1>max) max=$1 fi} END {print max}') 
  24. Memory_temp_num=$(hpasmcli -s 'SHOW TEMP' |awk '/MEMORY_BD/{print $3}'|awk -F"C" '{print $1}' |awk 'BEGIN {max = 0} {if ($1>max) max=$1 fi} END {print max}') 
  25. System_temp_num=$(hpasmcli -s 'SHOW TEMP' |awk '/SYSTEM_BD/{print $3}'|awk -F"C" '{print $1}' |awk 'BEGIN {max = 0} {if ($1>max) max=$1 fi} END {print max}') 
  26. Processor_temp_num=$(hpasmcli -s 'SHOW TEMP' |awk '/PROCESSOR_ZONE/{print $3}'|awk -F"C" '{print $1}' |awk 'BEGIN {max = 0} {if ($1>max) max=$1 fi} END {print max}') 
  27. echo $HOSTNAME hp_smart_array.cache_status $Cache_status >${log_file} 
  28. echo $HOSTNAME hp_smart_array.controller_status $Controller_status >>${log_file} 
  29. echo $HOSTNAME hp_smart_array.battery_capacitor_status $Battery_capacitor_status >>${log_file} 
  30. echo $HOSTNAME hp_hardware.hpysicaldrive_status $Physicaldrive_status >>${log_file} 
  31. echo $HOSTNAME hp_hardware.memory_status  $Memory_status >>${log_file} 
  32. echo $HOSTNAME hp_hardware.fans_status  $Fans_status >>${log_file} 
  33. echo $HOSTNAME hp_hardware.power_status  $Power_status >>${log_file} 
  34. echo $HOSTNAME hp_hardware.processor_status  $Processor_status >>${log_file} 
  35. echo $HOSTNAME hp_power.temp_num $Power_temp_num >> ${log_file} 
  36. echo $HOSTNAME hp_ambient.temp_num $Ambient_temp_num >> ${log_file} 
  37. echo $HOSTNAME hp_cpu.temp_num $Cpu_temp_num >> ${log_file} 
  38. echo $HOSTNAME hp_memory.temp_num $Memory_temp_num >> ${log_file} 
  39. echo $HOSTNAME hp_system.temp_num $System_temp_num >> ${log_file} 
  40. echo $HOSTNAME hp_processor.temp_num $Processor_temp_num >> ${log_file} 
  41. $zabbix_sender -z $zabbix_server -i ${log_file} > /tmp/zabbix.temp 

最后只需開啟crontab,5分鐘運(yùn)行一次。

 

  1. [root@monitor~]echo "*/5 * * * * /etc/zabbix/scripts/hpacuclizabbix.sh"  >>  /var/spool/cron/root 

 

查看zabbix監(jiān)控HP服務(wù)器硬件KEY的定義,數(shù)據(jù)的收集都是通過trapper的方式收集的。

wKiom1N3epvzdPRFAAVmeaGLRi4862.jpg

查看zabbix監(jiān)控HP服務(wù)器硬件triggers定義,其中nodata(600)這個(gè)trigger是為了防止被監(jiān)控端數(shù)據(jù)采集出問題而設(shè)置的,比如crontab不正常,腳本被誤刪除等等。如果server10分鐘之內(nèi)收集不到被監(jiān)控端的數(shù)據(jù)就會(huì)報(bào)警。

wKiom1N3gCiiEhgTAAZuwPbEbdQ699.jpg

在zabbix server lastdata查看zabbix server 通過trapper收到的數(shù)據(jù)。

wKiom1N3fLSAbxImAAN5ZKZqGV8998.jpg

查看被監(jiān)控端服務(wù)器各部件溫度信息。

wKioL1N4DgWjWTSJAAVhVvMUuNE117.jpg

當(dāng)被監(jiān)控端出問題時(shí)Zabbix會(huì)及時(shí)報(bào)警。

wKiom1N3fmWjBHbhAAEj-BDN1PA998.jpg

說(shuō)明:Zabbix監(jiān)控HP服務(wù)器硬件操作方法:

  1)在HP服務(wù)器上面安裝hpacucli和hpasmcli管理工具。

  2)修改hpacuclizabbix.sh腳本的zabbix_server ip地址,指定為自己的server或者proxy的地址,并把該腳本添加到crontab。

  3)導(dǎo)入附件中的模板,Link到要監(jiān)控的主機(jī)上面即可。

  4)如果有其它問題,歡迎多多交流。

責(zé)任編輯:黃丹 來(lái)源: 51CTO博客
相關(guān)推薦

2014-04-29 13:45:44

Zabbix服務(wù)器硬件監(jiān)控

2014-12-29 12:27:43

ZabbixSNMP

2019-06-13 17:15:30

監(jiān)控Linux服務(wù)器

2020-06-07 11:54:34

Linux服務(wù)器命令

2020-10-09 07:00:00

無(wú)服務(wù)器應(yīng)用監(jiān)控架構(gòu)

2011-03-29 15:30:20

Zabbix服務(wù)器

2011-08-09 14:27:16

WindowsServ服務(wù)器ADDS

2011-08-22 12:25:08

nagios

2011-03-23 15:13:08

Nagios監(jiān)控oracle

2010-09-07 14:31:37

服務(wù)器升級(jí)硬件篇

2009-09-17 13:42:48

WSUS服務(wù)器

2010-09-07 09:27:00

服務(wù)器升級(jí)硬件篇CPU

2015-04-07 09:04:23

Monit服務(wù)器監(jiān)控系統(tǒng)

2010-09-08 15:10:15

服務(wù)器升級(jí)硬件篇

2018-09-03 09:22:25

監(jiān)控服務(wù)器性能

2013-01-14 11:34:49

IBMdW

2011-03-23 10:17:26

2011-08-09 14:27:49

服務(wù)器DCADDS

2013-09-23 10:05:40

2020-06-07 16:32:37

服務(wù)器數(shù)據(jù)中心技術(shù)
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)