BMC運(yùn)維管理:IPMI實(shí)現(xiàn)服務(wù)器遠(yuǎn)控制
BMC(Baseboard Management Controller,基板管理控制器)是服務(wù)器硬件的一個(gè)獨(dú)立管理模塊,嵌入在主板中,用于實(shí)現(xiàn)服務(wù)器的監(jiān)控和遠(yuǎn)程管理,BMC可以獨(dú)立于操作系統(tǒng)運(yùn)行.
通過IPMI工具(Intelligent Platform Management Interface,智能平臺(tái)管理接口)實(shí)現(xiàn)對(duì)服務(wù)器的管理、監(jiān)控和診斷,甚至在操作系統(tǒng)崩潰的情況下也能對(duì)設(shè)備進(jìn)行控制。
IPMI和BMC的結(jié)合為服務(wù)器管理提供了可靠的遠(yuǎn)程控制方案,通過IPMI工具可以輕松實(shí)現(xiàn)BMC用戶密碼的重置、網(wǎng)絡(luò)參數(shù)的配置以及服務(wù)器的遠(yuǎn)程開關(guān)機(jī)等操作。這種靈活性特別適用于遠(yuǎn)程辦公或數(shù)據(jù)中心環(huán)境,使服務(wù)器管理變得更高效、更簡(jiǎn)便。
IPMI工具安裝
apt-get install ipmitool #Debian/Ubuntu 系統(tǒng)
yum install ipmitool #CentOS/RHEL 系統(tǒng)
實(shí)操一、使用IPMI重置BMC用戶密碼
IPMI工具可以幫助重置BMC用戶的密碼。首先,需要列出BMC中已存在的用戶,然后重置目標(biāo)用戶的密碼
步驟一、查看BMC用戶列表,此命令列出所有BMC的用戶
ipmitool user list 1
步驟二、重置用戶密碼:
ipmitool user set password <userid> <new_password>
將userid替換為目標(biāo)用戶的ID,new_password替換為新密碼,即可完成密碼重置。
實(shí)操二、使用IPMI配置BMC的靜態(tài)IP
可以通過設(shè)置BMC的網(wǎng)絡(luò)參數(shù),為BMC配置靜態(tài)IP地址,以確保其在網(wǎng)絡(luò)中的固定地址。
傳統(tǒng)方式都是通過bios進(jìn)行設(shè)置,每次開機(jī)都要等很久
ipmitool lan set 1 ipsrc static # 設(shè)置IP為靜態(tài)
ipmitool lan set 1 ipaddr <BMC_IP> # 設(shè)置BMC的IP地址
ipmitool lan set 1 netmask <子網(wǎng)掩碼> # 設(shè)置子網(wǎng)掩碼
ipmitool lan set 1 defgw ipaddr <網(wǎng)關(guān)地址> # 設(shè)置網(wǎng)關(guān)
ipmitool lan print 1 # 查看配置情況
實(shí)操三、IPMI實(shí)現(xiàn)BMC和主機(jī)控制操作
IPMI工具的核心功能之一是通過BMC實(shí)現(xiàn)對(duì)服務(wù)器的遠(yuǎn)程控制。以下是一些常用命令:
- 查看主機(jī)電源狀態(tài):
在實(shí)際管理過程中,可以配置一臺(tái)跳板機(jī),通過如下命令對(duì)機(jī)器批量進(jìn)行開機(jī)等運(yùn)維操作
ipmitool -I lanplus -H <BMC_IP> -U <username> -P <password> power on
-H
:BMC管理IP地址-U
:BMC用戶名-P
:BMC密碼
常見操作
# 查看電源狀態(tài)
ipmitool power status
# 執(zhí)行開機(jī)操作
ipmitool power on
# 執(zhí)行關(guān)機(jī)操作
ipmitool power off
# 硬重啟
ipmitool power reset
# 軟重啟:
ipmitool power soft(類似輕按電源按鈕)
- 重啟BMC
冷重啟會(huì)重新初始化BMC
ipmitool mc reset cold
此命令重啟BMC控制器,但不會(huì)影響主機(jī)操作系統(tǒng)
熱重啟會(huì)重新加載BMC服務(wù),但不會(huì)重新初始化硬件,相當(dāng)于軟重啟
ipmitool mc reset warm
冷重啟:適用于BMC無法響應(yīng)、卡死、或需要重新初始化的情況。
熱重啟:適用于輕微故障、配置修改后或服務(wù)刷新時(shí)使用,影響較小。
實(shí)操四、ipmitool查看服務(wù)器基本信息
# 查看BMC硬件信息,BMC的固件版本、制造商等基本信息
ipmitool mc info
# 查看系統(tǒng)信息,顯示服務(wù)器整體狀態(tài),包括電源狀態(tài)、主板溫度、電池狀態(tài)等
ipmitool chassis status
# 查看所有傳感器的狀態(tài),硬件傳感器的數(shù)據(jù),如CPU溫度、風(fēng)扇轉(zhuǎn)速、電壓等。
傳感器狀態(tài)中出現(xiàn)Non-Recoverable、Critical或Warning標(biāo)識(shí),代表有警告或故障
ipmitool sensor
實(shí)操五、ipmitool實(shí)現(xiàn)問題定位
使用ipmitool可以查看服務(wù)器的系統(tǒng)事件日志(System Event Log, SEL),這些日志記錄了服務(wù)器硬件層的各種事件,例如硬件故障、重啟記錄、電源狀態(tài)等。以下是使用ipmitool查看服務(wù)器事件的常用命令。
查看系統(tǒng)重啟原因
ipmitool chassis restart_cause
查看系統(tǒng)事件日志
ipmitool sel list
此命令列出服務(wù)器的系統(tǒng)事件日志,顯示日志中的每一條事件記錄,通常包括事件時(shí)間戳、事件類型、描述等信息。
常用命令
# 查看系統(tǒng)事件日志
ipmitool sel list
# 查看系統(tǒng)事件日志詳情
# 統(tǒng)計(jì)系統(tǒng)事件日志數(shù)量
ipmitool sel info
# 導(dǎo)出系統(tǒng)事件日志
ipmitool sel save /path/to/sel_log.txt
# 清除系統(tǒng)事件日志
ipmitool sel clear
# 查看系統(tǒng)事件日志事件
ipmitool sel time get