【OpenManage大解密】分鐘級部署千臺服務(wù)器?
記得10年前,我和當(dāng)時(shí)的同事在做服務(wù)器選型測試工作時(shí),就不止一次談到這樣問題——當(dāng)我們使用來自多家(主板/準(zhǔn)系統(tǒng))供應(yīng)商的產(chǎn)品時(shí),就會面臨管理方案不同的問題。
舉個(gè)例子,比如SuperMicro、Intel(EPSD)和Tyan這3家服務(wù)器ODM,在主板的管理上就有著不同的設(shè)計(jì),包括BMC硬件以及與之配合的軟件。那么做為一家OEM廠商,如果只是簡單地組裝銷售,用戶將無法獲得統(tǒng)一的管理體驗(yàn),很難從產(chǎn)品技術(shù)上形成品牌黏性。
至于較大一些的服務(wù)器品牌,為了解決這個(gè)問題會投入相應(yīng)的研發(fā),但只要您使用對比過,就會發(fā)現(xiàn)不同廠商在管理功能方面的差距不小。也就是說,除了硬件的品質(zhì)之外,這也是一個(gè)能夠體現(xiàn)出Dell堅(jiān)持國際領(lǐng)先技術(shù)和讓用戶“最簡單”宗旨的品牌優(yōu)勢的地方。
那么服務(wù)器管理都能做些什么呢?相信不少讀者朋友對此都已經(jīng)熟悉了。本文我們想以戴爾iDRAC生命周期控制器為例,帶大家簡單回顧BMC/IPMI的基本功能,并介紹一下怎么實(shí)現(xiàn)分鐘級部署千臺服務(wù)器,以及“無狀態(tài)服務(wù)器池“對云計(jì)算IaaS的意義。
戴爾iDRAC with Lifecycle Controller被稱為智能嵌入式生命周期管理,它的功能可以分為4個(gè)方面:
部署:(服務(wù)器)發(fā)現(xiàn)/編目,設(shè)置和操作系統(tǒng)部署;
維護(hù):重新分配,修復(fù),更換配件;
監(jiān)控:電源,性能,告警/健康狀況;
更新:BIOS,F(xiàn)irmware和驅(qū)動程序。
根據(jù)我們的理解,基礎(chǔ)的部署、維護(hù)和監(jiān)控功能由硬件來實(shí)現(xiàn);而高級部署功能和更新則通過管理軟件來協(xié)助提供。服務(wù)器按管理方式又可分為帶外(out-of-band)和帶內(nèi)(in-band)兩種,帶內(nèi)管理可以通過安裝在OS中的代理執(zhí)行;而帶外管理則基于下面要介紹的BMC硬件。
上面的照片是在數(shù)年前拍攝于戴爾PowerEdge R910服務(wù)器主板,可以看到一顆NUVOTON(前身為Winbond)BMC底板管理控制器和旁邊的DRAM顯存芯片?,F(xiàn)在主流的服務(wù)器BMC一般集成基本的顯卡功能。
上圖中用紅圈標(biāo)出的部分,是R910服務(wù)器的管理網(wǎng)口,它是以一個(gè)子卡的形式安裝在戴爾專用的NDC網(wǎng)卡上,四路服務(wù)器在設(shè)計(jì)上與雙路有一些不同。BMC/IPMI硬件管理的網(wǎng)口可以共用板載以太網(wǎng)卡,也可采用獨(dú)立設(shè)計(jì)。
現(xiàn)在比較流行的是主板提供單獨(dú)的管理網(wǎng)口,受控于BMC芯片所在的嵌入式系統(tǒng)。這部分電路與主板上其它單元相獨(dú)立,只要+5Vsb/+3.3Vsb電源供應(yīng)正常、管理網(wǎng)絡(luò)/串口連通,哪怕CPU、內(nèi)存等損壞都可以進(jìn)行iDRAC帶外管理操作。
這兩個(gè)截圖也是來自當(dāng)年Dell R910上的iDRAC6
如上圖,除了遠(yuǎn)程開關(guān)機(jī)、重新啟動等之外,iDRAC的一大基本功能就是遠(yuǎn)程控制,或者說KVM(鍵盤、鼠標(biāo)、顯示輸出)重定向。由于在操作系統(tǒng)完成安裝之前,通常無法使用遠(yuǎn)程桌面這樣的工具,因此KVM更多是用在系統(tǒng)配置、OS安裝的階段。
就像當(dāng)年我的一位朋友指著PowerEdge R710的管理網(wǎng)口說:“插根網(wǎng)線,不用接顯示器就能裝系統(tǒng)了。”這時(shí)可能還需要本地光驅(qū),如果支持vMedia(虛擬介質(zhì))則會更方便。
有些用戶在網(wǎng)絡(luò)環(huán)境中有PXE引導(dǎo)服務(wù)器,并通過FTP/NFS將操作系統(tǒng)安裝介質(zhì)映射給待安裝的服務(wù)器。不過在簡單環(huán)境中,使用USB重定向技術(shù)的虛擬介質(zhì)用起來更加方便。如上圖,除了物理光驅(qū)/軟驅(qū)之外,我們還可以將客戶端的ISO鏡像映射為服務(wù)器上的“光盤”。
注:虛擬介質(zhì)功能需要iDRAC Enterprise版本的License,相對基礎(chǔ)的iDRAC Express不提供支持。
以上功能主要涉及操作系統(tǒng)部署,以及在此之前的單機(jī)設(shè)置。當(dāng)年我還測過有的IPMI遠(yuǎn)程管理卡,提供類似的功能動輒要上千元,而現(xiàn)在服務(wù)器嵌入的高級管理特性已經(jīng)不只于此。下面我們重點(diǎn)介紹一個(gè)——批量配置服務(wù)器來進(jìn)一步提高部署效率。
讓我們來看看iDRAC8的自動化服務(wù)器配置是怎么工作的。如上圖中的5個(gè)步驟:配置、采集、克隆、重新分配和維護(hù)基準(zhǔn)。在服務(wù)器配置文件中,包括BIOS、PERC(PowerEdge RAID卡)、網(wǎng)卡/HBA和iDRAC/生命周期控制器的設(shè)置。
此外它還有多種使用模式,可以整合到已有的進(jìn)程中,使用U盤對現(xiàn)場對服務(wù)器“應(yīng)用配置”,或者在網(wǎng)絡(luò)設(shè)置中應(yīng)用。使用OpenManage Essentials軟件來采集、設(shè)置和檢測配置的一到多漂移。
帶有生命周期控制器的iDRAC嵌入式服務(wù)器自動化特性,宣稱分鐘級部署數(shù)千臺服務(wù)器(應(yīng)該是理想情況下)。對于一臺尚未配置管理IP和權(quán)限的戴爾13G服務(wù)器而言,只需要標(biāo)準(zhǔn)的網(wǎng)絡(luò)資源——DHCP服務(wù)器和標(biāo)準(zhǔn)網(wǎng)絡(luò)共享,然后上架、連線即可。
我們再看一下自動設(shè)置的工作流:
1. iDRAC發(fā)送DHCP請求到DHCP服務(wù)器;
2. DHCP服務(wù)器響應(yīng)(給出)IP地址以及選擇字段;
3. iDRAC檢查選擇字段并恢復(fù)來自遠(yuǎn)程共享的服務(wù)器配置文件;
4. iDRAC應(yīng)用配置文件到服務(wù)器,根據(jù)變化的需要服務(wù)器可能會重啟。