DCIM部署的挑戰(zhàn)
本系列文章的前三部分盡管對DCIM供應(yīng)商的承諾、企業(yè)的相關(guān)采購指南和企業(yè)用戶部署DCIM所能帶來的潛在利益進(jìn)行了分析。然而,雖然這一切可能在紙面上看上去很好,但在實(shí)際操作實(shí)施的過程中可能并如供應(yīng)商的銷售團(tuán)隊(duì)所描述的那樣簡單。在現(xiàn)實(shí)情況下,企業(yè)用戶現(xiàn)有的設(shè)施,特別是那些較舊的設(shè)施的能源效率往往較低,也遠(yuǎn)遠(yuǎn)低于能源監(jiān)測水平。在這一部分文章中,我們將為大家介紹一些數(shù)據(jù)中心在改裝操作層面或?qū)⒚媾R的一些挑戰(zhàn),以及將DCIM系統(tǒng)合并到一個(gè)新的數(shù)據(jù)中心設(shè)計(jì)時(shí)的相關(guān)的注意事項(xiàng)。
設(shè)施系統(tǒng)儀器儀表
幾乎所有的數(shù)據(jù)中心都有建筑樓宇管理系統(tǒng)(BMS)來監(jiān)控主要設(shè)備組件的操作運(yùn)行狀況。這些監(jiān)控一般包括電力供應(yīng)鏈及其子系統(tǒng)的公共電力供應(yīng)情況、配電盤、自動(dòng)轉(zhuǎn)換開關(guān)、發(fā)電機(jī)、UPS和下游的配電板。其也會(huì)被連接到冷卻系統(tǒng)組件。然而,在許多情況下,BMS系統(tǒng)所收集的大量數(shù)據(jù)類型并不是細(xì)粒度的。在某些情況下,這些信息往往被局限在非常基本的設(shè)備狀態(tài)信息(開關(guān))和報(bào)警條件。
因此,這些站點(diǎn)往往成為部署DCIM的潛在好處的首要候選。為了讓DCIM系統(tǒng)能夠收集和分析能源使用信息,他們需要遠(yuǎn)程讀取能源電表。不幸的是,某些數(shù)據(jù)中心甚至可能沒有任何實(shí)時(shí)能量消耗計(jì)量儀表,只能根據(jù)每月所消耗的總能量的使用情況來分析。雖然這已經(jīng)是一些數(shù)據(jù)中心站點(diǎn)在過去的事實(shí)上的做法,但這其實(shí)并沒有提供足夠的關(guān)于能源被使用到何處或其設(shè)施效率方面的任何離散數(shù)據(jù)。最近,DCIM(以及一些BMS)系統(tǒng)已被設(shè)計(jì)用于從所有這些系統(tǒng)測量和跟蹤所有更精細(xì)的信息。然而,典型的瓶頸問題是在這些老舊的設(shè)施中缺乏能夠顯示能源消耗情況的電源控制面板或在老舊的冷卻設(shè)備(如CRAC /CRAH或冷水機(jī)組)中缺乏內(nèi)部溫度或其他傳感器(可遠(yuǎn)程查詢)。
加裝電能消耗計(jì)量設(shè)備和環(huán)境傳感器是采用DCIM的主要障礙之一。特別是在電源和散熱系統(tǒng)的冗余水平較低的數(shù)據(jù)中心站點(diǎn)尤其如此。這需要安裝電流變壓器(CT)和電位變壓器(PT)來測量電壓。雖然有“卡入式”類型的CT不需要斷開導(dǎo)體以安裝,但近來的OSHA已經(jīng)限制了所謂的“熱工作”帶電面板,因此可能需要關(guān)閉某些系統(tǒng)以便滿足電力工作的安全需要。而在關(guān)鍵任務(wù)數(shù)據(jù)中心 涉及到“停機(jī)”的話顯然是相當(dāng)嚴(yán)重的。所以,部署DCIM項(xiàng)目除了要獲得相關(guān)資金和資源的內(nèi)部支持,這類具有潛在破壞性的DCIM部署工作還需要獲得來自企業(yè)高層管理部門的批準(zhǔn),及與企業(yè)基礎(chǔ)設(shè)施和IT部門的合作,而這在許多企業(yè)中都是一個(gè)固有的瓶頸。
基礎(chǔ)設(shè)施的監(jiān)測:從PUE開始
在其最基本的層面,一款DCIM系統(tǒng)應(yīng)顯示實(shí)時(shí)數(shù)據(jù)、歷史趨勢,并提供年度電力使用效率(PUE)報(bào)告。這包括在相關(guān)設(shè)備上安裝電能消耗計(jì)量硬件,并至少還收集IT能量使用情況(通常是UPS輸出)。然而,部署DCIM系統(tǒng)最大的益處是其它相關(guān)設(shè)施設(shè)備(冷凍機(jī)組、CRAH / CRACs,水泵,冷卻塔等)應(yīng)安裝電能計(jì)量、環(huán)境監(jiān)測傳感器。這使得DCIM提供了一個(gè)深入分析,并允許優(yōu)化冷卻基礎(chǔ)設(shè)施的性能,以及提供早期故障檢測的警告和預(yù)測性維護(hù)功能。
空白空間:IT機(jī)架級(jí)的電源功率監(jiān)測
盡管在UPS的輸出計(jì)量IT總的能耗是最簡單和最常見的獲得PUE讀數(shù)的方法,但該方法并不能提供關(guān)于數(shù)據(jù)中心具體如何使用能源情況的任何見解。而這恰恰是對整個(gè)數(shù)據(jù)中心的能耗狀況有一套全面的看法,而不僅僅只是任何單個(gè)設(shè)備所需的一大關(guān)鍵功能。然而,較之設(shè)備數(shù)量、機(jī)架(和IT設(shè)備)的數(shù)量,對于傳感器的數(shù)目需求遠(yuǎn)遠(yuǎn)更大。而對于機(jī)架級(jí)的功率/能量計(jì)量情況來說,關(guān)注度最高的兩大領(lǐng)域要么是地板的PDU(分支電路監(jiān)測),要么是在機(jī)架內(nèi)監(jiān)測PDU(智能功率條,其中一些甚至能夠跟蹤監(jiān)測每臺(tái)IT設(shè)備的能源使用情況)。
從改造的角度,如果地板級(jí)PDU并不是已經(jīng)裝備分支電路電流監(jiān)控,添加CT到每條電纜以供給機(jī)架與任何其他的電氣工作是相同的,其也是阻礙DCIM實(shí)施的另一個(gè)障礙。然而,已被使用多年的另一種測量機(jī)架級(jí)IT設(shè)備電源使用情況的方法是安裝機(jī)架配電單元(機(jī)架電源板)。這通??梢员苊馊魏螣岵僮?,由于機(jī)架PDU插入現(xiàn)有的插座。而安裝機(jī)架PDU確實(shí)需要斷開IT設(shè)備,以取代非電力消耗計(jì)量,其潛在破壞性可以遠(yuǎn)遠(yuǎn)小于地板級(jí)PDU關(guān)閉,因?yàn)槠淇梢葬槍γ颗_(tái)機(jī)架執(zhí)行一次(如果IT硬件配備雙電源,可能不需要關(guān)閉IT設(shè)備)。而A-B冗余層PDU也是如此,有些人可能會(huì)猶豫不敢這樣做,擔(dān)心某些服務(wù)器可能沒有雙配電A-B電源線,以正確插入匹配的A-B PDU。
機(jī)架級(jí)PDU通常也使用TCP / IP(SNMP),所以其可以通過現(xiàn)有的布線和網(wǎng)絡(luò)連接。然而,雖然這避免了需要安裝專門的布線到每一個(gè)機(jī)架,但也不是沒有成本的。網(wǎng)絡(luò)布線的位置是一種IT資源,是一個(gè)昂貴的生產(chǎn)交換機(jī)的網(wǎng)絡(luò)端口。最具成本效益的選擇方案可能是為每一行增加一個(gè)低成本的48端口交換機(jī),以創(chuàng)建一個(gè)專用的網(wǎng)絡(luò),其也可以被隔離以增加額外的安全性。
安全
在今天的環(huán)境中,安全問題顯然是在幾乎所有企業(yè)最被關(guān)注的一個(gè)問題。數(shù)據(jù)中心的設(shè)施,特別是其IT負(fù)載,很明顯代表高價(jià)值目標(biāo)。因此,其每一個(gè)方面都需要關(guān)注是否存在潛在威脅。新建數(shù)據(jù)中心或改造數(shù)據(jù)中心的一大挑戰(zhàn)是以前無法預(yù)料的,即要確保DCIM對于設(shè)備和IT系統(tǒng)順利訪問的同時(shí),防范潛在的安全漏洞。這并不是說,DCIM軟件本質(zhì)上是不安全的。然而,由于其本身的性質(zhì),具有像章魚一樣多管齊下的觸角,能夠訪問各種關(guān)鍵系統(tǒng),這增加了潛在的安全威脅的切入點(diǎn)的數(shù)目,以及目標(biāo)被探測到的可能性,一旦弱點(diǎn)被發(fā)現(xiàn)就會(huì)被利用的。這種類型的潛在威脅最近被證明是目標(biāo)的突破口,其中不乏IT系統(tǒng)被滲透事件(如數(shù)以百萬計(jì)的信用卡信息被盜取),通過使用HVAC系統(tǒng),供應(yīng)商能夠登錄了解誰進(jìn)行了遠(yuǎn)程網(wǎng)絡(luò)訪問,以監(jiān)控HVAC設(shè)備。雖然DCIM可能沒有直接參與到這種情況下,但它只會(huì)加劇人們對于安全問題的關(guān)切,而這無疑進(jìn)一步阻礙了其部署實(shí)現(xiàn)。
例如,BACnet協(xié)議最初是為了在基礎(chǔ)設(shè)施內(nèi)用于專用線路的“升級(jí)”,使其能夠被遠(yuǎn)程通過標(biāo)準(zhǔn)TCP / IP網(wǎng)絡(luò)(BACnet / IP)進(jìn)行訪問。其使用UDP / IP協(xié)議,其通常出于安全原因阻止大多數(shù)企業(yè)防火墻。雖然在過去有時(shí)候,一些防火墻管理員可以被說服允許一些有限的UDP連接,最近的大規(guī)模安全漏洞會(huì)進(jìn)一步阻礙BACnet / IP作為首選協(xié)議。
此外,DCIM的特征之一是集中管理大型多點(diǎn)的環(huán)境,這也增加了兩個(gè)潛在的威脅點(diǎn)和損壞的范圍。最起碼,過濾器、防火墻和路由器的訪問列表將需要檢查和修改,允許DCIM能夠跨內(nèi)部和外部邊界和域與設(shè)備進(jìn)行通信。甚至簡單網(wǎng)絡(luò)管理協(xié)議(SNMP),通常被IT設(shè)備和大多數(shù)機(jī)架式PDU使用的協(xié)議(其已經(jīng)被不斷修正,以提高安全性),仍然是不被認(rèn)為是非常安全的,并因此被視為另一個(gè)潛在威脅。所以,除了所有其他方面和實(shí)施成本,在考慮部署內(nèi)部和外部防火墻和入侵檢測系統(tǒng)時(shí),務(wù)必格外謹(jǐn)慎小心。
新建數(shù)據(jù)中心所需考慮的問題
從設(shè)施的角度來看,在新建數(shù)據(jù)中心被設(shè)計(jì)建立前,將能夠提供方便DCIM計(jì)量冷卻系統(tǒng)電力消耗和傳感器的最好和最容易的機(jī)會(huì)。當(dāng)為DCIM項(xiàng)目編制預(yù)算時(shí),務(wù)必記住設(shè)施方面的系統(tǒng)具有相比IT設(shè)備較長的生命周期(10-15年甚至更多)。所以,當(dāng)面對最初的預(yù)算限制需要做出任何可能的妥協(xié)時(shí),務(wù)必考慮到DCIM軟件可以在購買了相關(guān)建筑設(shè)備,升級(jí)或更換之后再購買,而不會(huì)影響數(shù)據(jù)中心的運(yùn)營。相反,安裝能源計(jì)量設(shè)備通常需要電氣面板斷電,是具有破壞性的,最好是在前期一次性做好,而不是在之后增加更多的能源計(jì)量或其他儀器(如冷卻水流量監(jiān)測設(shè)備),其可能需要設(shè)備停機(jī)以便隨后實(shí)施安裝。
至于要增加IT機(jī)架級(jí)能量/功率計(jì)量和環(huán)境監(jiān)測的能力,其提供了更靈活的選擇,其中一些如上所述具有潛在較小的破壞性。盡管如此,任何新件數(shù)據(jù)中心的每個(gè)地板級(jí)PDU應(yīng)該有分支電路監(jiān)控。
總結(jié)
上面的例子只代表在一個(gè)DCIM項(xiàng)目實(shí)施部署過程中或?qū)⒂龅降奶魬?zhàn)的一個(gè)橫截面。雖然對于電氣工作的潛在破壞性是抑制實(shí)施和改造DCIM項(xiàng)目的一個(gè)顯著的因素,但這并不是不可克服的。考慮到DCIM項(xiàng)目的分階段實(shí)施的方法,特別是對改造方案而言。如果在協(xié)調(diào)階段完成(假設(shè)有一些冗余系統(tǒng)),其仍然強(qiáng)烈建議附加能耗計(jì)量設(shè)備的安裝,以便能夠從DCIM部署中實(shí)現(xiàn)最多的功能。
IT監(jiān)控可以減少安全威脅侵?jǐn)_,但除了要考慮一般性的一個(gè)重要因素,還需要兼顧環(huán)境因素,IT系統(tǒng)正在從許多途徑不斷探討未知的弱點(diǎn),而這些威脅每天都需要處理,并減輕無形的安全風(fēng)險(xiǎn)。
這些問題將需要相對于數(shù)據(jù)中心設(shè)備的大小,也許需要進(jìn)行一些綜合的權(quán)衡和折衷。這會(huì)顯著影響到部署DCIM的相對價(jià)值或潛在的好處,以及對整體成本的評估??紤]做一個(gè)試點(diǎn)項(xiàng)目,首先要積累經(jīng)驗(yàn),然后再將其作為一個(gè)基礎(chǔ)來記錄問題,并更準(zhǔn)確地預(yù)測需要克服執(zhí)行方面可能遇到的挑戰(zhàn),進(jìn)行全面的資源部署。