“五個(gè)九”的可用性真的有意義嗎?
譯文【51CTO 8月23日外電頭條】51CTO編輯注:現(xiàn)在互聯(lián)網(wǎng)服務(wù)商提到可用性,一般以“n個(gè)九”作為指標(biāo),而“5個(gè)九”是相對(duì)高可用的標(biāo)準(zhǔn),也是大部分云計(jì)算服務(wù)商承諾的可用性。但是,隨著業(yè)務(wù)的構(gòu)成更加復(fù)雜,“5個(gè)九”這樣簡(jiǎn)單的指標(biāo)還能滿足用戶的需求嗎?且看本文分解。
如今還有人真的把所謂“五個(gè)九”類承諾當(dāng)回事嗎?從理論層面上來(lái)說(shuō),這意味著99.999%的可用運(yùn)行時(shí)間比例,也就是說(shuō)業(yè)務(wù)經(jīng)理們每天會(huì)遭遇到的故障時(shí)段也就八分之一秒多一點(diǎn)。
這聽起來(lái)算是相當(dāng)令人滿意的結(jié)果了,不是嗎?一周的故障時(shí)段為六秒左右,一年也才大概五分鐘。
紙上談兵沒有價(jià)值
回溯八十年代中葉,當(dāng)時(shí)企業(yè)希望業(yè)務(wù)人員能夠熟悉IT部門的交流方式,并認(rèn)為這種角色轉(zhuǎn)換具有積極的現(xiàn)實(shí)意義。不過(guò)放在現(xiàn)在看來(lái),這種要求只能被稱為癡人說(shuō)夢(mèng)。業(yè)務(wù)負(fù)責(zé)人想要的只是在他們需要時(shí)所有設(shè)備能夠正常運(yùn)轉(zhuǎn)并提供準(zhǔn)確的服務(wù),進(jìn)而幫他們賺到錢。
在當(dāng)下,系統(tǒng)管理工作又是如何進(jìn)行的?IT負(fù)責(zé)人怎樣確定系統(tǒng)正在針對(duì)商務(wù)客戶的需要提供確切的幫助,而不僅僅是提供一份空泛的統(tǒng)計(jì)單?
“五個(gè)九現(xiàn)在已經(jīng)不合時(shí)宜了。”Bill Roth說(shuō)道,他是商業(yè)情報(bào)公司LogLogic的執(zhí)行副總裁。
“人們需要計(jì)算機(jī)時(shí)刻保持正常運(yùn)轉(zhuǎn),但用戶描述需求的方式已經(jīng)發(fā)生了改變。”
現(xiàn)在我們所需要的是,手頭的計(jì)算資源能夠在任何必要情況下正常運(yùn)作,這也就是他口中提到的“有效的九”。當(dāng)然,實(shí)際上我們有許多時(shí)段并不太需要計(jì)算資源,例如工作人員夜間休息的時(shí)候。
多層式結(jié)構(gòu)樞紐
這意味著IT部門必須將IT系統(tǒng)視為一個(gè)整體,而不是過(guò)分側(cè)重于其中單個(gè)的組件。就IT基礎(chǔ)設(shè)施中的多個(gè)組件進(jìn)行事件分析,能夠幫助管理員更好地了解當(dāng)前的實(shí)際運(yùn)行情況以及給客戶帶來(lái)的影響。LogLogic公司所打造的語(yǔ)義解析及識(shí)別系統(tǒng)不僅能夠用來(lái)闡釋某段特定的錯(cuò)誤代碼,還會(huì)為我們展示其所造成的影響。
Hamish MacArthur說(shuō):對(duì)于大多數(shù)管理員來(lái)說(shuō),問(wèn)題在于他們的系統(tǒng)已經(jīng)是數(shù)年前的陳舊產(chǎn)物,而這正是多層式結(jié)構(gòu)的噩夢(mèng)。他是MacArthur Stroud分析公司的聯(lián)合創(chuàng)始人之一。
“我們以某種運(yùn)行狀態(tài)作為最終方案,而人們卻總會(huì)在不同時(shí)段向其中引入大量不同類型的工具,”他說(shuō)。“潛在的復(fù)雜性正在虛擬化的作用下進(jìn)一步加劇。”
問(wèn)題的另一大難點(diǎn)在于,此類工具往往并不是用戶自己購(gòu)買的。“基礎(chǔ)設(shè)施管理工具往往基于一些假設(shè)向管理者做出很多許諾,令人以為上了工具就能在無(wú)需全程監(jiān)控的前提下了解到當(dāng)前的運(yùn)行狀態(tài),”MacArthur說(shuō)道。
IT部門并不總是在預(yù)算成本中將額外的系統(tǒng)管理工具納入考慮范疇。但企業(yè)無(wú)疑需要在系統(tǒng)性能方面獲得充分肯定,而IT部門會(huì)旋即發(fā)現(xiàn)自己必須采用相關(guān)的性能及系統(tǒng)管理工具才能達(dá)成上述目標(biāo)。
將此類工具全部整合起來(lái)并加以協(xié)調(diào)可謂超乎想象地困難。不同的系統(tǒng)管理環(huán)境可能會(huì)在特定的應(yīng)用程序集合中發(fā)揮出不一樣的執(zhí)行表現(xiàn),但管理員需要跨業(yè)務(wù)單位對(duì)整從此管理系統(tǒng)進(jìn)行維護(hù)。此外,他們還需要根據(jù)運(yùn)營(yíng)成本的限制對(duì)引入的授權(quán)許可數(shù)量制訂規(guī)劃。
以典型的統(tǒng)一型數(shù)據(jù)中心來(lái)說(shuō),例如思科的UCS,能夠徹底解決全部問(wèn)題的方案非常有限。
解決方案的基本思路是在對(duì)一套單一的整合型系統(tǒng)進(jìn)行管理時(shí),從某個(gè)單獨(dú)的切入點(diǎn)著手。一切因素都經(jīng)過(guò)預(yù)先設(shè)置、反饋良好,可以通過(guò)管理控制臺(tái)對(duì)整套系統(tǒng)進(jìn)行鳥瞰式的監(jiān)控。
但此類統(tǒng)一型服務(wù)器的局限也是明顯的。企業(yè)可能會(huì)通過(guò)使用新的數(shù)據(jù)機(jī)房或引入一套新的應(yīng)用程序來(lái)實(shí)現(xiàn)部署角度的改進(jìn),但卻很少用它們徹底替代原有的計(jì)算基礎(chǔ)設(shè)施。
降低棧集成程度
因此,各大機(jī)構(gòu)往往都在其自有計(jì)算基礎(chǔ)設(shè)施中殘留著雜亂無(wú)章的運(yùn)行環(huán)境。甚至來(lái)自VMware, EMC的集成棧以及思科的 VBlocks、 NetApp的 FlexPod、以及甲骨文的Exadata都存在著此類問(wèn)題。
據(jù)分析人士透露,這也正是集成棧的銷售情況長(zhǎng)期游走于低位的原因。
提升自己對(duì)系統(tǒng)的觀察視角,意味著我們?cè)谙到y(tǒng)管理方面進(jìn)一步深化以服務(wù)為中心的思路;提供給用戶的不僅僅是特定的硬件套裝,更應(yīng)該是經(jīng)過(guò)嚴(yán)格考量的應(yīng)用程序。這些服務(wù)項(xiàng)目應(yīng)該能夠廣泛覆蓋常見的組件。
IT部門可以將其數(shù)據(jù)中心分為同步型、異步型以及獨(dú)立應(yīng)用與服務(wù)型三種。同步型部分的關(guān)鍵性指標(biāo)是正常運(yùn)行時(shí)間;異步型應(yīng)用程序能夠一次性脫機(jī)數(shù)小時(shí)仍然正常運(yùn)作;而獨(dú)立型每個(gè)月可能只使用兩天左右。
從這個(gè)角度劃分系統(tǒng)類型并兼顧客戶的實(shí)際需要,將使系統(tǒng)管理工作的必要成本遠(yuǎn)遠(yuǎn)低于單純追求多少個(gè)九的運(yùn)行統(tǒng)計(jì)數(shù)據(jù)。
原文:http://www.theregister.co.uk/2011/08/19/system_management/
【編輯推薦】