從支付寶故障看服務(wù)器擴(kuò)容三:事后評估篇
原創(chuàng)【51CTO獨家特稿】我們在上一篇文章中介紹了服務(wù)器擴(kuò)容的事中實施,詳細(xì)介紹了服務(wù)器擴(kuò)容的過程。不過服務(wù)器擴(kuò)容完畢,事情結(jié)束了嗎?NO,擴(kuò)容的結(jié)果只是證明我們目標(biāo)達(dá)成了,至于這個服務(wù)器擴(kuò)容是否真正的完美無瑕,我們還需要做一系列的評估與驗證。
服務(wù)器擴(kuò)容事后評估篇A、數(shù)據(jù)驗證
關(guān)鍵的一步!服務(wù)器擴(kuò)容是為了滿足當(dāng)前日益增長的信息與數(shù)據(jù)要求,而如果因為服務(wù)器擴(kuò)容而造成數(shù)據(jù)的流失這還不如不進(jìn)行擴(kuò)容改造!所以我們在擴(kuò)容完畢后首先要驗證數(shù)據(jù)的完整性和正確性,一個數(shù)據(jù)也不能丟失,這是唯一的要求,也是必須的要求。
服務(wù)器擴(kuò)容事后評估篇B、服務(wù)驗證
假如我們這次擴(kuò)容增加了5塊SAS硬盤,前期工作我們已經(jīng)驗證了這次增加的有效性和可行性,但是這并不意味著此次增加就完全高枕無憂,我們還需要在擴(kuò)容完畢后在功率上、使用效率上、整體性能上作出綜合的評價,擴(kuò)容是否給我們帶來實質(zhì)性的提高?需求我們是不是得以滿足?都需要驗證。
服務(wù)器擴(kuò)容事后評估篇C、數(shù)據(jù)中心整體評估
這是一個全面考量的過程,如果增加了10片刀片,數(shù)據(jù)中心所需要的電力消耗必然會大幅提升,成本是一個方面,我們需要關(guān)注,但是我們更關(guān)注的是UPS的動力、支撐能力,一旦出現(xiàn)UPS負(fù)載過高的情形,增加UPS將是必不可少的,整個增加過程自然是前期工作,但是也需要我們后期驗證作保證。
另外,我們還需要借助無線紅外熱感系統(tǒng)來監(jiān)控整個數(shù)據(jù)中心的溫度變化,一旦出現(xiàn)居于溫度過高的現(xiàn)象恐要危及到其他的服務(wù)器,這也是我們在擴(kuò)容完畢后需要監(jiān)測與改造的。
服務(wù)器擴(kuò)容結(jié)語:
服務(wù)器擴(kuò)容不僅僅是考查IT運維團(tuán)隊的技術(shù)水平,也在驗證這個團(tuán)隊的細(xì)致程度。在這個過程中,我們一定要在前期做足功課,在部署過程中膽大心細(xì),不要擔(dān)心問題的發(fā)生,遇到問題解決問題,當(dāng)所有的case都完成后,做出近乎苛刻的測試,在用戶發(fā)現(xiàn)問題前搞定它,呈現(xiàn)給最終用戶的必須是最好的。
如果能注意到這些服務(wù)器擴(kuò)容的問題將不再是問題。
【編輯推薦】