藍汛張?zhí)焓鹤詣踊\維核心是戰(zhàn)略 工具則是武器
云計算與虛擬化在企業(yè)中不斷落地,它們在提升IT資源利用率的同時,也增加了IT系統(tǒng)的復(fù)雜度,加大了運維難度和運維成本,降低了運維效率。這基本上成了所有企業(yè)IT部門必須直面的難題。如今,越來越多的企業(yè)IT部門開始升級運維戰(zhàn)略,從傳統(tǒng)IT運維向云運維、自動化運維過度。
那么,什么才是自動化運維的關(guān)鍵?
在剛剛結(jié)束的2016年可信云服務(wù)性能與運維論壇,北京藍汛通信技術(shù)有限責任公司云中心運維總經(jīng)理張?zhí)焓硎荆?ldquo;自動化運維可以解讀成將多個可獨立運行的模塊,根據(jù)業(yè)務(wù)需求,從邏輯上組成一個業(yè)務(wù)系統(tǒng)的思路。而其核心則是戰(zhàn)略性思維和高效的工具。”
張?zhí)焓J為,傳統(tǒng)IT運維都是在IT故障發(fā)生以后,由運維人員采取相應(yīng)措施,這種運維管理方式有時候讓運維部門很頭疼。首先是運維人員被動,效率低;其次,運維人員缺乏一套高效運維機制。目前很多企業(yè)在IT運維管理過程當中,都缺少一些自動化管理模式,也沒有明確的角色定義和責任劃分,使得一些問題出現(xiàn)后,很難快速準確的找到問題發(fā)生的根本原因。發(fā)生問題時不能及時的找到一些相應(yīng)的人修復(fù)和處理問題,或者在問題發(fā)現(xiàn)以后,沒有流程化的故障處理機制。在處理問題的時候,也沒有進行全面的分析,無規(guī)范化的解決方案;第三,缺乏高效的IT運維技術(shù)工具。隨著信息化建設(shè)深入,企業(yè)IT系統(tǒng)也是日趨復(fù)雜,越聚越多的網(wǎng)絡(luò)設(shè)備、服務(wù)器、中間件、運維系統(tǒng),讓IT人員很難從容應(yīng)對,即使加班加點部署管理,也會因為出現(xiàn)一些設(shè)備故障,而導(dǎo)致業(yè)務(wù)的中斷,嚴重影響了企業(yè)的正常運轉(zhuǎn)。出現(xiàn)這些問題的原因,是由于企業(yè)缺乏高效IT運維工具,沒有IT運維技術(shù)工具做支持的話,故障也很難得到準確及時的處理。
“工欲善其事,必先利其器“解決傳統(tǒng)IT的難點就是需要有戰(zhàn)略性思維思考自動化運維,并且有高效的工具進行輔助。眾所周知,自動化運維的愿景就是如何讓多個系統(tǒng)之間以***的方式實現(xiàn)聯(lián)動,自動化運維的目的,就是提升IT運維的質(zhì)量,降低成本。而沒有好的工具,很難實現(xiàn)自動化運維。例如傳統(tǒng)的的玉米豐收是靠人工一點一滴去割玉米、剝玉米等等經(jīng)歷幾個過程之后,才會將玉米田里的玉米變成玉米粒,而高效的玉米收割可以采用玉米直收機,將玉米直接收割、剝皮、切碎、回填,極大地提高了玉米的收割效率。這其中玉米收割機這一高效工具在實現(xiàn)自動化中起到關(guān)鍵的作用。
基于這一戰(zhàn)略思想,藍汛在自動化運維取得突出成效。藍汛成立于1998年,2010年在美國納斯達克上市,是中國CDN行業(yè)在美國上市的***家云服務(wù)提供商。截止到目前,藍汛云共服務(wù)客戶數(shù)量800余家,包括政企、游戲、電商等多個行業(yè)。這些客戶的業(yè)務(wù)量是上千臺服務(wù)器所支撐,如此規(guī)模的業(yè)務(wù)量,如果單由IT人員人工運營的話,很費時費力,為了保證業(yè)務(wù)可持續(xù)性,藍汛云引入了自動化運維系統(tǒng)。
藍汛運維自動化架構(gòu)包括監(jiān)控系統(tǒng)、調(diào)動系統(tǒng)、自動化配置系統(tǒng)、信息展示系統(tǒng)等。監(jiān)控系統(tǒng)從四個方面對整套系統(tǒng)做了監(jiān)控,包括物理硬件、虛擬化業(yè)務(wù)、業(yè)務(wù)系統(tǒng)應(yīng)用;調(diào)度系統(tǒng)就是起了承上啟下的作用,一個是向數(shù)據(jù)庫和自動化配置系統(tǒng)傳遞需求,二是向監(jiān)控系統(tǒng)反饋需求,信息數(shù)據(jù)庫中儲存了一些與運維相關(guān)的信息;自動化配置系統(tǒng)是一個需求的執(zhí)行過程,業(yè)務(wù)系統(tǒng)整套云業(yè)務(wù)所使用的底層應(yīng)用系統(tǒng)和管理系統(tǒng);信息展示系統(tǒng)是整套自動化運維的展示界面,展示的是所有與自動化運維系統(tǒng)相關(guān)的信息,包括用戶的資源使用情況等等。
正是這樣的戰(zhàn)略思想幫助藍汛運維系統(tǒng)實現(xiàn)了自動化修復(fù)功能,能夠自我檢測,發(fā)現(xiàn)問題以后,實現(xiàn)自我修復(fù);一鍵式自動化操作,讓同一個運維團隊可以同時維護多個系統(tǒng)和產(chǎn)品,真正實現(xiàn)低成本運維