“業(yè)務視圖”將決定企業(yè)運維出路
作為核心決策層的重要成員,CEO的鐵桿擁護者,某企業(yè)的人力資源總監(jiān)(CHO)對IT運維部門提出的“加人”需求極為不滿。CHO感覺:“幾套圍繞ERP邊緣的子業(yè)務系統(tǒng)還沒上線,運維部經理就和CIO聯(lián)手 '一而再,再而三'的要求招聘運維工程師,用于新增子業(yè)務系統(tǒng)的監(jiān)控和維護,他們不考慮人力成本”。
而運維部門的工程師也心懷不滿:“人手本來就緊張,上了這么多業(yè)務應用,日志看都看不完,還指著我們上ITIL。公司再不招人,我們只有走的份了。除了工作,我們還有生活呀!”
重重矛盾應該如何化解呢?作為國內領先的IT運維產品和服務提供商,在IT運維最前沿積累了長期寶貴經驗的北塔軟件認為:“IT基礎設施的管理看起來簡單,但實際上卻有著很強的專業(yè)性,隨著企業(yè)規(guī)模和IT系統(tǒng)的擴展,子系統(tǒng)不斷增加,如果仍然依靠傳統(tǒng)的監(jiān)控軟件,就不可能實現(xiàn)集中管理和分級維護的目標。因此,如要釋放運維人員的壓力,提升IT系統(tǒng)在企業(yè)中的核心價值,我們只有站在業(yè)務的本質上去改變運維,而最直接和有效的方法,就是用業(yè)務的視角來管理IT。”那么,如何踐行才能實現(xiàn)這一方法呢?下面,我們以北塔BTIM(Betasoft Integrated Management,IT綜合管理軟件)為例,全面剖析“業(yè)務視圖”是如何幫助我們改變消沉已久的運維現(xiàn)狀。
基于“通斷”的運維已經“過時”
從網(wǎng)絡設備自帶的命令行管理工具,到針對網(wǎng)絡協(xié)議的監(jiān)控軟件;從編寫監(jiān)控服務器CPU的腳本,再到現(xiàn)在基于拓撲自動發(fā)現(xiàn)的IT運維系統(tǒng);從業(yè)務的輔助手段,到引領公司前行的整合工具。隨著我國信息化滲透指數(shù)的不斷提高,IT運維方式和應用手段都發(fā)生著一系列的變化,我們從網(wǎng)絡系統(tǒng)的管理到業(yè)務服務系統(tǒng)的管理,一路走來。
歷史的車輪從未停止,IT運維的產品也是如此,只不過有些IT維護系統(tǒng)的速度有點跟不上業(yè)務發(fā)展的腳步。某公司的銷售部門報告說ERP系統(tǒng)上不去了,但IT部門沒有接到預警信息,又一次非常尷尬的局面。IT工程師迅速檢查日志,一步一步地查找故障:ping一下路由器、檢查一下Web服務器的CPU使用率、數(shù)據(jù)庫服務器的內存使用率……但通過這些表象的監(jiān)控對象,工程師花去了2個小時,還是無法找到問題的根源。
經過調查后,我們發(fā)現(xiàn),由于這家企業(yè)網(wǎng)絡的監(jiān)控對象獨立分割,同時又停留在基于ICMP協(xié)議的監(jiān)控管理,所以只能對服務器和網(wǎng)絡設備的連通性進行簡單性測試。大量的一線數(shù)據(jù)證明了,這些“常識性的操作”在網(wǎng)絡建設階段的作用很大,但在應用階段就顯得力不從心了。隨著基于IT平臺的業(yè)務系統(tǒng)在企業(yè)中的地位逐步成為核心,對這些系統(tǒng)的健康性管理,與簡陋的運維工具之間的矛盾就越發(fā)的顯現(xiàn)出來。#p#
業(yè)務系統(tǒng)運維的本質在于整合
前面提到了基于“通斷”的監(jiān)控方式,為何不能體現(xiàn)出業(yè)務系統(tǒng)運行的詳細狀況呢?首先,讓我們以北塔眾多客戶中的一家大型煙草企業(yè)為例,來看看這家企業(yè)的業(yè)務平臺是由哪些對象組成的:
通訊平臺:由數(shù)據(jù)交換和安全保障兩大平臺組成,其中又包括了交換機、路由器、防火墻、入侵檢測系統(tǒng),以及內部數(shù)據(jù)中心的高速線路和跨越不同的地域、不同主機平臺上的廣域網(wǎng)鏈路組成。
主機平臺:硬件主機平臺包括存儲系統(tǒng)、服務主機系統(tǒng)、群集系統(tǒng)、UNIX小機、Linux和Windows三大平臺,并且這些服務器分別采購,部署在集團的數(shù)據(jù)中心和分支機構的小型設備間。
軟件平臺:軟件平臺包括支撐煙草業(yè)務系統(tǒng)運行的Web服務環(huán)節(jié)、交易服務環(huán)節(jié)、數(shù)據(jù)庫環(huán)節(jié)、中間件環(huán)節(jié)、服務器操作系統(tǒng)、終端操作系統(tǒng)和瀏覽器等等。
通過這家企業(yè)業(yè)務組成對象的簡單羅列,我們不難發(fā)現(xiàn),如果我們利用“通斷”方式來進行維護,就不可能將所有對象綜合起來進行統(tǒng)一管控,不可能將業(yè)務的本質體現(xiàn)在IT運維中,這就是業(yè)務的:“不可分割性”。為了說明整體性,我們還可以假設把網(wǎng)絡設備的監(jiān)控軟件單獨拿出來的例子,如果單獨看設備管理的話,那么它只是具有觀賞價值,而不是應用價值。所以,針對業(yè)務系統(tǒng)的運維,要把業(yè)務系統(tǒng)涉及的每一個對象都合并起來,當成是一個整體,這是因為它們從來不會因為硬件,或是存在位置而形成獨立的個體。
業(yè)務視圖使你不在“受控于人”
北塔軟件副總經理孫永杰先生認為:“隨著業(yè)務系統(tǒng)一個又一個地建設,其各自所配套的、彼此各不相關的監(jiān)視系統(tǒng)也一個又一個地被建造出來,并各自孤立地投入運行。由于子業(yè)務系統(tǒng)建設目標的局限性,使得其所配套建設的監(jiān)視系統(tǒng)的關注對象只可能是子系統(tǒng)本身,這也是我們需要建立業(yè)務視圖的原因。從這個意義上說,業(yè)務視圖所關注的重點應當是各個分散的子業(yè)務系統(tǒng)的整合結果,以及全面的工作狀態(tài)、運行效果以及與之直接或間接相關的各個方面,如:業(yè)務系統(tǒng)自身的能力、周邊環(huán)境等等。”
無論是“能力強度缺陷”類(如:數(shù)據(jù)庫系統(tǒng)的錯報能力不足)問題,還是“能力范圍局限”類(如:超出服務器的負載能力范圍)問題,都是系統(tǒng)單靠自身能力無法解決的。系統(tǒng)在運行中一旦遇見問題,只有憑借外力予以解決,這也就是前面提到運維部門和人力資源部門產生矛盾的原因,因為大多數(shù)的運維經理都會相信:“單位內部有多少個業(yè)務系統(tǒng),就需要配備有大體上數(shù)量相等的、幾乎一一對應的運維團隊”。但這種運維格局不會改變嗎?事實上很多企業(yè)利用循序漸進的方式,在最終形成了基于業(yè)務視圖運維的形態(tài)下,已經不再“受控于人”。#p#
業(yè)務視圖是如何形成和發(fā)展的?
以前面提到的煙草企業(yè)為例,北塔軟件利用BTIM幫助客戶從三個階段實現(xiàn)了IT運維的改變。這是由于BTIM從設計之初,就是一款基于BSM方法論的IT綜合管理平臺,因此這家企業(yè)可以利用它重新定義IT運維的目標和效果,真正的將IT與業(yè)務融合,實現(xiàn)了透明化、智能化、精細化的IT全方位管理。在具體的實施過程中,我們可以看到北塔是通過如下的步驟協(xié)助企業(yè)解決運維需求的:
第1步,首先是進行IT基礎設施綜合管理平臺的建設。BTIM的實施,完整覆蓋了網(wǎng)絡、安全、機房、服務器、數(shù)據(jù)庫、中間件、應用等各個方面的管理。同時,提供了性能、故障、報表,各類數(shù)據(jù)流分析、資產管理、IP地址空間管理、跨地域的分級分權的廣域網(wǎng)信息管理。并通過事件自動識別和智能歸并技術,可以讓IT人員迅速實現(xiàn)每一個基礎設施的故障根源定位。
第2步,構建業(yè)務視圖,實現(xiàn)業(yè)務服務管理(BSM)建設。此時,企業(yè)已經可以從IT基礎設施綜合管理平臺,以一致的方式來展示每個子系統(tǒng)的事件信息,并能夠與配置管理平臺(CMDB)緊密融合。所以,我們現(xiàn)在可以圍繞企業(yè)的關鍵業(yè)務,借助動態(tài)的業(yè)務響應視圖來引入服務水平協(xié)議(SLA)機制。在此階段,將各個分散在子系統(tǒng)中的元素貫穿和統(tǒng)一起來,利用BTIM中的業(yè)務視圖,非常清晰的看到業(yè)務架構、業(yè)務運行、業(yè)務使用、事件原因分析、業(yè)務統(tǒng)計與分析。
第3步,是實現(xiàn)虛擬化數(shù)據(jù)中心和私有云的整合監(jiān)控,形成新一代的運維架構平臺。由于在前一步中業(yè)務監(jiān)控的建設已經到位,此時業(yè)務部門和IT部門擁有了統(tǒng)一的管理語言和管理視角,從而使得私有云的建立只需要調整業(yè)務視圖的拓撲,便可立即讓業(yè)務服務模型能夠清晰地描述業(yè)務與虛擬主機之間的關鍵指標。
通過上述描述,我們清楚的看到,業(yè)務視圖的建立,實際上是讓多個子業(yè)務系統(tǒng)符合一個完整業(yè)務流程的過程。消除了這些子業(yè)務系統(tǒng)運維的語言障礙,通過一致的標準和統(tǒng)一的界面,那么,這樣的運維改變對于業(yè)務流程和整體效率而言,都可以達到預期的效果。