IT運維管理由成本中心向服務中心轉(zhuǎn)變
網(wǎng)絡規(guī)模的發(fā)展和擴大,使得應用產(chǎn)品技術(shù)日漸多樣和復雜,越來越多的企事業(yè)單位的生產(chǎn)業(yè)務和日常工作將實現(xiàn)信息化,并通過提高信息化水平實現(xiàn)對內(nèi)提高經(jīng)營水平、對外提高服務水平的目的。各企業(yè)業(yè)務的展開越來越依賴IT系統(tǒng)的正常運轉(zhuǎn),生產(chǎn)業(yè)務日漸依賴IT部門提供的系統(tǒng)服務,IT部門正由“成本中心 ”轉(zhuǎn)變?yōu)椤胺罩行摹?、“效益中心”?/P>
隨之而來的問題是IT部門將如何通過管理為企業(yè)提供更好的、可度量的、符合業(yè)務需求的服務?同時,這些服務需要能夠適應業(yè)務需求以及新技術(shù)帶來的影響,為新業(yè)務系統(tǒng)的運行提供支撐,讓IT運維管理成為企業(yè)成長的助力。
何謂IT運維管理?在了解這個概念之前,我們首先需要了解一下什么是IT管理?
IT管理是在信息化運營階段通過運維管理制度的規(guī)范,IT管理系統(tǒng)工具的支持,引導和輔助IT管理人員對各種IT資源進行有效的監(jiān)控和管理,保證整個IT系統(tǒng)穩(wěn)定、可靠和永續(xù)運行,為業(yè)務部門提供優(yōu)質(zhì)的IT服務,以較低的IT運營成本追求業(yè)務部門較高的滿意度。
簡而言之,可以理解IT運維管理為:在網(wǎng)絡的基礎(chǔ)設施建設完成之后,整個網(wǎng)絡處于運行狀態(tài),IT部門采用相關(guān)的管理方法,對運行環(huán)境(包括物理網(wǎng)絡,軟硬件環(huán)境等)、業(yè)務系統(tǒng)等進行維護管理,我們把這種IT管理的工作簡稱為IT運維管理。
IT運維管理包含內(nèi)容
IT運維是IT管理的核心和重點部分,也是內(nèi)容最多、最繁雜的部分,主要用于IT部門內(nèi)部日常運營管理,涉及的對象分成兩大部分,即IT業(yè)務系統(tǒng)和運維人員。其管理內(nèi)容又可細分為七個子系統(tǒng):
第一、設備管理:對網(wǎng)絡設備、服務器設備、操作系統(tǒng)運行狀況進行監(jiān)控,對各種應用支持軟件如數(shù)據(jù)庫、中間件、群件以及各種通用或特定服務的監(jiān)控管理,如郵件系統(tǒng)、DNS、Web等的監(jiān)控與管理;
第二、數(shù)據(jù)/存儲/容災管理:對系統(tǒng)和業(yè)務數(shù)據(jù)進行統(tǒng)一存儲、備份和恢復;
第三、業(yè)務管理:包含對企業(yè)自身核心業(yè)務系統(tǒng)運行情況的監(jiān)控與管理,對于業(yè)務的管理,主要關(guān)注該業(yè)務系統(tǒng)的CSF(關(guān)鍵成功因素Critical Success Factors)和KPI(關(guān)鍵績效指標Key Performance Indicators);
第四、目錄/內(nèi)容管理:該部分主要對于企業(yè)需要統(tǒng)一發(fā)布或因人定制的內(nèi)容管理和對公共信息的管理;
第五、資源資產(chǎn)管理:管理企業(yè)中各IT系統(tǒng)的資源資產(chǎn)情況,這些資源資產(chǎn)可以是物理存在的,也可以是邏輯存在的,并能夠與企業(yè)的財務部門進行數(shù)據(jù)交互;
第六、信息安全管理:該部分包含了許多方面的內(nèi)容,目前信息安全管理主要依據(jù)的國際標準是ISO17799,該標準涵蓋了信息安全管理的十大控制方面,36個控制目標和127中控制方式,如企業(yè)安全組織方式、資產(chǎn)分類與控制、人員安全、物理與環(huán)境安全、通信與運營安全、訪問控制、業(yè)務連續(xù)性管理等;
第七、日常工作管理:該部分主要用于規(guī)范和明確運維人員的崗位職責和工作安排、提供績效考核量化依據(jù)、提供解決經(jīng)驗與知識的積累與共享手段IT運行維護管理的每一個子系統(tǒng)中都包含著十分豐富的內(nèi)容,實現(xiàn)完善的IT運維管理是企業(yè)提高經(jīng)營水平和服務水平的關(guān)鍵。
IT運維管理面臨的難題
IT運維管理是一門探討如何提高網(wǎng)絡應用性能的課題,怎樣利用網(wǎng)絡管理做到企業(yè)IT基礎(chǔ)設施建設的管理、合理分配網(wǎng)絡資源、保障生產(chǎn)業(yè)務、對網(wǎng)絡規(guī)劃和新業(yè)務上馬提供支撐,而其最核心的目的是保障企業(yè)生產(chǎn)業(yè)務。
日常IT運維管理面臨諸多難題,具體體現(xiàn)在以下多個方面:
網(wǎng)絡設備
在企業(yè)IT基礎(chǔ)設施的搭建過程中,底層的網(wǎng)絡設備廠商和類型多樣且復雜。隨之而來的問題是:如何將不同廠商的網(wǎng)絡和應用管理產(chǎn)品在界面級、消息級和數(shù)據(jù)級集成起來實現(xiàn)統(tǒng)一管理?如何讓IT管理員了解到整個網(wǎng)絡全局的運行情況、發(fā)展趨勢和可能存在的故障隱患點,以便及時采取相應措施,實現(xiàn)事前管理。
拿曾經(jīng)碰到過的一個典型客戶來說,它的網(wǎng)絡中有11種廠商的路由交換設備,還有存儲設備,安全設備,UPS等。同時還擁有:小型機,服務器等,上層的業(yè)務系統(tǒng)有OA和CRM等。這樣大而復雜的一個網(wǎng)絡環(huán)境,該怎么管呢?
北塔軟件認為,首先需要解決的是對IT基礎(chǔ)設施的管理,管理范圍要能覆蓋到機房所有硬件設備。這一點是前提和基礎(chǔ)。其次,才是對各種應用系統(tǒng)做到很好的監(jiān)控。最后,才能為業(yè)務系統(tǒng)提供足夠的保障。
網(wǎng)絡流量
在絕大多數(shù)的企業(yè)網(wǎng)絡中,存在不同程度的網(wǎng)絡延遲,造成重要業(yè)務和應用時斷時續(xù),這直接成為企業(yè)業(yè)務的殺手。另外,網(wǎng)絡的帶寬也是企業(yè)關(guān)心的重點。比如,哪個時間段很擁擠,哪個時間段很空閑,有沒有規(guī)律,怎么樣去調(diào)查擁塞的原因,網(wǎng)絡帶寬都是被誰占用了,是被哪些客戶端、哪些應用或者異常應用所占用了。這些都是擺在每一個企業(yè)運維管理領(lǐng)域中很實際的問題。
該如何很好的解決這些問題呢?
根據(jù)多年的運維管理經(jīng)驗得出,對于這種情況,需要采用流量分析的方式。通過對出口流量或者監(jiān)控對象進行采集,進行24小時實時的監(jiān)控和分析,可以對流量進行多角度多層次的挖掘分析,比如按照流量、數(shù)據(jù)包個數(shù)、連接數(shù)、協(xié)議等類別分析當前網(wǎng)絡的負載情況,為網(wǎng)絡的優(yōu)化配置提供參考。通過報表分析展現(xiàn)流量特征,讓IT管理員明白流量被誰、被何種應用、被何種異常行為占用得怎么樣。
IT運維管理怎么樣幫助IT管理員判斷和控制安全問題,也就是作為與防病毒、防火墻、IPS等安全產(chǎn)品不同的角色,從網(wǎng)絡的整體情況要能夠判斷未知的安全問題,并提供修復方案,在不影響正常網(wǎng)絡運行狀況下將安全問題防患于未然。如果IT管理員能針對異常行為的特征建立自動告警,在某些安全攻擊出現(xiàn)前發(fā)現(xiàn)故障隱患,并提供連動的判斷和處理機制,這樣IT管理員可以及時采取了措施避免業(yè)務遭受損失。如果能在對問題特征自動告警的同時,自動記錄問題的原始數(shù)據(jù)以供事后分析,這樣IT管理員可以再現(xiàn)數(shù)據(jù)異常行為、捕捉網(wǎng)絡數(shù)據(jù)異動入侵記錄,對癥下藥制訂策略防止問題的再次發(fā)生。
業(yè)務系統(tǒng)
針對日益復雜的業(yè)務系統(tǒng),現(xiàn)有的運維管理系統(tǒng)更多的強調(diào)的是功能的展現(xiàn)。比如,從業(yè)務主機負載、數(shù)據(jù)庫服務器負載、數(shù)據(jù)庫、中間件、應用系統(tǒng)、網(wǎng)際流量、進程狀況等等不同角度實施聯(lián)合監(jiān)控,強調(diào)的是性能參數(shù)指標的多少,或者是界面的美觀程度。當然,這是落實業(yè)務系統(tǒng)管理環(huán)節(jié)所采用的方法。
但事實上,作為企業(yè)自身來說,無論采用哪種監(jiān)控也好,IT管理手段或者運維管理系統(tǒng)也罷,其核心總是需要圍繞保障和改進企業(yè)的業(yè)務系統(tǒng)。
這就提出一個問題,如何來保障又如何改進企業(yè)的業(yè)務系統(tǒng)呢?
首先,需要了解清楚業(yè)務系統(tǒng)所涉及的具體環(huán)節(jié),針對每一個環(huán)節(jié)進行管理落實。按照北塔軟件的觀點,分為:用戶—網(wǎng)絡—硬平臺—軟平臺—業(yè)務系統(tǒng)這五個環(huán)節(jié)。需要從這五個環(huán)節(jié)所涉及到的五個方面去做工作。這五個方面分別是:全局的性能管理、故障和事件管理、資源的使用狀況管理、安全管理和數(shù)據(jù)分析管理。其次,通過性能和歷史數(shù)據(jù)的反映,又可以做到對業(yè)務系統(tǒng)提供改進決策的指導。
當然,對于如何保障和改進業(yè)務系統(tǒng)這個問題,目前業(yè)界眾說紛紜,沒有統(tǒng)一的標準。但有一點是肯定的,就是需要從企業(yè)用戶的角度出發(fā),通過明確的管理思路作為指引,使用軟件+服務的方式和企業(yè)用戶共同探索和研究,最終達到對業(yè)務的保障和改進。
當前IT運維管理的任務
在企業(yè)網(wǎng)絡運維早期,IT運維管理側(cè)重于網(wǎng)絡、硬件等設備。隨著業(yè)務系統(tǒng)涉及的環(huán)節(jié)日益增多,單一的網(wǎng)絡管理已經(jīng)不足以滿足管理需求,越來越多的企業(yè)已經(jīng)將關(guān)注點從單一網(wǎng)絡轉(zhuǎn)變到當前的業(yè)務系統(tǒng),落實保障業(yè)務系統(tǒng)的各個環(huán)節(jié)成為重中之重。
因此,當前國內(nèi)用戶最關(guān)心的莫過于如何保障業(yè)務系統(tǒng)的正常運行。IT運維系統(tǒng)應該從業(yè)務角度切入,以業(yè)務為導向,通過對整個業(yè)務系統(tǒng)的關(guān)注,落實業(yè)務系統(tǒng)的各個環(huán)節(jié),從而來達到保證業(yè)務系統(tǒng)穩(wěn)定運行和透明化管理的目的。
【編輯推薦】