誤區(qū):BSM與NSM關(guān)系不大
原創(chuàng)IT運(yùn)維管理離不開(kāi)對(duì)IT基礎(chǔ)設(shè)施的管理,但是目前很多人認(rèn)為,IT運(yùn)維對(duì)于底層的NSM不是很重要,實(shí)施BSM可以拋開(kāi)。5CTO.com在采訪中了解到,這種觀點(diǎn)是有問(wèn)題的。IT運(yùn)維管理的核心目的是保證基礎(chǔ)架構(gòu)對(duì)業(yè)務(wù)的支撐。如果脫離了基礎(chǔ)架構(gòu)管理,我們拿什么去支持業(yè)務(wù)呢?業(yè)務(wù)是什么,業(yè)務(wù)是一個(gè)端到端的過(guò)程。前幾年IT運(yùn)維管理系統(tǒng)的流程沒(méi)做好,最重要的原因是基礎(chǔ)設(shè)施管理不扎實(shí)。基礎(chǔ)設(shè)施管得不好,就盲目追求流程的結(jié)果是很可怕的。比方說(shuō)我們實(shí)施了一個(gè)事件管理的流程,但如果我們發(fā)現(xiàn)的事件是錯(cuò)誤的話,整個(gè)流程是毫無(wú)價(jià)值的。舉個(gè)具體一點(diǎn)的例子,如果財(cái)務(wù)系統(tǒng)不能運(yùn)行,IT運(yùn)維系統(tǒng)會(huì)有很多告警,網(wǎng)絡(luò)、服務(wù)器、數(shù)據(jù)庫(kù)、中間件告警,但有造成這個(gè)故障肯定會(huì)有一個(gè)根原因,這個(gè)跟原因會(huì)造成系列的告警,如果對(duì)基礎(chǔ)設(shè)施管理不扎實(shí),就無(wú)法發(fā)現(xiàn)根原因;告警十幾個(gè),產(chǎn)生十幾個(gè)事件,派了十幾個(gè)人去執(zhí)行十幾個(gè)工單,最后是一件事。這個(gè)流程越高效,浪費(fèi)資源越厲害。所以說(shuō),流程化管理的第一步是把基礎(chǔ)設(shè)施管理做好,對(duì)這些問(wèn)題有細(xì)致的了解,在此基礎(chǔ)上事件管理才是合理的,比如網(wǎng)絡(luò)有問(wèn)題,結(jié)構(gòu)不合理,如果沒(méi)有工具發(fā)現(xiàn)這個(gè)問(wèn)題,經(jīng)常出事,流程就歸為問(wèn)題,事件管理是應(yīng)急的。缺少大量的基礎(chǔ)數(shù)據(jù),不能有效解決問(wèn)題。所以流程化管理做得不好,脫離了企業(yè)的實(shí)際,要搭建BSM,首先綜合管理平臺(tái)要牢固,把企業(yè)的方方面面納入管理范疇,構(gòu)建關(guān)聯(lián)有關(guān)系,類似于ITSM的CMDB,在此基礎(chǔ)上流程才是高效的,否則無(wú)法實(shí)現(xiàn)高效,都是誤報(bào)。
流程化的執(zhí)行短期內(nèi)是降低效率,如果要做ITSM,半年之內(nèi)企業(yè)的效率必然下降,因?yàn)橐M(jìn)行資源整合,很多人要習(xí)慣,事件經(jīng)理,問(wèn)題經(jīng)理,變更經(jīng)理都不會(huì)很快習(xí)慣工作方式轉(zhuǎn)變。用半年時(shí)間去適應(yīng),再半年去體現(xiàn)效率,用同樣的人力物力處理事件數(shù)量成倍增長(zhǎng)。
用戶需要的是一個(gè)綜合的管理平臺(tái),業(yè)務(wù)是一個(gè)多層次的問(wèn)題,從網(wǎng)絡(luò)到鏈路,到流量,到主機(jī),操作系統(tǒng),數(shù)據(jù)庫(kù),應(yīng)用系統(tǒng),能做統(tǒng)一監(jiān)控。這個(gè)工作是大量的,要整合這些資源是很難的,需要時(shí)間的。國(guó)內(nèi)大型企業(yè)在做這個(gè)工作的時(shí)候忽略了整合,他們分離、分立式的進(jìn)行了管理,比如思科、ORACLE、流量等方面都用不同的工具去管理,這些工具是隔離的,數(shù)據(jù)沒(méi)有關(guān)聯(lián)性的,這就導(dǎo)致出現(xiàn)問(wèn)題就容易出現(xiàn)推卸責(zé)任。國(guó)內(nèi)有家大型企業(yè)實(shí)施了SAP系統(tǒng),在進(jìn)行領(lǐng)導(dǎo)參觀前的最后一次演練時(shí)發(fā)現(xiàn)有人無(wú)法登錄,認(rèn)證系統(tǒng)出錯(cuò)。他們?cè)谂挪楣恼频臅r(shí)候,首先去查看AD系統(tǒng)。他們的AD系統(tǒng)是CA做的,經(jīng)過(guò)驗(yàn)證,AD系統(tǒng)正常,但是網(wǎng)絡(luò)有問(wèn)題,經(jīng)常丟包,這個(gè)丟包問(wèn)題影響到了認(rèn)證過(guò)程。為什么會(huì)不間斷的丟包呢?他們認(rèn)為是交換機(jī)的問(wèn)題,可是換了一個(gè)交換機(jī)后卻發(fā)現(xiàn)仍然丟包。最后用北塔BTIM系統(tǒng)排查,對(duì)信息收集歸并分析,發(fā)現(xiàn)機(jī)房環(huán)境系統(tǒng),一個(gè)空調(diào)壞了,交換機(jī)溫度過(guò)高才導(dǎo)致的丟包,所以AD系統(tǒng)重復(fù)認(rèn)證,CA認(rèn)為其為非法,當(dāng)時(shí)花了三天時(shí)間,終于找到故障。
這個(gè)例子就可以看出,如果沒(méi)有一個(gè)統(tǒng)一的管理門(mén)戶的話,信息是隔離的,管理人員如果無(wú)法找到問(wèn)題的關(guān)聯(lián)性是很難發(fā)現(xiàn)問(wèn)題原因所在的。企業(yè)用戶發(fā)展到業(yè)務(wù)系統(tǒng)很復(fù)雜的時(shí)候,一定會(huì)進(jìn)行管理系統(tǒng)整合,把數(shù)據(jù)納入一個(gè)平臺(tái),理清關(guān)聯(lián)性。比如早期的布線系統(tǒng),如果使用了若干年后出現(xiàn)了故障,管理員就需要一個(gè)一個(gè)的進(jìn)行測(cè)試,而到今天,有管理系統(tǒng)能夠?qū)ζ溥M(jìn)行標(biāo)準(zhǔn)化的管理。如果沒(méi)有這些關(guān)聯(lián)性,管理是沒(méi)有頭緒的。如果缺乏對(duì)基礎(chǔ)網(wǎng)絡(luò)的NSM管理,很容易把一些實(shí)際上很簡(jiǎn)單的事情判斷成嚴(yán)重的問(wèn)題,這對(duì)流程化的建設(shè)是不利的。國(guó)內(nèi)脫離綜合管理平臺(tái),不能做到有效實(shí)施,流程就成了OA系統(tǒng)。所以我們要注意,不要把ITSM做成了IT部門(mén)的OA系統(tǒng),如果僅僅是把紙制變成了電子,同底層管理脫鉤,是很難實(shí)現(xiàn)。這樣造成的后果是知識(shí)庫(kù)是無(wú)法積累,沒(méi)有管理平臺(tái),沒(méi)有解決問(wèn)題的記錄。NSM是BSM的基礎(chǔ),必須執(zhí)行。