如何以項(xiàng)目的運(yùn)作方式進(jìn)行運(yùn)維管理
嘉賓介紹:
陳貽泰,凡客誠(chéng)品系統(tǒng)運(yùn)維部高級(jí)經(jīng)理。目前在凡客做運(yùn)維工作,負(fù)責(zé)IDC機(jī)房和網(wǎng)站業(yè)務(wù)的技術(shù)運(yùn)營(yíng),以及企業(yè)內(nèi)部IT的系統(tǒng)及網(wǎng)絡(luò)運(yùn)維。
從事IT基礎(chǔ)設(shè)施方面的工作十多年。曾在武漢微軟技術(shù)中心專門為給各種不同行業(yè)、大中小企業(yè)做IT規(guī)劃和建設(shè),后來加入了凡客誠(chéng)品,全程深度參與了公司的系統(tǒng)及網(wǎng)絡(luò)基礎(chǔ)設(shè)施的建設(shè)。
引言
作為企業(yè)IT的主要技術(shù)負(fù)責(zé)人,在逐步建立起支撐全國(guó)上萬員工的企業(yè)IT系統(tǒng)的過程中,對(duì)互聯(lián)網(wǎng)運(yùn)維和企業(yè)IT運(yùn)維、外網(wǎng)與內(nèi)網(wǎng)、甲方和乙方之間在IT技術(shù)運(yùn)用和管理實(shí)踐上有深刻的感悟。
以下我談一下本人在運(yùn)維管理或者稱為企業(yè)IT管理上的粗淺想法及具體應(yīng)用。
曾經(jīng)的我是怎么看待運(yùn)維工作的?
之前聽騰訊劉棲銅同學(xué)講到運(yùn)維是技術(shù)運(yùn)營(yíng),我覺得挺好,很高大上,意境很令人向往!我之前有時(shí)候會(huì)粗鄙的認(rèn)為運(yùn)維干的就是照看一堆網(wǎng)絡(luò)設(shè)備、服務(wù)器、各種操作系統(tǒng)和應(yīng)用軟件……讓他們有效率和安全穩(wěn)定的運(yùn)行好。
對(duì)于運(yùn)維來說,汗流浹背扛著服務(wù)器上架是常有的事情,他這一說,我就聯(lián)想到網(wǎng)站運(yùn)營(yíng)、企業(yè)運(yùn)營(yíng)、運(yùn)營(yíng)某某大項(xiàng)目……反正感覺“運(yùn)營(yíng)”這個(gè)詞就比較大氣,這讓一直以來苦逼的運(yùn)維汗水一下抖落,似乎神氣了。
我對(duì)運(yùn)維工作的簡(jiǎn)單分類
再重復(fù)單調(diào)的工作也需要有一種超脫的心態(tài)去面對(duì),跳出自身才能更好的做好本職工作。運(yùn)維就是一項(xiàng)比較單調(diào)的工作,根據(jù)技術(shù)分類,運(yùn)維有做機(jī)房管理的,有做網(wǎng)絡(luò)管理的,有做系統(tǒng)管理的,有做數(shù)據(jù)庫管理的,有做各類應(yīng)用系統(tǒng)管理的。
從管理這個(gè)層面來看,無論是哪種技術(shù)類型,根據(jù)處理事情的特性,比如周期長(zhǎng)短、量大事小、日常重復(fù)、緊急等等,我都把運(yùn)維分為兩大類。一類是日常(類)運(yùn)維,一類是項(xiàng)目(類)運(yùn)維。
我這樣分類源于五六年前在PMP培訓(xùn)過程中的感悟,PMPBOOK書中有一段這樣的話:“項(xiàng)目源于人類有組織的活動(dòng)。隨著人類社會(huì)的發(fā)展,人類有組織的活動(dòng)逐步分化為兩大類型:一類是連續(xù)不斷,周而復(fù)始的活動(dòng),人們稱之為’作業(yè)’或’運(yùn)作(operations)’,如企業(yè)流水線生產(chǎn)大批產(chǎn)品的活動(dòng);另一類是臨時(shí)性、一次性的活動(dòng),人們稱之為’項(xiàng)目’(project)”。
日常運(yùn)維就是屬于***類的活動(dòng),稍大的角度來看,我們的整個(gè)運(yùn)維工作可能都談不上是項(xiàng)目。但如何使得本來是做周而復(fù)始的工作變成一次性的工作呢?還記得在上學(xué)的時(shí)候說到微分的概念吧!如何求導(dǎo)?這兩個(gè)問題好像奇妙的產(chǎn)生了火花,通過微分的方式我們可以把一個(gè)曲線函數(shù)看做是一段段的直線,從而可以求導(dǎo)。
項(xiàng)目運(yùn)維是什么?
在實(shí)際的工作中,一個(gè)持續(xù)性的工作是否可以通過微分的方式將連續(xù)有波動(dòng)的工作做成項(xiàng)目?
我想是可以的。通過將不同階段的任務(wù)或周期性的任務(wù)進(jìn)行切割和統(tǒng)籌安排,一個(gè)周期性的運(yùn)維是可以劃分成若干個(gè)微小項(xiàng)目的。通過對(duì)微小項(xiàng)目的管理建立起整個(gè)運(yùn)維工作的體系。
微小項(xiàng)目的管理方式,也稱任務(wù)式管理。這種任務(wù)式的管理方式可以有助于我們緩解長(zhǎng)期易疲勞的運(yùn)維工作。而且還可以形成快速迭代體系,讓方法變得更靈活,注重交付結(jié)果的同時(shí)也關(guān)注過程。
下面我們根據(jù)幾個(gè)例子來說明。在幾十人的運(yùn)維團(tuán)隊(duì),我們實(shí)際上也是根據(jù)會(huì)議溝通和日常工作來實(shí)現(xiàn)了對(duì)分類的認(rèn)識(shí):
對(duì)運(yùn)維分類的進(jìn)一步解釋
日常運(yùn)維,就是咱們運(yùn)維人員日常經(jīng)常處理的工作內(nèi)容。比如:
- 系統(tǒng)運(yùn)維人員處理一臺(tái)服務(wù)器某個(gè)目錄磁盤空間不足的問題;
- 添加或者修改一個(gè)DNS域名A記錄
- 機(jī)房人員更換一塊有故障的硬盤
- 網(wǎng)絡(luò)人員對(duì)某個(gè)出口線路帶寬有異常的流量檢查
- 桌面支持人員給同事安裝一個(gè)Office
- ……
對(duì)這類事情處理,講究的是 “短平快”。
項(xiàng)目運(yùn)維,就是非日常運(yùn)維的內(nèi)容了。大到包括一個(gè)IDC機(jī)房或者辦公樓的系統(tǒng)網(wǎng)絡(luò)建設(shè),小到比如升級(jí)系統(tǒng)內(nèi)核,因?yàn)樯婕爸匾完P(guān)鍵的業(yè)務(wù),或因技術(shù)上升級(jí)過程比較繁瑣,需要考慮的方面比較多,也會(huì)放到非日常運(yùn)維這塊。
要重點(diǎn)說明的是,團(tuán)隊(duì)在日常運(yùn)維中遇到一些故障,在快速解決后,會(huì)在統(tǒng)計(jì)中發(fā)現(xiàn)經(jīng)常出現(xiàn)類似現(xiàn)象,也總會(huì)拿出來作為問題來解決。不管是理論意義上真正的項(xiàng)目,還是問題類項(xiàng)目,或者其他具有項(xiàng)目特征的事情,只要不能在日常運(yùn)維類別中快速了結(jié),都會(huì)考慮以項(xiàng)目的方式來進(jìn)行處理。
這里指的是具有項(xiàng)目特征,要處理的事情有很多事情的集合,涉及面比較廣泛,成功完結(jié)后有從無到有的深遠(yuǎn)影響,也像項(xiàng)目一樣是計(jì)劃內(nèi)的,周期也相對(duì)比較長(zhǎng),涉及的資源和人員也可能比較多。
具體其他特征可以參考下項(xiàng)目管理方面的書,但是可不能硬套。所以這類事情個(gè)人認(rèn)為按照項(xiàng)目管理的方式去落實(shí)和推進(jìn)非常合適,這也是為什么稱為項(xiàng)目類運(yùn)維。
總之,通過綜合處理各類運(yùn)維事情的共性,做了一個(gè)二分法,日常運(yùn)維和項(xiàng)目運(yùn)維。非此即彼,也好劃分。
如何立項(xiàng)?
在實(shí)際操作中,由于沒有太明確的定義,一般同事也不好掌握。但既然是項(xiàng)目,還是有立項(xiàng)門檻的,***能不能立項(xiàng),還是需要幾個(gè)人討論后才能說了算的。但這幾個(gè)人怎么確定?
答案是,當(dāng)然不是終身制的所謂立項(xiàng)委員會(huì),原則上根據(jù)這件事的利害關(guān)系及簡(jiǎn)單好操作來確定。
在實(shí)際工作中,團(tuán)隊(duì)的例行會(huì)議中就可以了,畢竟負(fù)責(zé)各個(gè)技術(shù)方向的主管人員都是技術(shù)出身的,能夠把握好方向。舉個(gè)例子:
我們發(fā)現(xiàn)日常運(yùn)維中某個(gè)路由器CPU始終很高,連續(xù)很多次觸發(fā)報(bào)警,日常運(yùn)維中通過分流可以緩解。但是,實(shí)際報(bào)警時(shí)候流量負(fù)載并沒有到達(dá)設(shè)備的設(shè)計(jì)上限。初步推斷就知道需要進(jìn)行更深入的排查。這時(shí)候由誰來發(fā)起立項(xiàng)呢?
- 通常網(wǎng)絡(luò)管理員會(huì)在周期工作報(bào)告中匯報(bào)這個(gè)問題,希望提升成為項(xiàng)目,以查找問題根源。
- 當(dāng)然這種情況也可能是他的主管領(lǐng)導(dǎo),在查看日常運(yùn)維處理報(bào)表中發(fā)現(xiàn)這個(gè)事情經(jīng)常出現(xiàn),而希望提升為項(xiàng)目。
- 另外還可能是服務(wù)器系統(tǒng)管理員,發(fā)現(xiàn)最近某些服務(wù)器或者應(yīng)用網(wǎng)絡(luò)延遲很大,進(jìn)而發(fā)現(xiàn)這個(gè)問題比較嚴(yán)重,于是在運(yùn)維部門較高的例行會(huì)議上立項(xiàng)。
無論哪種,在內(nèi)部技術(shù)類的周期例會(huì)上,或運(yùn)維管理層會(huì)議上,都會(huì)分析這些情況,大致評(píng)估對(duì)業(yè)務(wù)的影響程度和主要解決這個(gè)問題的技術(shù)類型,決定立項(xiàng)和負(fù)責(zé)人、大致的項(xiàng)目目標(biāo)和起止時(shí)間。
項(xiàng)目工作如何流轉(zhuǎn)?
假設(shè)這個(gè)問題是在網(wǎng)絡(luò)組內(nèi)部會(huì)議討論要立項(xiàng)的,那么項(xiàng)目就在網(wǎng)絡(luò)組內(nèi)部自行組織人員解決。后續(xù)處理過程中,如果發(fā)現(xiàn)需要涉及線上業(yè)務(wù)的正常運(yùn)行,可能需要機(jī)房組和系統(tǒng)組人員協(xié)助。甚至問題根源可能就在系統(tǒng)組負(fù)責(zé)的某個(gè)服務(wù)器上,那么項(xiàng)目會(huì)升級(jí)到較大團(tuán)隊(duì)級(jí)別。
但升級(jí)就升級(jí),一般習(xí)慣是不會(huì)變更之前既定的項(xiàng)目負(fù)責(zé)人的,除非特殊,否則不會(huì)臨陣換將。
過程中管理層可以多出些力來協(xié)助項(xiàng)目負(fù)責(zé)人,尤其是負(fù)責(zé)人的直接主管領(lǐng)導(dǎo)。我想這對(duì)培養(yǎng)團(tuán)隊(duì)人員個(gè)人技術(shù)綜合素質(zhì)和提升整個(gè)團(tuán)隊(duì)的協(xié)作能力是非常有益的。
如何落實(shí)運(yùn)維工作?
既然運(yùn)維工作分為日常運(yùn)維和項(xiàng)目運(yùn)維,就可以分別來落實(shí)了?;驹瓌t是思想上要認(rèn)識(shí)清楚每項(xiàng)工作的意義,制度上要落實(shí)到位。落實(shí)到位***的辦法就是將思想和制度技術(shù)化。
“技術(shù)化”通俗的講就是通過各種軟件系統(tǒng)來管理運(yùn)維工作。打個(gè)很形象的比喻:
我們?nèi)粘i_車,要對(duì)安全有很高的認(rèn)識(shí)(思想層面上),當(dāng)然還需要制定交通法規(guī)(制度上)來指導(dǎo)我們開車,路上也會(huì)設(shè)置各種行車線。
比如實(shí)線和虛線,路中間的實(shí)線就是不能碾壓和跨越的,高速上的實(shí)線處還設(shè)立了很高和厚實(shí)的水泥防護(hù)欄,這個(gè)水泥防護(hù)欄就是思想和制度技術(shù)化的極端體現(xiàn)。實(shí)線攔不住不守規(guī)矩的車,但是水泥防護(hù)欄能!
所以思想需要形成文檔來固化,當(dāng)文檔***要通過技術(shù)化的實(shí)體軟件系統(tǒng)來固化以協(xié)助我們更正確的工作。
有了體現(xiàn)思想的制度和軟件系統(tǒng),最關(guān)鍵的是:要用,天天用。還有,不是所有的文化思想都能固化的,還要培訓(xùn)和溝通,這些無形的和有形的都需要講,換著方法的講,日日講。
當(dāng)然思想文化、文檔制度、系統(tǒng)軟件不是一天能完善的,也不是完善了就能高枕無憂的,需要集眾人智慧,與時(shí)俱進(jìn),不停的進(jìn)化下去。因?yàn)殚_放、向上、探索本身應(yīng)該是一個(gè)良好運(yùn)維團(tuán)隊(duì)的文化核心之一。
如何做好日常運(yùn)維?
對(duì)于日常運(yùn)維,這類事情是運(yùn)維的主體工作,雖然瑣碎、技術(shù)含量一般不高,但是非常影響客戶(外部用戶和公司同事)的用戶體驗(yàn),影響運(yùn)維團(tuán)隊(duì)提供的服務(wù)質(zhì)量。ITIL中的事件管理系統(tǒng)可幫助我們管理日常運(yùn)維工作。
我們就基于ITIL的IT服務(wù)管理思想,結(jié)合自身業(yè)務(wù)情況,公司自己開發(fā)了一套事件管理系統(tǒng)。個(gè)人認(rèn)為這套系統(tǒng)最有意義的地方有兩處:
1.使各個(gè)團(tuán)隊(duì)或者部門的服務(wù)接口化了。
用戶可以根據(jù)自己選擇的事情類別由系統(tǒng)分配給最適合的團(tuán)隊(duì)來處理。原理是各個(gè)團(tuán)隊(duì)將自己的工作職責(zé)提前進(jìn)行了菜單化,用戶根據(jù)自己的需求“點(diǎn)菜”即可。
比如上海辦公室的用戶outlook有問題了,就可以在事件管理系統(tǒng)中輸入outlook,找到outlook相關(guān)的服務(wù)項(xiàng),選中提交即可,系統(tǒng)會(huì)根據(jù)用戶賬戶里面的屬性分配給上海的IT桌面支持團(tuán)隊(duì)處理。
系統(tǒng)也有分配錯(cuò)誤的時(shí)候,被分配者可以重新替用戶轉(zhuǎn)給認(rèn)為正確的團(tuán)隊(duì)處理……我甚至認(rèn)為應(yīng)該將這個(gè)系統(tǒng)推送給公司所有部門使用,而不是僅僅局限于技術(shù)中心。
2.服務(wù)質(zhì)量的把控技術(shù)化了。
用戶的問題根據(jù)重要情況是分級(jí)別的,不同的級(jí)別有不同的初始響應(yīng)時(shí)間,響應(yīng)不及時(shí)以及后續(xù)處理不及時(shí)會(huì)升級(jí)。
不是原本不重要的事情變成重要,而是無論哪種事情,響應(yīng)不及時(shí)都會(huì)逐級(jí)報(bào)給事件處理人的領(lǐng)導(dǎo),甚至領(lǐng)導(dǎo)的領(lǐng)導(dǎo)。
當(dāng)然,還有相關(guān)的統(tǒng)計(jì)報(bào)表,來統(tǒng)計(jì)個(gè)人和團(tuán)隊(duì)的事件處理數(shù)量和質(zhì)量。所以無論是個(gè)人還是團(tuán)體部門,都像有一根鞭子在背后飛舞。
如何做好項(xiàng)目運(yùn)維?
對(duì)于項(xiàng)目運(yùn)維,這類事情一般涉及比較廣泛和深遠(yuǎn),更是重中之重了。項(xiàng)目運(yùn)維類的事情在實(shí)際中我一般用來監(jiān)控比較長(zhǎng)期的事情,比如部署某某系統(tǒng),或者作為問題管理。
基本上是運(yùn)維部門內(nèi)部的事情,或者是已經(jīng)轉(zhuǎn)化為內(nèi)部的事情了。因?yàn)橛脩羯?,只面向運(yùn)維部門,所以我們直接拿開源的Redmine作為管理軟件。
Redmine很靈活,需要先理解它是基于任務(wù)(issue)的,至于具體怎么用,就需要結(jié)合標(biāo)簽來做,具體就不細(xì)談了,感興趣的各位可以慢慢摸索。
通過這個(gè)軟件系統(tǒng),可以彌補(bǔ)事件管理系統(tǒng)的不足。那么事件管理哪里不足呢?
最主要的不足是事件管理最(只)適合對(duì)單個(gè)零散的、短平快的事情管理。而項(xiàng)目類的事情需要拆分成N個(gè)子任務(wù),任務(wù)之間也有前后依賴關(guān)系等等。另外項(xiàng)目類的運(yùn)維周期有時(shí)候還很長(zhǎng)。
這么長(zhǎng)的時(shí)間沒有處理完,要是在事件管理系統(tǒng)中記錄,那你的KPI就完蛋了。-_-|||
通過項(xiàng)目管理軟件我們實(shí)現(xiàn)了扁平化的管理,可以查看到所有正在進(jìn)行的任務(wù)情況,可以細(xì)致到下面的一個(gè)個(gè)子任務(wù)。這樣向領(lǐng)導(dǎo)匯報(bào)的時(shí)候不至于抓瞎,和團(tuán)隊(duì)成員溝通也便于就事論事。
一般情況,子任務(wù)都是項(xiàng)目負(fù)責(zé)人和任務(wù)被指派者相互溝通協(xié)商確定的,最終干活的人有很大的自主權(quán)。
***實(shí)踐
在不影響上級(jí)任務(wù)目標(biāo)的情況下,給予子任務(wù)實(shí)施人較大的自主權(quán),比如自己定制細(xì)節(jié)的任務(wù)目標(biāo),有助于調(diào)動(dòng)當(dāng)事人的主觀積極性,因?yàn)樗谕瓿勺约旱哪繕?biāo)。
運(yùn)維都用數(shù)據(jù)說話
因?yàn)檫\(yùn)維工作被分成了日常運(yùn)維和項(xiàng)目運(yùn)維,并分別有事件管理系統(tǒng)和項(xiàng)目管理系統(tǒng)來監(jiān)管,有了很好的運(yùn)維管理平臺(tái),現(xiàn)在基本上可以說整個(gè)運(yùn)維團(tuán)隊(duì)的工作大體上都實(shí)現(xiàn)了數(shù)據(jù)化了。
同時(shí)作為一般運(yùn)維人員來講,這二者也是一個(gè)非常好的知識(shí)和溝通平臺(tái),工作的好與不好不是領(lǐng)導(dǎo)說了算,是自己平常在日常運(yùn)維和項(xiàng)目運(yùn)維中的表現(xiàn)說了算。這樣作為運(yùn)維管理人員來講同樣就有了管理的利器,團(tuán)隊(duì)的表現(xiàn)也是用數(shù)據(jù)說話。
寫在***的話
以上看法和做法都是我個(gè)人的一家之言,純粹為了交流,每個(gè)人都有自己的管理心得,個(gè)人覺得只要符合自身企業(yè)的實(shí)際情況,運(yùn)行起來圓融無礙,就是很好的方式方法了。
好的方式方法里總是有普世的智慧之光,希望能為大家提供一些借鑒的價(jià)值。