運(yùn)維人之運(yùn)維的尊嚴(yán)
作為在運(yùn)維戰(zhàn)線上摸爬滾打了二十多年、現(xiàn)在擔(dān)任數(shù)據(jù)中心管理崗位的老兵,這些文章里面描述的很多場景都仿佛歷歷在目。曾幾何時(shí),運(yùn)維成為了苦逼和背鍋俠的代名詞,隨時(shí)加班、搶險(xiǎn)應(yīng)急,晝夜不停地開展環(huán)境搭建和版本投產(chǎn)。當(dāng)夜深人靜的時(shí)候,別人都已經(jīng)進(jìn)入了夢鄉(xiāng),而運(yùn)維人才開始工作。而當(dāng)生產(chǎn)環(huán)境出現(xiàn)問題時(shí),先受到質(zhì)疑的又是運(yùn)維人員。一方面運(yùn)維人員經(jīng)常加班,長期承受著無形的壓力,另一方面其他部門不清楚運(yùn)維部門的價(jià)值所在,“產(chǎn)品出了問題找公司,應(yīng)用出了問題找開發(fā)中心,賬務(wù)處理找業(yè)務(wù)部門,運(yùn)維部門究竟是做什么的?”
隨著云計(jì)算的興起,硬件維護(hù)、系統(tǒng)管理、應(yīng)用開發(fā)都趨向集中,開發(fā)運(yùn)維一體化(devops)使開發(fā)和運(yùn)維的界限不再?zèng)芪挤置?,智能運(yùn)維(AIops)會(huì)在根本上改變運(yùn)維的模式。運(yùn)維行業(yè)真的要消失嗎?運(yùn)維人的價(jià)值究竟體現(xiàn)在哪兒?運(yùn)維人應(yīng)當(dāng)如何升級轉(zhuǎn)型呢?
隨著信息技術(shù)在各行各業(yè)越來越廣泛地應(yīng)用,社會(huì)上對IT運(yùn)維的需求不斷增加,同時(shí)由于云計(jì)算等技術(shù)的普及和成熟,彈性供給、按需付費(fèi)、快速響應(yīng)等特點(diǎn)使企業(yè)上云的意愿更加強(qiáng)烈,對傳統(tǒng)運(yùn)維人員的需求不增反減。技術(shù)的進(jìn)步對傳統(tǒng)行業(yè)帶來的沖擊是致命的,就像電商促進(jìn)了零售的發(fā)展,而傳統(tǒng)零售商卻逐漸凋零一樣?;A(chǔ)設(shè)施即服務(wù)(IaaS)減少了對基礎(chǔ)設(shè)施維護(hù)人員的需求,平臺(tái)即服務(wù)(PaaS)降低了對中間件和數(shù)據(jù)庫維護(hù)人員的要求,軟件即服務(wù)(SaaS)則對應(yīng)用開發(fā)人員產(chǎn)生了很大沖擊,智能運(yùn)維(AIops)更是號稱要消滅低端的運(yùn)維。
運(yùn)維人員已經(jīng)感受到來自云計(jì)算、大數(shù)據(jù)、人工智能等技術(shù)發(fā)展帶來的巨大壓力。在高度標(biāo)準(zhǔn)化的云計(jì)算環(huán)境里,通過自動(dòng)化運(yùn)維和智能化運(yùn)維來完成運(yùn)維工作已經(jīng)沒有多少障礙,在一個(gè)單一的垂直領(lǐng)域由開發(fā)人員完成運(yùn)維工作也取得了令人驚奇的效果。在阿里巴巴、騰訊這樣的公司,運(yùn)維人員的職責(zé)和組成也發(fā)生了翻天覆地的變化,不再有單純的運(yùn)維工程師,取而代之的是運(yùn)維開發(fā)工程師。大家把運(yùn)維經(jīng)驗(yàn)總結(jié)提煉成知識圖譜,通過智能運(yùn)維平臺(tái)對復(fù)雜的應(yīng)用環(huán)境進(jìn)行維護(hù)、監(jiān)控、應(yīng)急和分析。
社會(huì)需要IT運(yùn)維這項(xiàng)服務(wù),但是不一定需要專職的低端的運(yùn)維人員,只有在復(fù)雜多變的環(huán)境下,運(yùn)維人員才會(huì)真正體現(xiàn)優(yōu)勢發(fā)揮作用,這是一個(gè)不可阻擋的發(fā)展趨勢。運(yùn)維人員不被歷史淘汰的僅有途徑就是苦練內(nèi)功,升級轉(zhuǎn)型,真正體現(xiàn)自己的價(jià)值。
那么,運(yùn)維人的價(jià)值是什么呢?按照軟件生命周期理論,產(chǎn)品運(yùn)維和運(yùn)營占據(jù)了整個(gè)生命周期的百分之七十以上的時(shí)間,也是體現(xiàn)產(chǎn)品價(jià)值的最重要階段。而運(yùn)維人員應(yīng)當(dāng)對產(chǎn)品最終的運(yùn)營效果負(fù)責(zé),以此體現(xiàn)自身的價(jià)值。
一、變費(fèi)用中心為利潤中心
產(chǎn)品的運(yùn)維和運(yùn)營都是需要費(fèi)用的。運(yùn)維部門是傳統(tǒng)意義上的費(fèi)用中心,是花錢的部門。一般大的公司運(yùn)維部門都會(huì)有幾百人,同時(shí)簽署了很多外包合同,我們可以匯總計(jì)算出一年支出的總費(fèi)用。如果公司把運(yùn)維外包給騰訊或阿里巴巴甚至研發(fā)人員,在保持相同服務(wù)質(zhì)量(SLA)的情況下,他們會(huì)向我們索要多少費(fèi)用。如果我們自己運(yùn)維所花費(fèi)的費(fèi)用少,則說明我們?yōu)楣竟?jié)省了支出,反之就是我們浪費(fèi)了公司的資源。
當(dāng)然這種說法太理想化,在衡量整體費(fèi)用的同時(shí),還要考慮安全風(fēng)險(xiǎn)、政策約束、職業(yè)穩(wěn)定等多種因素,在整體上可比性較差,只具有理論上的意義。我們可以參考同等規(guī)模的業(yè)內(nèi)公司,他們的人員規(guī)模、服務(wù)水平等條件與我們大體相當(dāng),他們的費(fèi)用數(shù)量可以作為評測的參考。在個(gè)體上可比性就比較大,一個(gè)人現(xiàn)在月薪兩萬元,如果他在社會(huì)上可以應(yīng)聘到月薪三萬元的職位,則我們就賺了,反之就賠了。當(dāng)然這里面還是要考慮穩(wěn)定、品牌、口碑、風(fēng)險(xiǎn)偏好等因素。
我們應(yīng)當(dāng)努力提升運(yùn)維管理水平,提高運(yùn)維人員的技術(shù)能力,盡可能放大人員效能和投入產(chǎn)出比,與此同時(shí),我們可以根據(jù)自己的技術(shù)優(yōu)勢,進(jìn)行運(yùn)維技術(shù)輸出工作,變費(fèi)用中心為利潤中心。目前,公有云服務(wù)就是一種運(yùn)維技術(shù)輸出的產(chǎn)物,它把用戶公司的基礎(chǔ)設(shè)施運(yùn)維、平臺(tái)運(yùn)維甚至應(yīng)用運(yùn)維承包下來,承諾服務(wù)質(zhì)量(SLA),收取相應(yīng)的費(fèi)用。運(yùn)維管理咨詢、運(yùn)維工具、運(yùn)維項(xiàng)目管理、系統(tǒng)調(diào)優(yōu)和技術(shù)支持等都可以成為運(yùn)維技術(shù)輸出的內(nèi)容,采用按次收費(fèi)和按效果收費(fèi)不同的模式。
二、提升運(yùn)營效率
運(yùn)維人員每天接觸大量的系統(tǒng)信息,可以觸類旁通、舉一反三,從中總結(jié)出系統(tǒng)運(yùn)行的規(guī)律,制定合理的維護(hù)計(jì)劃,確保系統(tǒng)穩(wěn)定運(yùn)行。運(yùn)維人員還可以觀察出系統(tǒng)運(yùn)行中最薄弱的環(huán)節(jié),通過系統(tǒng)優(yōu)化來提高系統(tǒng)的高可用性,提升系統(tǒng)運(yùn)行效率。最終,運(yùn)維人員從大量的實(shí)踐工作中抽象出運(yùn)維非功能規(guī)范,指導(dǎo)開發(fā)部門在開發(fā)階段就充分考慮運(yùn)維的需求,從根源上降低或根除系統(tǒng)隱患。
一個(gè)產(chǎn)品開發(fā)出來推到市場,并不意味著萬事大吉。由于考慮不周、時(shí)間倉促等各種原因,產(chǎn)品投產(chǎn)后整體運(yùn)營效率不一定是好的。運(yùn)維人員可以通過對使用過程中產(chǎn)生的數(shù)據(jù)、發(fā)生的事件、客戶的反饋進(jìn)行分析研究,提出優(yōu)化改進(jìn)措施,提升整體運(yùn)營效率。
舉個(gè)比較極端的例子,某銀行在大額存單產(chǎn)品開立時(shí),業(yè)務(wù)部門還是采用OA系統(tǒng)進(jìn)行總行授權(quán)、通過電話溝通進(jìn)行關(guān)聯(lián)部門橫向交流的方式,工作效率十分低下。而應(yīng)用系統(tǒng)已經(jīng)具備了自動(dòng)聯(lián)動(dòng)開立產(chǎn)品的功能,如果使用該功能,可以把產(chǎn)品開立的周期從一個(gè)月縮短到兩天。運(yùn)維人員應(yīng)當(dāng)在日常運(yùn)維過程中及時(shí)發(fā)現(xiàn)這些問題,牽頭協(xié)調(diào)各業(yè)務(wù)部門,理順各方的關(guān)系,通過多方聯(lián)動(dòng)來提升運(yùn)營效率。
三、為各類客戶進(jìn)行賦能
運(yùn)維人員可提供服務(wù)的客戶有四類:最終用戶、業(yè)務(wù)部門、開發(fā)部門、管理者。通過保證系統(tǒng)穩(wěn)定運(yùn)行和快速應(yīng)急響應(yīng)為最終用戶提供良好的體驗(yàn);通過提供數(shù)據(jù)服務(wù)和可視化為業(yè)務(wù)部門開展?fàn)I銷和決策進(jìn)行賦能;通過非功能規(guī)范和新技術(shù)架構(gòu)探討對研發(fā)人員創(chuàng)造良好便捷的開發(fā)環(huán)境進(jìn)行賦能;通過運(yùn)維大數(shù)據(jù)分析進(jìn)行系統(tǒng)容量管理、系統(tǒng)性能優(yōu)化、管理流程提升為管理者進(jìn)行賦能。當(dāng)然,我們也可以通過構(gòu)建智能運(yùn)維平臺(tái)對自我進(jìn)行賦能,以更加高效地完成運(yùn)維工作,確保系統(tǒng)穩(wěn)定運(yùn)行。
通過自身價(jià)值的實(shí)現(xiàn),運(yùn)維人可以活得更有尊嚴(yán),這尊嚴(yán)來源于對業(yè)務(wù)發(fā)展的支持,來源于渾厚的技術(shù)實(shí)力。運(yùn)維部門需要在思維方式、制度創(chuàng)新、部門職責(zé)、工具平臺(tái)、技能五個(gè)方面進(jìn)行創(chuàng)新和轉(zhuǎn)型,這五個(gè)方面既具有公司整體推進(jìn)的特征,又強(qiáng)調(diào)部門的特殊性。運(yùn)維人可以從自己的小環(huán)境做起,規(guī)避“等靠要”的思想,敢為人先,勇立潮頭。
首先,運(yùn)維人應(yīng)當(dāng)在思維上進(jìn)行轉(zhuǎn)變
運(yùn)維人往往面臨雙重壓力,一方面是監(jiān)管部門和公司對安全穩(wěn)定運(yùn)行不斷地提高要求,另一方面則是業(yè)務(wù)的快速發(fā)展帶來很大的運(yùn)維壓力,應(yīng)用版本變更頻繁,各類缺陷經(jīng)常出現(xiàn),而運(yùn)維部門對開發(fā)部門約束無力。運(yùn)維人員經(jīng)常處于安全穩(wěn)定運(yùn)行和支持業(yè)務(wù)快速發(fā)展的矛盾漩渦之中。
當(dāng)你站到公司的角度去看問題時(shí),這兩個(gè)看似相互矛盾的要求又變成合理了。業(yè)務(wù)發(fā)展要依靠一個(gè)穩(wěn)定的后臺(tái)支撐,給客戶一個(gè)良好的體驗(yàn),而公司要在市場上立足就必須不斷地推陳出新,與競爭對手比速度、比創(chuàng)新,這樣公司才能夠生存下來,保留進(jìn)一步發(fā)展的機(jī)會(huì)。運(yùn)維人作為公司的一員,應(yīng)當(dāng)服從和服務(wù)于公司的總體目標(biāo),保質(zhì)保量地完成相關(guān)工作。當(dāng)然,有效地約束機(jī)制也是十分必要的,盲目地?cái)U(kuò)張也會(huì)給公司的發(fā)展帶來隱患。
事實(shí)上,整個(gè)公司上上下下的思維都需要進(jìn)行創(chuàng)新,從原來的留痕文化、免責(zé)文化向創(chuàng)新文化、服務(wù)文化轉(zhuǎn)變。運(yùn)維部門應(yīng)當(dāng)要強(qiáng)化服務(wù)的意識,更好地為客戶服務(wù),為業(yè)務(wù)部門提供穩(wěn)定的業(yè)務(wù)發(fā)展環(huán)境,為開發(fā)部門提供順暢的環(huán)境支持,為運(yùn)維人員提供和諧的工作環(huán)境。只有解決了思想觀念問題,后面的問題才會(huì)迎刃而解。
其次,運(yùn)維人要關(guān)注制度創(chuàng)新
在制度創(chuàng)新上,最關(guān)鍵的是考核,屁股決定腦袋,考核就是指揮棒。目前,運(yùn)維部門的考核是安全穩(wěn)定運(yùn)行,這是非常必要的,但是僅僅做好穩(wěn)定運(yùn)行又是遠(yuǎn)遠(yuǎn)不夠的。
人都是趨利避害的,做過運(yùn)維的人都知道,對安全穩(wěn)定運(yùn)行很大的威脅就是變更,只要控制住變更,系統(tǒng)運(yùn)行不會(huì)出現(xiàn)大的問題,每年兩會(huì)期間變更封板的效果就說明了這一切。然而,沒有變更就沒有競爭力的提升,就沒有業(yè)務(wù)快速發(fā)展,如何讓運(yùn)維部門也主動(dòng)擁抱變更也是一個(gè)非??简?yàn)智力的問題。
其實(shí),有些公司曾經(jīng)做過一些有益的嘗試,在部門考核時(shí),安全穩(wěn)定運(yùn)行占六十分,創(chuàng)新占二十分。做好穩(wěn)定運(yùn)行只能算及格,但是如果穩(wěn)定運(yùn)行出了問題,一定是不及格。運(yùn)維部門要在穩(wěn)定運(yùn)行和應(yīng)用變更之間進(jìn)行權(quán)衡。我們可以看到運(yùn)維部門積極迎接這些變化,向前邁出了可喜的一大步。
當(dāng)然,“沒有責(zé)任的權(quán)力是魔鬼,沒有權(quán)力的責(zé)任是地獄”,運(yùn)維部門應(yīng)當(dāng)對開發(fā)部門甚至管理部門進(jìn)行有效地考核,避免職責(zé)和權(quán)利不對稱的問題。
然后是部門職責(zé)
運(yùn)維部門是運(yùn)營和維護(hù)研發(fā)中心生產(chǎn)的產(chǎn)品。由于時(shí)間緊任務(wù)重、市場營銷壓力大等原因,公司常常在業(yè)務(wù)需求還需進(jìn)一步完善、測試沒有完全到位的情況下,進(jìn)行了應(yīng)用開發(fā)和投產(chǎn)上線,這給安全運(yùn)行帶來了一些隱患。
運(yùn)維人員在保障系統(tǒng)穩(wěn)定運(yùn)行的基礎(chǔ)上,積極參與應(yīng)用系統(tǒng)的設(shè)計(jì)、測試等工作,熟悉應(yīng)用系統(tǒng)的整體架構(gòu)和實(shí)現(xiàn)方式,利用自己的經(jīng)驗(yàn)提出風(fēng)險(xiǎn)整改和系統(tǒng)優(yōu)化建議,并把這些建議總結(jié)提煉成非功能規(guī)范,供開發(fā)部門在開發(fā)過程中提前規(guī)劃。運(yùn)維人員還應(yīng)當(dāng)積極跟蹤業(yè)界發(fā)展趨勢,使用新的技術(shù)架構(gòu)來解決運(yùn)維和開發(fā)中遇到的困難。
這樣,項(xiàng)目一投產(chǎn)就像一架帶有四個(gè)發(fā)動(dòng)機(jī)、自動(dòng)駕駛裝置的飛機(jī),任何部位發(fā)生故障都可以自動(dòng)規(guī)避和自動(dòng)處理。此外,運(yùn)維部門應(yīng)當(dāng)開展運(yùn)維大數(shù)據(jù)分析,為業(yè)務(wù)部門的營銷和決策提供詳實(shí)可靠的依據(jù)。
接下來是工具平臺(tái)
“工欲善其事,必先利其器”, 運(yùn)維人員應(yīng)當(dāng)擯棄刀耕火種的方式,集中力量構(gòu)建智能運(yùn)維平臺(tái),通過智能運(yùn)維平臺(tái)對所管理的系統(tǒng)進(jìn)行有效地管理,達(dá)到事半功倍的效果。智能運(yùn)維平臺(tái)的優(yōu)劣已經(jīng)上升為衡量運(yùn)維管理水平的重要指標(biāo),只有在智能平臺(tái)上不斷進(jìn)行探索和積累,才能強(qiáng)化其功能和效用,以便實(shí)現(xiàn)數(shù)字化、自動(dòng)化和智能化管理的目標(biāo)。
最后也是十分關(guān)鍵的是人
人都是有局限性的,又是潛力無窮的。職責(zé)分工決定了他的工作內(nèi)容和知識結(jié)構(gòu),在以往,運(yùn)維工程師負(fù)責(zé)設(shè)備和系統(tǒng)安裝、應(yīng)用環(huán)境構(gòu)建、運(yùn)維支持等工作,很少碰開發(fā)。世界是發(fā)展變化的,現(xiàn)在不會(huì)做開發(fā)的運(yùn)維工程師在逐漸消亡,取而代之的是運(yùn)維開發(fā)工程師,通過編寫腳本程序、構(gòu)建運(yùn)維平臺(tái)來實(shí)現(xiàn)運(yùn)維工作。同時(shí),熟悉應(yīng)用架構(gòu)和業(yè)務(wù)知識,對于應(yīng)用系統(tǒng)的運(yùn)維很有裨益,也是運(yùn)維人員積極努力的方向。由于知識結(jié)構(gòu)比較單一,運(yùn)維人員對轉(zhuǎn)型往往信心不足。其實(shí),只要你勇敢地跨出去,付諸行動(dòng),任何困難都是紙老虎。
目前新的技術(shù)理論層出不窮,新的技術(shù)架構(gòu)日新月異。只要運(yùn)維人以開放的心態(tài)去擁抱這些變化,并把這些新技術(shù)新架構(gòu)應(yīng)用到實(shí)際工作中,解決工作中遇到的問題和難點(diǎn),就能牢牢控制未來發(fā)展的方向。我們既要堅(jiān)持戰(zhàn)術(shù)的正確性和敏捷性,更要重視戰(zhàn)略上的前瞻性。只有當(dāng)自己足夠強(qiáng)大了,運(yùn)維人才會(huì)不懼外界的挑戰(zhàn),贏得開發(fā)人員甚至業(yè)務(wù)人員的尊重。我們運(yùn)維人要說,進(jìn)一步海闊天空!