論IT運(yùn)維的“功守道”
一日馬師傅走在大街上,見(jiàn)綠草紅花掩映間有華山二字。他雙目微合,開(kāi)始了與各大武林高手對(duì)決的巔峰時(shí)刻……馬云的《功守道》講述了一個(gè)關(guān)于太極的故事。
那么為什么要叫“功守道”,而不直接叫太極呢?看過(guò)的人也不一定可以悟到,馬師傅心中的功守道并非一種新型的武術(shù),而是用功夫守護(hù)自己想要保護(hù)的人、事、物。說(shuō)到此,IT運(yùn)維也有最需保護(hù)的“務(wù)”,這就是“業(yè)務(wù)”。
“事前管理”不是口號(hào),故障糾纏猶如“群口相聲”
保障關(guān)鍵業(yè)務(wù)的穩(wěn)定運(yùn)行,做到防患于未然,不把“事前管理”弄成口號(hào),這永遠(yuǎn)是個(gè)挑戰(zhàn)!
這是因?yàn)?,在業(yè)務(wù)系統(tǒng)運(yùn)維過(guò)程中,IT人員將會(huì)遭遇各種困惑,這包括業(yè)務(wù)系統(tǒng)自身、業(yè)務(wù)系統(tǒng)之間、業(yè)務(wù)系統(tǒng)外部等諸多因素。
業(yè)務(wù)系統(tǒng)自身還會(huì)有麻煩嗎?面對(duì)這樣的問(wèn)題,許多運(yùn)維人員會(huì)說(shuō):“會(huì)出,而且很多。” 這就比如一套視頻會(huì)議系統(tǒng),視頻傳輸不穩(wěn)定、斷斷續(xù)續(xù)、畫(huà)面卡頓、花屏、不流暢、影音不同步,這些問(wèn)題隨時(shí)都可能在會(huì)議過(guò)程中出現(xiàn)。但由于缺乏問(wèn)題分析手段、工具,運(yùn)維人員無(wú)法了解業(yè)務(wù)的實(shí)時(shí)狀態(tài),同時(shí)又因?yàn)槿鄙俳y(tǒng)一的業(yè)務(wù)數(shù)據(jù)關(guān)聯(lián)分析,看到故障卻更難以定位,只憑 “經(jīng)驗(yàn)”去解決問(wèn)題,既耗時(shí)又耗力。
上面這些還只是業(yè)務(wù)系統(tǒng)內(nèi)部的問(wèn)題,還不算業(yè)務(wù)系統(tǒng)外部那些網(wǎng)絡(luò)攻擊、違規(guī)事件、病毒事件、越權(quán)事件。當(dāng)然,如果單純只算上“內(nèi)外”兩方面的原因,運(yùn)維人員還能勉強(qiáng)維持,而一旦問(wèn)題出在業(yè)務(wù)系統(tǒng)之間,運(yùn)維場(chǎng)景就真成了“群口相聲”了。
業(yè)務(wù)A:你們?cè)趺从譀](méi)有發(fā)送數(shù)據(jù)?
業(yè)務(wù)B:大哥,我已經(jīng)發(fā)送了數(shù)據(jù),是你又沒(méi)處理,好摸!
業(yè)務(wù)C:你怎么每天半夜12點(diǎn)不送數(shù)據(jù)了?
業(yè)務(wù)D:?。课覄偵?jí)系統(tǒng)了,沒(méi)人告訴我有這個(gè)接口呀,需要給你送數(shù)據(jù)?啊?
這里太亂,我想靜靜!
運(yùn)維人心中的“功守道”:三重保障
在《馬云三修》中曾經(jīng)提到:“在太極里,我最欣賞的三個(gè)字是定、隨、舍。
定即是看清自己和將來(lái)的趨勢(shì),不管發(fā)生任何事情,都要鎮(zhèn)定面對(duì);隨,只有自己有實(shí)力的時(shí)候,才能懂得怎么去跟隨別人;舍能讓人看清自己,只有知道自己要什么,才能知道要放棄什么。”
腦洞開(kāi)一下,把“三修”落到IT運(yùn)維領(lǐng)域,或許能幫助運(yùn)維人找到他們的“功守道”。最起碼要做到“看清自己和將來(lái)的趨勢(shì)”。
在目前這個(gè)IT技術(shù)大發(fā)展的時(shí)代,側(cè)重于網(wǎng)絡(luò)、服務(wù)器等基礎(chǔ)設(shè)備的早期運(yùn)維方式正在經(jīng)歷升級(jí)換代,越來(lái)越多的企業(yè)已經(jīng)將關(guān)注點(diǎn)從單一網(wǎng)絡(luò)轉(zhuǎn)變到當(dāng)前的業(yè)務(wù)系統(tǒng),落實(shí)保障業(yè)務(wù)系統(tǒng)的各個(gè)環(huán)節(jié)已經(jīng)成為運(yùn)維工作的大核心。
基于上述需求,北塔軟件推出了以業(yè)務(wù)保障為核心的新一代智慧運(yùn)維平臺(tái)BTDO。
不過(guò),我們今天不講這個(gè)“硬件盒子”的性能和操作(有需要的,去看產(chǎn)品白皮書(shū)補(bǔ)腦),BTDO體現(xiàn)出來(lái)“三重保護(hù)”才是重點(diǎn)。
- 自診斷:業(yè)務(wù)系統(tǒng)內(nèi)部運(yùn)行狀態(tài)
自診斷,是講運(yùn)維系統(tǒng)能夠自動(dòng)診斷出業(yè)務(wù)系統(tǒng)的運(yùn)行隱患,比如監(jiān)控到業(yè)務(wù)系統(tǒng)中軟硬件配置、性能、流量等幾千種指標(biāo),根據(jù)這些指標(biāo)反映出業(yè)務(wù)系統(tǒng)“卡、斷、慢”的原因。而落到“三修”中去理解,就是“看清自己和將來(lái)的趨勢(shì)”。
并且這里的“看”還有非常特色,用到了我們?nèi)粘I钪械?ldquo;警示牌”,運(yùn)維人員可以非常直觀的看到這些警示牌,同時(shí)利用覆蓋業(yè)務(wù)系統(tǒng)全過(guò)程的運(yùn)行狀態(tài),溯源、關(guān)聯(lián)、分析等精準(zhǔn)數(shù)據(jù),自動(dòng)定位到故障點(diǎn)。
- 自學(xué)習(xí):業(yè)務(wù)系統(tǒng)之間接口規(guī)律
隨著企業(yè)業(yè)務(wù)的不斷發(fā)展和分化,許多業(yè)務(wù)系統(tǒng)的接口越來(lái)越繁雜,協(xié)調(diào)越來(lái)越困難,為減少相互羈絆,就迫切需要一個(gè)統(tǒng)一自動(dòng)化的分析工具,說(shuō)白了相當(dāng)是一個(gè)專(zhuān)門(mén)負(fù)責(zé)監(jiān)控接口的“機(jī)器人”。
北塔軟件的做法是采用了大數(shù)據(jù)分析處理技術(shù),再配合一個(gè)“獨(dú)家秘方”的業(yè)務(wù)接口通信規(guī)律算法,在無(wú)須人工干預(yù)的情況下,自動(dòng)梳理業(yè)務(wù)間存在的接口、自動(dòng)學(xué)習(xí)業(yè)務(wù)間接口通信規(guī)律、自動(dòng)發(fā)現(xiàn)業(yè)務(wù)間接口通信異常。
- 自識(shí)別:業(yè)務(wù)系統(tǒng)外部安全風(fēng)險(xiǎn)
這個(gè)年頭什么“最值錢(qián)”?馬云也曾撩過(guò)各位,答案是“數(shù)據(jù)”,而這些數(shù)據(jù)就在企業(yè)的核心業(yè)務(wù)系統(tǒng)里面。因此,能夠自動(dòng)識(shí)別業(yè)務(wù)系統(tǒng)外部安全風(fēng)險(xiǎn),自動(dòng)對(duì)網(wǎng)絡(luò)流量進(jìn)行7*24小時(shí)不間斷監(jiān)控,發(fā)現(xiàn)異常行為并自動(dòng)觸發(fā)告警……這些功能,對(duì)于運(yùn)維人員來(lái)說(shuō)就顯得萬(wàn)分有用了。
比如:自學(xué)習(xí)生成業(yè)務(wù)訪問(wèn)白名單,一旦發(fā)現(xiàn)未經(jīng)許可的IP訪問(wèn)敏感業(yè)務(wù),然后“掛牌”;出現(xiàn)異常業(yè)務(wù)訪問(wèn)流量,或是發(fā)現(xiàn)生產(chǎn)和辦公兩個(gè)區(qū)偷偷“約會(huì)”的流量,然后“掛牌”;守護(hù)重點(diǎn)設(shè)備協(xié)議端口,發(fā)現(xiàn)有不法分子訪問(wèn)重點(diǎn)設(shè)備的非公開(kāi)協(xié)議端口,然后“掛牌”。
結(jié)合這部22分鐘的《功守道》,我們說(shuō)了這么多IT運(yùn)維的理念,只想與各位同道共省:運(yùn)維人員一定要跟上這個(gè)時(shí)代,要做什么樣的“功”,才能“守”住自己的“道”?是我們應(yīng)該不斷追問(wèn)自己,并著力尋求答案的重要問(wèn)題。