后疫情時(shí)代,AIOps釋放企業(yè)運(yùn)維新活力
原創(chuàng)【51CTO.com原創(chuàng)稿件】2020年注定是不平凡的一年,在新冠疫情的沖擊下,幾乎每個(gè)人的生活都或多或少被改變,企業(yè)的運(yùn)維也不例外——當(dāng)遠(yuǎn)程辦公成為常態(tài),企業(yè)運(yùn)維人員實(shí)際到崗率在下降,設(shè)備一旦出現(xiàn)故障,故障的診斷與維修時(shí)間都大大延長(zhǎng),企業(yè)對(duì)于遠(yuǎn)程管理、自動(dòng)化運(yùn)維、智能分析等運(yùn)維需求在2020年呈現(xiàn)急劇上揚(yáng)的趨勢(shì)。在年終歲尾的12月,51CTO記者采訪了東華軟件股份公司網(wǎng)絡(luò)技術(shù)事業(yè)部方案中心總經(jīng)理曹榮海,請(qǐng)他分享企業(yè)運(yùn)維在后疫情時(shí)代新的發(fā)展態(tài)勢(shì),以及AIOps如何賦能企業(yè)運(yùn)維新需求。
企業(yè)運(yùn)維向“AI智能運(yùn)維”演進(jìn),AIOps成賦能利器
曹榮海告訴記者,2020年受疫情刺激,企業(yè)線上應(yīng)用規(guī)模不斷膨脹,技術(shù)復(fù)雜程度與應(yīng)用流量都在不斷增加,業(yè)務(wù)變更頻繁的同時(shí)風(fēng)險(xiǎn)也隨之越來(lái)越高。“企業(yè)正在從傳統(tǒng)的‘穩(wěn)態(tài)運(yùn)維’向‘自動(dòng)化運(yùn)維’過(guò)度,未來(lái)向‘AI智能運(yùn)維’轉(zhuǎn)變將成為一種必然。”
他解釋道,傳統(tǒng)的穩(wěn)態(tài)運(yùn)維通常看重的是系統(tǒng)運(yùn)行穩(wěn)定且安全,運(yùn)維支撐的成本要合理。而如今“自動(dòng)化運(yùn)維”的運(yùn)維模式則更側(cè)重快速定位故障點(diǎn),能夠基于不同場(chǎng)景執(zhí)行批量作業(yè),具有自動(dòng)恢復(fù)業(yè)務(wù)的能力,從而保障業(yè)務(wù)連續(xù)性。而曹榮海之所以將未來(lái)的企業(yè)運(yùn)維明確地鎖定在“AI智能運(yùn)維”方向上,是因?yàn)樗吹皆诖髷?shù)據(jù)時(shí)代,智能運(yùn)維可以將運(yùn)維工作中監(jiān)控、管理和故障定位這最重要的三部分內(nèi)容,利用機(jī)器學(xué)習(xí)算法將其有機(jī)結(jié)合,把運(yùn)維人員從紛繁復(fù)雜的海量告警中解脫出來(lái),并通過(guò)機(jī)器自學(xué)習(xí)設(shè)置動(dòng)態(tài)數(shù)據(jù)基線,準(zhǔn)確定位故障源,給出運(yùn)維決策,并且提前規(guī)劃好各種資源容量,真正保障業(yè)務(wù)高速發(fā)展。
而在企業(yè)運(yùn)維向“AI智能運(yùn)維”演進(jìn)的道路上,AIOps是非常重要的賦能利器。當(dāng)記者問(wèn)及曹榮海為何AIOps理念誕生已久,但在2020年才逐漸呈現(xiàn)出“爆款”潛質(zhì)時(shí),曹榮海表示如今企業(yè)數(shù)據(jù)中心的系統(tǒng)物理架構(gòu)和軟件架構(gòu)既龐大又復(fù)雜,AI數(shù)據(jù)算法承擔(dān)的是運(yùn)維大腦的角色,而大數(shù)據(jù)處理平臺(tái)就是運(yùn)維的雙手。“要想實(shí)現(xiàn)智能運(yùn)維,這兩樣缺一不可,隨著大數(shù)據(jù)技術(shù)的不斷成熟和AI數(shù)據(jù)算法的推廣,AIOps才逐漸變成了可行。”他坦言,雖然至今很多行業(yè)的運(yùn)維智能化成果還在不斷迭代和優(yōu)化中,但依然能夠?yàn)檫\(yùn)維帶來(lái)很多價(jià)值。
全程可視化管理,東華AIOps讓運(yùn)維更智能
在曹榮海看來(lái),AIOps需要很多技術(shù)做支撐,如數(shù)據(jù)融合(大數(shù)據(jù)分析)、人工智能(機(jī)器算法)、運(yùn)維效率(自動(dòng)化調(diào)度)、數(shù)據(jù)+可視化管理(可視化管理)等技術(shù)。這些技術(shù)可以幫助企業(yè)實(shí)現(xiàn)運(yùn)維規(guī)范化管理、智能管控、運(yùn)維自動(dòng)化、IT綜合監(jiān)控等智能化功能,為企業(yè)運(yùn)維人員打造一個(gè)全程可視化的管理平臺(tái),深入洞察設(shè)備運(yùn)行態(tài)勢(shì)、運(yùn)維人員態(tài)勢(shì)、業(yè)務(wù)應(yīng)用狀態(tài)等環(huán)節(jié)。
記者了解到,東華軟件對(duì)于AIOps的思考與探索已經(jīng)隨著東華AIOps解決方案的落地而在不斷完善。在智能化運(yùn)維踐行過(guò)程中,東華AIOps解決方案一直堅(jiān)持追求“快、穩(wěn)、準(zhǔn)”的實(shí)際落地效果。曹榮海介紹到,東華軟件通過(guò)AIOps幫助客戶實(shí)現(xiàn)了真正的智能化運(yùn)維,在不同的運(yùn)維場(chǎng)景下,通過(guò)動(dòng)態(tài)可視化的方式來(lái)實(shí)現(xiàn)自動(dòng)應(yīng)對(duì)故障、自動(dòng)變更、智能擴(kuò)容等實(shí)用功能。目前,借助AIOps平臺(tái)自身的關(guān)聯(lián)分析、機(jī)器學(xué)習(xí)、數(shù)據(jù)建模、全局搜索能力,東華軟件已經(jīng)能夠幫助客戶從IT系統(tǒng)的行為、狀態(tài)、配置、故障和事件中等多個(gè)維度進(jìn)行運(yùn)維數(shù)據(jù)分析,產(chǎn)生性能趨勢(shì)預(yù)判、快速故障定位和商業(yè)洞察等價(jià)值。
他以最常見(jiàn)的精準(zhǔn)告警場(chǎng)景為例:東華軟件的AIOps解決方案可以實(shí)時(shí)采集各類運(yùn)維數(shù)據(jù),包括日志、監(jiān)控系統(tǒng)告警、性能數(shù)據(jù)等,并通過(guò)匹配的機(jī)器算法對(duì)歷史數(shù)據(jù)的挖掘和歸因分析,AIOps 可以找出哪些告警和事件是頻繁一起出現(xiàn)的,并將其看作同一類故障的告警,從而把多個(gè)告警和指標(biāo)進(jìn)行合并,推送給運(yùn)維人員,做到精細(xì)化告警定位,避免傳統(tǒng)監(jiān)控工具因一個(gè)故障而導(dǎo)致的告警風(fēng)暴,生產(chǎn)告警噪音。
AIOps未來(lái)騰飛仍需沖破兩道關(guān)
在2020年,東華軟件AIOps的身影出現(xiàn)在很多行業(yè)市場(chǎng),例如在年初抗疫第一線的雷神山、火神山、小湯山等醫(yī)院里,東華員工就曾通過(guò)部署遠(yuǎn)程化、可視化的智能運(yùn)維設(shè)備鼎力支持國(guó)家抗疫工作。東華軟件AIOps解決方案中的平臺(tái)場(chǎng)景實(shí)現(xiàn)、故障預(yù)測(cè)/恢復(fù)、告警溯源分析、告警生態(tài)圈等功能更是經(jīng)受住了疫情帶來(lái)的嚴(yán)峻運(yùn)維考驗(yàn)。
曹榮海表示,AIOps在國(guó)內(nèi)落地普及已呈大勢(shì)所趨,電力、運(yùn)營(yíng)商、工業(yè)制造等行業(yè)都在嘗試AIOps平臺(tái)落地。不過(guò)AIOps領(lǐng)域還缺少相關(guān)的國(guó)家和行業(yè)標(biāo)準(zhǔn),例如原有的運(yùn)維產(chǎn)品和方案投入該如何有機(jī)集成到AIOps中,這需要更加規(guī)范才有利于產(chǎn)業(yè)化發(fā)展。此外如何最大程度的利用運(yùn)維數(shù)據(jù)來(lái)驅(qū)動(dòng)業(yè)務(wù)價(jià)值、創(chuàng)建更精細(xì)的運(yùn)維場(chǎng)景、提高運(yùn)營(yíng)能力也是AIOps發(fā)展過(guò)程中急需考慮的問(wèn)題。“東華軟件將繼續(xù)探索AIOps在企業(yè)運(yùn)維中的價(jià)值,為企業(yè)智能運(yùn)維演進(jìn)挖掘出更加完善的AIOps運(yùn)維場(chǎng)景。”
想了解曹榮海專家更多精彩內(nèi)容,點(diǎn)擊進(jìn)入:
http://www.scjtxx.cn/act/jiangxin/dhwzAIOps
【51CTO原創(chuàng)稿件,合作站點(diǎn)轉(zhuǎn)載請(qǐng)注明原文作者和出處為51CTO.com】