AIOps實(shí)踐三板斧:從可視化、自動(dòng)化到智能化
原創(chuàng)2018年5月18-19日,由51CTO主辦的全球軟件與運(yùn)維技術(shù)峰會(huì)在北京召開(kāi)。此次峰會(huì)圍繞人工智能、大數(shù)據(jù)、物聯(lián)網(wǎng)、區(qū)塊鏈等12大核心熱點(diǎn),匯聚海內(nèi)外60位一線專(zhuān)家,是一場(chǎng)高端的技術(shù)盛宴,也是***IT技術(shù)人才學(xué)習(xí)和人脈拓展不容錯(cuò)過(guò)的平臺(tái)。
在“容器下的AIOps”分會(huì)場(chǎng),新炬網(wǎng)絡(luò)董事、副總經(jīng)理程永新做了主題為《AIOps實(shí)踐三板斧:從可視化、自動(dòng)化到智能化》的精彩演講。程永新從事運(yùn)維管理工作近二十年,歷經(jīng)了IT技術(shù)架構(gòu)、運(yùn)維管理模式與工具的變遷,本次演講闡述了企業(yè)級(jí)AIOps的演進(jìn)路線,從實(shí)際場(chǎng)景進(jìn)行突破,圍繞AIOps落地展開(kāi)。
AIOps平臺(tái)產(chǎn)品化之難何以突破
在移動(dòng)化、大數(shù)據(jù)、云計(jì)算、人工智能等新技術(shù)的推動(dòng)下, IT技術(shù)架構(gòu)悄然變遷, 從傳統(tǒng)“IOE架構(gòu)”走向“互聯(lián)網(wǎng)架構(gòu)”?;ヂ?lián)網(wǎng)架構(gòu)所涉及的網(wǎng)元數(shù)、技術(shù)棧、服務(wù)數(shù)等元素成倍劇增,使得運(yùn)維壓力越來(lái)越大。這樣的趨勢(shì)下,運(yùn)維管理模式從ITIL向DevOps演化,運(yùn)維管理工具也發(fā)生了從ITOM、ITOA到AIOps的顛覆性變革。
雖然Gartner給出了AIOps平臺(tái)市場(chǎng)指南,但是依照數(shù)據(jù)管理、模式算法、場(chǎng)景驅(qū)動(dòng)這三要素進(jìn)行,AIOps平臺(tái)就能實(shí)現(xiàn)落地嗎?其實(shí)不然。在這個(gè)過(guò)程中會(huì)遇到多重困難:其一,擅長(zhǎng)開(kāi)發(fā)的開(kāi)發(fā)人員不擅長(zhǎng)運(yùn)維,擅長(zhǎng)運(yùn)維的運(yùn)維人員不擅長(zhǎng)開(kāi)發(fā);其二,規(guī)模不一的諸多歷史系統(tǒng)縱向經(jīng)歷過(guò)幾次迭代、橫向經(jīng)歷過(guò)多大規(guī)模,是否能與AIOps***兼容?其三,AIOps平臺(tái)產(chǎn)品化需要既能兼顧歷史與未來(lái)需求,又能滿足靜態(tài)穩(wěn)定與敏捷發(fā)展需要,還要能跨越規(guī)模與行業(yè)的界限。
新炬網(wǎng)絡(luò)自2006年成立至今,一直在為電信、電力、航空、金融等大型企事業(yè)單位提供運(yùn)維管理服務(wù)。結(jié)合行業(yè)實(shí)踐經(jīng)驗(yàn),程永新提出了AIOps落地三板斧:從可視化、自動(dòng)化到智能化,以新炬網(wǎng)絡(luò)建設(shè)AIOps智能運(yùn)維平臺(tái)做示例,證實(shí)了場(chǎng)景驅(qū)動(dòng)是實(shí)現(xiàn)AIOps落地的***方式。
AIOps落地三板斧之可視化
可視化為何如此重要,成為***板斧?原因在于可度量是一切管理的開(kāi)始,可視化是管理結(jié)果的呈現(xiàn)。在AIOps落地過(guò)程中,不可或缺的環(huán)節(jié)是盡可能量化更多的指標(biāo),并且實(shí)現(xiàn)指標(biāo)可視化。在這個(gè)過(guò)程中,企業(yè)需要構(gòu)建立體的可視化監(jiān)控體系,進(jìn)而實(shí)現(xiàn)從業(yè)務(wù)到資源的立體、深度關(guān)聯(lián)分析。
圖1新炬網(wǎng)絡(luò)可視化智能監(jiān)控體系框架圖
如圖1所示,新炬網(wǎng)絡(luò)的智能監(jiān)控告警系統(tǒng)通過(guò)對(duì)操作系統(tǒng)、數(shù)據(jù)庫(kù)、虛擬化、網(wǎng)絡(luò)設(shè)備、中間件、存儲(chǔ)等進(jìn)行統(tǒng)一數(shù)據(jù)采集,讓用戶通過(guò)監(jiān)控大屏即可實(shí)時(shí)查看系統(tǒng)各指標(biāo)情況。此外,通過(guò)智能算法構(gòu)建的可視化健康度模型,還將系統(tǒng)監(jiān)控簡(jiǎn)化成智能打分形式,簡(jiǎn)化監(jiān)控決策。
AIOps落地三板斧之自動(dòng)化
AIOps落地的第二步是自動(dòng)化,對(duì)于大量的頻繁操作,如安裝、部署、補(bǔ)丁下發(fā)、巡檢操作等,都可以用自動(dòng)化的方式來(lái)減少運(yùn)維人員的工作量。
AIOps場(chǎng)景:故障分析自動(dòng)化
圖2 實(shí)時(shí)故障路徑分析
如圖2所示,在自動(dòng)化處理過(guò)程中引入大數(shù)據(jù)和智能分析能力,實(shí)現(xiàn)運(yùn)維實(shí)時(shí)故障路徑分析、快速定位故障的能力,并能對(duì)復(fù)雜系統(tǒng)的“點(diǎn)、線、面”故障影響度進(jìn)行分析。
AIOps場(chǎng)景:數(shù)據(jù)庫(kù)運(yùn)維自動(dòng)化
圖3 數(shù)據(jù)庫(kù)智能運(yùn)維與智能SQL優(yōu)化
所有的PaaS核心在于數(shù)據(jù)庫(kù),而數(shù)據(jù)庫(kù)運(yùn)維的工作又在整個(gè)生產(chǎn)運(yùn)維中占非常大的比重。如圖3所示,新炬網(wǎng)絡(luò)針對(duì)性地推出了DPM數(shù)據(jù)庫(kù)智能運(yùn)維平臺(tái),目前已經(jīng)支持Oracle、DB2、MySQL、SQL Server等多種常見(jiàn)數(shù)據(jù)庫(kù),實(shí)現(xiàn)一個(gè)平臺(tái)多種數(shù)據(jù)庫(kù)的智能運(yùn)維管理,可快速發(fā)現(xiàn)問(wèn)題、定位問(wèn)題、提供優(yōu)化建議,還可以對(duì)應(yīng)用版本變更過(guò)程引發(fā)的SQL問(wèn)題,提出針對(duì)性的優(yōu)化建議、對(duì)高危SQL進(jìn)行自動(dòng)識(shí)別與審核,降低應(yīng)用上線帶來(lái)的風(fēng)險(xiǎn)。
AIOps落地三板斧之智能化
走過(guò)了可視化、自動(dòng)化階段,就解決了企業(yè)80%的運(yùn)維問(wèn)題,那么接下來(lái)如何走向智能化?突破口在于場(chǎng)景驅(qū)動(dòng)。新炬網(wǎng)絡(luò)根據(jù)自身在企業(yè)級(jí)運(yùn)維服務(wù)市場(chǎng)深耕十余年的經(jīng)驗(yàn),總結(jié)出智能巡檢、資源管理、應(yīng)用容量、網(wǎng)絡(luò)安全、用戶體驗(yàn)、故障診斷、容災(zāi)切換、安全審計(jì)這八大運(yùn)維場(chǎng)景,均可從自動(dòng)化走向智能化。
圖4 智能化落地前提:運(yùn)維大數(shù)據(jù)
如圖4所示,程永新特別強(qiáng)調(diào)了運(yùn)維大數(shù)據(jù)的關(guān)鍵作用,它是智能化落地的前提。以新炬網(wǎng)絡(luò)為例,當(dāng)有了統(tǒng)一采集、多維立體的可視化監(jiān)控體系,實(shí)現(xiàn)了八大運(yùn)維場(chǎng)景自動(dòng)化之后,基于新炬網(wǎng)絡(luò)自主研發(fā)的IVORY大數(shù)據(jù)日志分析平臺(tái),發(fā)力AIOps實(shí)時(shí)運(yùn)維數(shù)據(jù)分析,從而實(shí)現(xiàn)故障的提前預(yù)警、異常隱患的及時(shí)發(fā)現(xiàn)及趨勢(shì)分析。IVORY結(jié)合了多年的行業(yè)運(yùn)維經(jīng)驗(yàn)沉淀,逐步探索出了告警自愈、故障自動(dòng)恢復(fù)等能力,并在移動(dòng)運(yùn)營(yíng)商和金融行業(yè)實(shí)現(xiàn)了生產(chǎn)實(shí)踐。
新炬網(wǎng)絡(luò)AIOps企業(yè)級(jí)實(shí)踐與演進(jìn)路線
新炬網(wǎng)絡(luò)AIOps企業(yè)級(jí)實(shí)踐與演進(jìn)路線整體分為三個(gè)階段:運(yùn)維平臺(tái)基礎(chǔ)能力、運(yùn)維大數(shù)據(jù)和工具能力,以及AIOps能力及場(chǎng)景落地,每個(gè)階段的相關(guān)建設(shè)與舉措如圖5所示。
圖5 新炬網(wǎng)絡(luò)AIOps企業(yè)級(jí)實(shí)踐與演進(jìn)路線圖
在演講過(guò)程中,程永新還提及到新炬網(wǎng)絡(luò)助力多家金融企業(yè)客戶實(shí)施AIOps落地的案例,包括針對(duì)全國(guó)性商業(yè)銀行數(shù)據(jù)庫(kù)實(shí)施的智能運(yùn)維、針對(duì)金融風(fēng)控?cái)?shù)據(jù)部署的大數(shù)據(jù)分析應(yīng)用,以及為金融企業(yè)提供的整體AIOps智能運(yùn)維平臺(tái)等。在金融行業(yè)信息化建設(shè)層面,新炬網(wǎng)絡(luò)堅(jiān)持“企業(yè)級(jí)產(chǎn)品+本地化服務(wù)”的雙輪驅(qū)動(dòng)戰(zhàn)略,在其十余年大型企業(yè)運(yùn)維服務(wù)經(jīng)驗(yàn)中厚積薄發(fā),推動(dòng)金融科技創(chuàng)新、加快新技術(shù)在金融行業(yè)的應(yīng)用。