準(zhǔn)備好迎接 AIOps 時(shí)代
將組織轉(zhuǎn)變?yōu)閿?shù)字公司會(huì)遇到很多挑戰(zhàn)。缺乏專門的 IT 技能、組織變革管理、不斷變化的客戶需求和混合環(huán)境只是其中的一小部分。企業(yè)需要增強(qiáng)其 IT 運(yùn)營(yíng)(ITOps)以應(yīng)對(duì)這些挑戰(zhàn)并滿足客戶期望。
數(shù)字化轉(zhuǎn)型:AIOps 之路
未來,ITOps 將結(jié)合算法和人工智能,使 IT 系統(tǒng)的性能變得透明,并幫助他們提供無縫體驗(yàn)。
“AIOps 對(duì) IT 運(yùn)營(yíng)的長(zhǎng)期影響將是變革性的?!?—— Gartner
AIOps 對(duì)于成功的數(shù)字化轉(zhuǎn)型至關(guān)重要,可以幫助系統(tǒng)以現(xiàn)代業(yè)務(wù)所需的速度運(yùn)行。反過來,這將確定公司獲得和保持市場(chǎng)領(lǐng)先地位的速度。
現(xiàn)代 AIOps 技術(shù)在本地、云端或混合環(huán)境中提供 IT 基礎(chǔ)架構(gòu)。它們的自動(dòng)化使開發(fā)人員能夠?qū)W⒂谠O(shè)計(jì)下一代業(yè)務(wù)應(yīng)用,而不必?fù)?dān)心底層基礎(chǔ)設(shè)施。
什么是 AIOps?
AIOps 結(jié)合人工智能和機(jī)器學(xué)習(xí)來分析 IT 運(yùn)營(yíng)的數(shù)據(jù)。這是將人工智能應(yīng)用于 IT 運(yùn)營(yíng)的過程。它可以幫助組織主動(dòng)檢測(cè)錯(cuò)誤,還可以幫助運(yùn)營(yíng)團(tuán)隊(duì)在問題影響最終用戶之前預(yù)防問題。
傳統(tǒng)的 IT 管理技術(shù)已經(jīng)無法應(yīng)對(duì)數(shù)字化業(yè)務(wù)轉(zhuǎn)型。當(dāng) Gartner 創(chuàng)造 AIOps 一詞時(shí),該公司預(yù)測(cè) IT 運(yùn)營(yíng)過程將發(fā)生重大變化,組織管理其 IT 生態(tài)系統(tǒng)的方式也會(huì)發(fā)生巨大變化。
AIOps 平臺(tái)使用大數(shù)據(jù)。他們從各種 IT 運(yùn)營(yíng)和設(shè)備收集數(shù)據(jù),以自動(dòng)識(shí)別和實(shí)時(shí)響應(yīng)問題,同時(shí)仍提供傳統(tǒng)的歷史分析。然后,AIOps 使用機(jī)器學(xué)習(xí)對(duì)組合的 IT 數(shù)據(jù)執(zhí)行綜合分析。
結(jié)果是自動(dòng)化驅(qū)動(dòng)的洞察力驅(qū)使持續(xù)改進(jìn)和修復(fù)。AIOps 支持基本 IT 功能的持續(xù)集成和部署 (CI/CD)。
AIOps 的范圍是什么?
開始使用 AIOps 最初似乎具有挑戰(zhàn)性,因此最好采取循序漸進(jìn)的方法。我們需要從識(shí)別和理解 IT 運(yùn)營(yíng)數(shù)據(jù)開始。 AIOps
的核心是數(shù)據(jù)驅(qū)動(dòng)。因此,它需要訪問所有相關(guān)的操作數(shù)據(jù),包括非結(jié)構(gòu)化數(shù)據(jù)、日志、指標(biāo)、實(shí)時(shí)數(shù)據(jù)、API
輸出和設(shè)備數(shù)據(jù)。還需要結(jié)構(gòu)化的業(yè)務(wù)數(shù)據(jù),例如數(shù)據(jù)庫、社交活動(dòng)和其他關(guān)系數(shù)據(jù)。 AIOps 平臺(tái)處理的相關(guān)數(shù)據(jù)越多,他們的預(yù)測(cè)就越準(zhǔn)確。
企業(yè)需要了解他們的數(shù)據(jù)如何幫助他們解決最大的問題,無論他們身處哪個(gè)行業(yè)。他們應(yīng)該實(shí)施 AIOps 來回顧他們過去的失敗,并確定哪些數(shù)據(jù)將幫助他們找到解決方案。
數(shù)據(jù)分析可用于查找中斷或系統(tǒng)變慢的根源。然后 AIOps 平臺(tái)可用于檢測(cè)常見問題及其補(bǔ)救措施。企業(yè)可以使用收集到的結(jié)果來實(shí)施機(jī)器學(xué)習(xí)和 AI,以進(jìn)行實(shí)時(shí)監(jiān)控和自動(dòng)響應(yīng)。這整個(gè)過程幫助公司推動(dòng) AI 成熟,有效地修復(fù)錯(cuò)誤,避免停機(jī),提高效率。
圖 1:AIOps 平臺(tái)可實(shí)現(xiàn)對(duì) IT 運(yùn)營(yíng)監(jiān)控 (ITOM) 的持續(xù)洞察(來源:https://www.gartner.com/en/documents/3971186)
為什么 2022 年需要 AIOps?
隨著企業(yè)加快數(shù)字化轉(zhuǎn)型,應(yīng)用程序和系統(tǒng)架構(gòu)變得非常先進(jìn)。我們可以通過以下幾種方式見證這種復(fù)雜性:
- 組織正在從傳統(tǒng)的應(yīng)用架構(gòu)轉(zhuǎn)移到云原生、靈活和基于微服務(wù)的容器化應(yīng)用堆棧。
- 這些應(yīng)用也部署在本地、混合、公共和私有云平臺(tái)上。
隨著應(yīng)用和 IT 環(huán)境的擴(kuò)展,它們會(huì)產(chǎn)生大量數(shù)據(jù)。 IT 運(yùn)營(yíng)團(tuán)隊(duì)因無法管理的數(shù)據(jù)而筋疲力盡。但是,人工智能可以處理大量數(shù)據(jù)。隨著數(shù)據(jù)量的擴(kuò)大,將人工智能納入 IT 流程的機(jī)會(huì)要大得多。
異常檢測(cè)、分類和預(yù)測(cè)都可以通過使用機(jī)器學(xué)習(xí)和深度學(xué)習(xí)模型來完成,這些模型擅長(zhǎng)分析海量數(shù)據(jù)并提供分析。AIOps 的許多功能可幫助公司通過交互式儀表盤提供良好的用戶體驗(yàn)。
實(shí)施 AIOps 的企業(yè)報(bào)告了諸如無縫體驗(yàn)、更低的運(yùn)營(yíng)費(fèi)用、更快的客戶服務(wù)、更短的平均解決時(shí)間和更少的停機(jī)時(shí)間等好處。 AIOps 通過基于預(yù)測(cè)分析做出堅(jiān)定的決策來支持 IT 運(yùn)營(yíng)。
最后一點(diǎn)
AIOps 是 IT 運(yùn)營(yíng)分析(ITOA)的下一步。 人工智能、認(rèn)知技能和 RPA(機(jī)器人流程自動(dòng)化)用于在基礎(chǔ)設(shè)施或 IT 運(yùn)營(yíng)問題成為問題之前自動(dòng)修復(fù)它們。 自我修復(fù)系統(tǒng)是 AIOps 的最終目標(biāo)。