成功部署AIOps需要知道的7件事
從乘車算法到使用人工智能機器人的客戶服務(wù),人工智能正在被用來改善現(xiàn)代的各種服務(wù)。
AIOps是智能化運維,它指的是一個多方面的技術(shù)平臺,可以利用分析和機器學(xué)習(xí)來自動化和增強IT運營。
AIOps的工作原理是利用和收集來自一系列IT運營工具的大量多樣化數(shù)據(jù)。它這樣做是為了實時檢測和應(yīng)對問題,同時提供傳統(tǒng)的歷史分析。
如果使用得當(dāng),AIOps有多種好處,其中包括消除噪音和干擾。這意味著加快了問題的發(fā)現(xiàn)和服務(wù)問題的解決速度。
AIOps還可以消除信息孤島,并為整個IT環(huán)境提供全面的可視化,包括基礎(chǔ)設(shè)施、網(wǎng)絡(luò)應(yīng)用和存儲。
(1) 員工
在實施AIOps時,重要的是要確保你有相關(guān)的技術(shù)人員,他們了解技術(shù)和如何應(yīng)用于你的業(yè)務(wù)。你可能很幸運地雇用了已經(jīng)熟悉這個概念的人。
然而,雇用更多的數(shù)據(jù)科學(xué)和自動化專家的人員將是有用的,即使他們是遠程辦公。 通過使用市場上最好的員工管理軟件系統(tǒng),可以更容易地找到適合這些特定角色的員工。
(2) 傳播信息
最好的企業(yè)管理技巧之一,關(guān)于AIOps,是確保每個受影響的人都知道你打算做出的改變。不僅要通知你的用戶社區(qū),而且系統(tǒng)大修要影響的每個人也需要知道它將如何改變他們的角色。
例如,你可以通過舉辦網(wǎng)絡(luò)研討會或舉辦研討會來傳達這些變化,例如,如何理解系統(tǒng)的實施及其好處。
(3) 了解AIOps的功能
確保你了解系統(tǒng)的功能是什么,以及你通過實施系統(tǒng)希望得到什么結(jié)果。企業(yè)尋求的常見結(jié)果是異常檢測、事件關(guān)聯(lián)或警報和通知抑制。
強調(diào)尋求能夠被員工快速登記的結(jié)果,讓你的團隊對其有效性產(chǎn)生信心。AIOps的實施應(yīng)該是為了讓你的企業(yè)更加成功,了解它們?nèi)绾螏椭髽I(yè)是關(guān)鍵。
(4) 測試和監(jiān)控
在較小的無足輕重的工作負(fù)載上配置和啟動系統(tǒng),會讓你了解其可行性,而不會有造成損害的風(fēng)險。如果為機器學(xué)習(xí)提供信息的配置需要長時間的工作,那么可能值得重新評估其對你的業(yè)務(wù)的有效性。
在這個階段,IT操作員應(yīng)該能夠看到系統(tǒng)如何與收集到的數(shù)據(jù)進行交互,并就如何改進系統(tǒng)產(chǎn)生指導(dǎo)和分析。這是在擴展到更大的云規(guī)模數(shù)據(jù)集之前要實現(xiàn)的重要一步。
(5) 對系統(tǒng)進行指導(dǎo)
IT操作人員將能夠定義某些可預(yù)測的常規(guī)功能,AIOps系統(tǒng)應(yīng)該能夠快速處理。給系統(tǒng)設(shè)置這些任務(wù),不僅可以展示系統(tǒng)如何有效地完成補丁更新等任務(wù),還可以展示系統(tǒng)如何為人類操作人員節(jié)省時間。
(6) 安裝
假設(shè)各種測試場景的結(jié)果是有利的,你應(yīng)該將系統(tǒng)部署到更廣泛的網(wǎng)絡(luò)中。如果您對您的AIOps系統(tǒng)是否值得使用仍然猶豫不決,您可以在初始階段以測試模式運行系統(tǒng)。
這應(yīng)該可以保證輸出的結(jié)果是準(zhǔn)確的,而且你的用戶群對結(jié)果是滿意的。此外,考慮一下將AIOps與數(shù)據(jù)質(zhì)量軟件相結(jié)合是否是個好主意。 這些軟件可以幫助進行數(shù)據(jù)分析和數(shù)據(jù)挖掘。
(7) 評估和改進
一旦幾個星期過去了,你和你的團隊必須在實現(xiàn)你為系統(tǒng)引入設(shè)定的目標(biāo)的背景下審查系統(tǒng)的有效性。這包括可衡量的指標(biāo),如登記系統(tǒng)錯誤的減少。這也意味著要進行調(diào)查并記錄客戶反饋。
一般來講,AIOps應(yīng)該意味著你可以從數(shù)據(jù)中提取更大的價值,改善服務(wù)。
總結(jié)
AIOps是一個不斷發(fā)展的工具,它可以幫助您的企業(yè)節(jié)省時間和成本,并提高績效。 然而,在沒有實施經(jīng)過深思熟慮和衡量的方法的情況下,不應(yīng)期望它能立即帶來效果。