下一代的DevOps服務(wù):AIOps
原創(chuàng)【51CTO.com原創(chuàng)稿件】AIOps是什么以及了解下它可以如何幫助您的IT部門(mén),例如,利用它來(lái)快速處理所有數(shù)據(jù)。
AIOps是一個(gè)總稱,用于指代使用復(fù)雜的基礎(chǔ)設(shè)施管理軟件和云解決方案監(jiān)控工具來(lái)實(shí)現(xiàn)自動(dòng)化數(shù)據(jù)分析和日常的DevOps操作。
那些10年前甚至是5年前構(gòu)建的系統(tǒng)監(jiān)控工具的主要缺陷是它們不是為了滿足大數(shù)據(jù)時(shí)代的需求而構(gòu)建的。它們既不能處理數(shù)量龐大的輸入數(shù)據(jù),也不能處理種類繁多的數(shù)據(jù)類型,更加不能與輸入數(shù)據(jù)的速度保持一致。根據(jù)以往的經(jīng)驗(yàn),這樣的云監(jiān)控解決方案必須將數(shù)據(jù)分塊,將看似重要的內(nèi)容進(jìn)行分離,并切斷看似不需要的內(nèi)容,***使用焦點(diǎn)組和統(tǒng)計(jì)樣本進(jìn)行操作,而不是處理整個(gè)完整的數(shù)據(jù)。
這樣做的結(jié)果是,在數(shù)據(jù)分析階段,一些重要的模式可能會(huì)被忽略,數(shù)據(jù)可視化的視圖被完全排除。這可能使得整個(gè)過(guò)程毫無(wú)用處,就好像大數(shù)據(jù)分析不能產(chǎn)生可操作的業(yè)務(wù)洞察一樣,它將無(wú)法提供大數(shù)據(jù)分析中最重要的價(jià)值。
讓AIOps進(jìn)入場(chǎng)景
當(dāng)然,要及時(shí)處理所有機(jī)器生成的數(shù)據(jù)是不可能的。然而,這正是人工智能算法(如深度學(xué)習(xí)模型)所擅長(zhǎng)的那種任務(wù)。剩下的唯一問(wèn)題是:如何在DevOps工程師的日常生活中讓這些機(jī)器學(xué)習(xí)工具發(fā)揮作用?
下面是在IT部門(mén)中適合使用AIOps的一些案例:
- 快速處理數(shù)據(jù)??梢杂?xùn)練一個(gè)ML模型來(lái)處理系統(tǒng)生成的所有類型的數(shù)據(jù)——這是未來(lái)的方向。如果必須添加新的數(shù)據(jù)類型,模型也可以相對(duì)容易地進(jìn)行調(diào)整和再訓(xùn)練,以保持高性能。這將確保數(shù)據(jù)的完整性和保真度,從而產(chǎn)生全面的分析和具體的結(jié)果。
- 深入的數(shù)據(jù)分析。當(dāng)你能夠?qū)崿F(xiàn)對(duì)所有數(shù)據(jù)進(jìn)行分析時(shí),隱藏的模式就會(huì)出現(xiàn),可操作的見(jiàn)解也會(huì)出現(xiàn)。然后,DevOps工程師就可以分析出基礎(chǔ)設(shè)施需要調(diào)整的地方,以避免性能瓶頸的出現(xiàn),并且可以坐在高管的桌前,為優(yōu)化基礎(chǔ)設(shè)施和改進(jìn)運(yùn)營(yíng)提供具體的基于數(shù)據(jù)的建議。
- 日常工作的自動(dòng)化。識(shí)別出事件模式后,就可以設(shè)置自動(dòng)觸發(fā)器。因此,當(dāng)統(tǒng)計(jì)數(shù)據(jù)顯示某些事件總是導(dǎo)致特定的(負(fù)面的)結(jié)果,并且必須執(zhí)行某些操作來(lái)糾正問(wèn)題時(shí),DevOps工程師就可以創(chuàng)建觸發(fā)器并自動(dòng)對(duì)此類事件做出響應(yīng)。
因此,如果監(jiān)控解決方案報(bào)告了由于連接數(shù)量增加而導(dǎo)致了CPU使用率的增加,諸如此類。Kubernetes就可以啟動(dòng)額外的應(yīng)用程序?qū)嵗⑹褂秘?fù)載平衡來(lái)分配訪問(wèn)流和減少負(fù)載。這是最簡(jiǎn)單的場(chǎng)景,而現(xiàn)實(shí)世界的用例則要復(fù)雜得多,需要允許自動(dòng)執(zhí)行任何的日常DevOps任務(wù),使ML模型能夠在特定條件下啟動(dòng)它,并預(yù)先處理問(wèn)題,而不是在停機(jī)后。
使用AIOps的好處
部署AIOps解決方案可以實(shí)現(xiàn)以下的積極成果:
- 不間斷的產(chǎn)品可用性,帶來(lái)積極的終端用戶體驗(yàn)
- 優(yōu)先解決問(wèn)題,而不是***性的滅火
- 消除數(shù)據(jù)孤島并實(shí)現(xiàn)根本性的故障修復(fù),因?yàn)槟治隽藰I(yè)務(wù)生成的所有數(shù)據(jù)而不是使用精簡(jiǎn)樣本
- 日常任務(wù)的自動(dòng)化,使您的IT部門(mén)能夠集中精力于改進(jìn)基礎(chǔ)架構(gòu)和流程,而不是處理重復(fù)且耗時(shí)的任務(wù)
- 更好的協(xié)作,因?yàn)閷?duì)日志的深入分析有助于顯示管理決策的影響,并評(píng)估采用的業(yè)務(wù)戰(zhàn)略的效率
關(guān)于什么是AIOps以及為什么它很重要的最終想法
正如您所看到的,選擇AIOps工具和解決方案對(duì)您的業(yè)務(wù)非常有益。這似乎是AIOps解決方案供應(yīng)商的營(yíng)銷噱頭,但其實(shí)并不是。當(dāng)下,大多數(shù)企業(yè)都在努力朝著DevOps文化轉(zhuǎn)型,并進(jìn)行著數(shù)字化轉(zhuǎn)型。
與此同時(shí),真正具有創(chuàng)新精神的公司已經(jīng)在努力將人工智能算法、ML模型和DevOps系統(tǒng)相結(jié)合,以提供未來(lái)***進(jìn)的云監(jiān)控和基礎(chǔ)設(shè)施自動(dòng)化解決方案。應(yīng)用這些實(shí)踐可以極大地改善客戶體驗(yàn),縮短產(chǎn)品的上市時(shí)間,更有效地使用基礎(chǔ)設(shè)施,以及在團(tuán)隊(duì)中更好地進(jìn)行協(xié)作。然而,即使是這些創(chuàng)新者也沒(méi)有現(xiàn)成的解決方案來(lái)滿足他們的需求,他們不得不使用Splunk、sumeoric、Datadog、promethus + Grafana、Kubernetes和terra form等流行的DevOps工具來(lái)構(gòu)建這樣的系統(tǒng)。更重要的是,盡管這個(gè)想法本身非常重要,但實(shí)施它所需的基礎(chǔ)設(shè)施管理水平遠(yuǎn)遠(yuǎn)超過(guò)了普通公司的能力。
【51CTO原創(chuàng)稿件,合作站點(diǎn)轉(zhuǎn)載請(qǐng)注明原文作者和出處為51CTO.com】