華為HC發(fā)布AIOps系列云服務(wù),使能新基建運維智能化轉(zhuǎn)型
原創(chuàng)【51CTO.com原創(chuàng)稿件】2020年9月25日,第五屆華為全聯(lián)接2020大會順利進(jìn)入第3天議程。在媒體圓桌現(xiàn)場,華為隆重推出AIOps系列云服務(wù),聚焦提升電信運營商和企業(yè)專網(wǎng)的智能化運維能力,引發(fā)業(yè)界極大關(guān)注。
媒體圓桌發(fā)布會現(xiàn)場
華為網(wǎng)絡(luò)人工智能產(chǎn)品部CTO程磊現(xiàn)場發(fā)布AIOps系列云服務(wù)
2020年,隨著5G商用與“新基建”的加速實施,聯(lián)接、云、AI、計算和行業(yè)應(yīng)用史無前例地匯聚到一起,為數(shù)字經(jīng)濟(jì)發(fā)展注入了新動能。但在千行百業(yè)不斷對數(shù)字化轉(zhuǎn)型按下“加速鍵”的同時,華為強(qiáng)調(diào)“欲善新基建,必先利運維”。尤其在電信行業(yè),華為認(rèn)為運維能力的演進(jìn)成為電信網(wǎng)絡(luò)能否持續(xù)發(fā)揮效能的關(guān)鍵因素。
電信網(wǎng)絡(luò)運維難度指數(shù)級增長,AIOps被給予厚望
華為這番觀點深得電信運營商的認(rèn)同。事實上,在運維支撐系統(tǒng)的演進(jìn)方向上,“構(gòu)建 AIOps 平臺能力,運用AI技術(shù)支撐不同運維場景應(yīng)用”也已經(jīng)成為電信行業(yè)運維智能化轉(zhuǎn)型的趨勢和共識。
之所以電信行業(yè)如此積極擁抱AIOps,最關(guān)鍵的原因就在于現(xiàn)有的運維瓶頸已經(jīng)不是簡單增加人力,培養(yǎng)運維專家就能化解的。更何況運維效率低下帶來成本激增,也極大地拖慢了運營商轉(zhuǎn)型的步伐。以新應(yīng)用上線為例,在當(dāng)今競爭激烈的市場大環(huán)境下,新的功能應(yīng)用必須以“快”為先,但是不少電信行業(yè)的OSS系統(tǒng)獨立,新應(yīng)用上線周期長達(dá)數(shù)周甚至數(shù)月,這顯然不能滿足市場用戶的需求。再看看運維工作里最常見的故障定位與恢復(fù):過去故障診斷往往依賴個人經(jīng)驗,準(zhǔn)確率低,并且往往是用戶投訴了才知道出現(xiàn)了故障。這在5G新基建時代顯然行不通了,因為網(wǎng)絡(luò)更加復(fù)雜,牽一發(fā)動全身,僅僅憑借個人經(jīng)驗根本不足以應(yīng)付如此復(fù)雜的網(wǎng)絡(luò)狀況,故障處理時間長效率低,純?nèi)斯み\維模式+個人經(jīng)驗主義委實難以為繼。
在這樣的形勢下,AIOps被看做是化解網(wǎng)絡(luò)運維復(fù)雜度,提升業(yè)務(wù)質(zhì)量和用戶體驗的一道“良方”。而華為本次推出的AIOps系列云服務(wù),不僅包括了括故障識別根因定位服務(wù)、日志異常檢測服務(wù),還提供KPI異常檢測服務(wù),硬盤異常檢測服務(wù),可以說是為電信行業(yè)和企業(yè)專網(wǎng)用戶量身訂制,讓運維實力再上新臺階。
華為分享AIOps成功落地兩大關(guān)鍵點
事實上AIOps并不是一項新技術(shù),早在2016年,Gartner就已正式將AIOps定義為新的運維類別。當(dāng)時業(yè)界普遍認(rèn)為運維與AI有天然的結(jié)合優(yōu)勢,既不需要數(shù)字化轉(zhuǎn)換,也對數(shù)字采樣沒有太高要求,最關(guān)鍵的是運維領(lǐng)域的日志、配置、操作、腳本、程序等都是計算機(jī)自動生成的,這恰恰是AI處理的強(qiáng)項。但這幾年過去了,AIOps卻并沒有預(yù)想中那樣“混得風(fēng)生水起”,這究竟是什么緣故?
華為指出,電信領(lǐng)域的AIOps落地的關(guān)鍵有兩點:第一點是需要將行業(yè)知識與AI技術(shù)融合,只有當(dāng)AI算法與電信領(lǐng)域行業(yè)知識真正融合后,才能擁有更優(yōu)質(zhì)的電信領(lǐng)域模型參數(shù),徹底解決此前通用算法模型在電信行業(yè)落地效果差的難題。第二點,網(wǎng)絡(luò)運維系統(tǒng)的AIOps能力構(gòu)建的趨勢是業(yè)務(wù)與能力解耦,要做到AIOps能力的復(fù)用、拉通,支持,才能適配運維場景應(yīng)用百花齊放和快速上線迭代的需求。
四大核心功能令華為AIOps“技高一籌”
那么,秉持著華為對電信領(lǐng)域智能化運維思考,華為AIOps云服務(wù)究竟有何不同呢?這就不得不提華為AIOps的四大核心能力:
核心能力一:提供豐富的AIOps原子能力。NAIE AIOps的原子能力覆蓋運維全流程,包括預(yù)測、檢測,定位、執(zhí)行,目前提供20多種原子能力,支持流量預(yù)測、KPI異常檢測、日志異常檢測、CHR異常檢測、異常關(guān)聯(lián)分析等服務(wù)。
核心能力二:組合編排與DevOps能力。華為可以幫助電信行業(yè)零編碼定制場景組合應(yīng)用,例如KPI異常檢測服務(wù)、故障識別與根因定位服務(wù)、日志異常檢測服務(wù)、硬盤異常預(yù)測,都已經(jīng)成為華為AIOps預(yù)組合編排好的服務(wù),支持運維人員“開箱即用”。
核心能力三:支持電信領(lǐng)域數(shù)據(jù)對接。華為AIOps 使能服務(wù)提供通用的數(shù)據(jù)源對接和標(biāo)準(zhǔn)化數(shù)據(jù)治理組件,支持 KPI 、告警、日志、xDR 等電信領(lǐng)域主流運維數(shù)據(jù),還支持 Kafka、數(shù)據(jù)庫、文件系統(tǒng)、Restful 等電信運維系統(tǒng)的主流數(shù)據(jù)對接方式。
核心能力四:提供場景組合服務(wù)。圍繞運維全流程(發(fā)現(xiàn)、分析、處理)提供預(yù)制典型場景組合應(yīng)用,快速接入運維流程。
華為AIOps賦能運維智能化未來
如今,作為自動駕駛網(wǎng)絡(luò)AI引擎iMaster NAIE的核心能力,華為AIOps使能服務(wù)已經(jīng)在電信行業(yè)的無線、核心網(wǎng)、數(shù)通等網(wǎng)絡(luò)域得到了廣泛應(yīng)用與規(guī)模驗證。在實踐中,華為AIOps幫助運營商打破原有的煙囪式建設(shè)方式,將各專業(yè)運維系統(tǒng)的應(yīng)用與AI能力解耦,通過AIOps能力來適配運維場景應(yīng)用百花齊放的需求。
在電信網(wǎng)絡(luò)中,通過KPI來預(yù)測和檢測網(wǎng)絡(luò)問題是最普遍的場景。華為AIOps能夠通過AI算法基于歷史數(shù)據(jù)自動生成每個KPI 的動態(tài)門限,并且提供異常原因的關(guān)聯(lián)分析。如此一來,一旦發(fā)生KPI故障,華為AIOps就能幫助運維人員快遞鎖定故障點,并且模型還可以進(jìn)行自學(xué)習(xí)調(diào)優(yōu),不斷演進(jìn)優(yōu)化。國內(nèi)某運營商采用了核心網(wǎng) KPI 異常檢測服務(wù)以后,實現(xiàn)提前 5 小時識別異常并主動預(yù)警,降低了業(yè)務(wù)損失。
不僅如此,發(fā)現(xiàn)異?;蛘吖收现蟮亩ㄎ皇沁\維流程中的難點,如何準(zhǔn)確的將多維度的異常、告警等事件進(jìn)行匯聚,減少故障噪聲,準(zhǔn)確定位到具體原因?傳統(tǒng)運維中,這些工作主要依賴于專家經(jīng)驗或者手工分析,而且受限于分析算力和知識信息,效果并不理想。華為 AIOps 通過 AI 算法與業(yè)務(wù)的融合,支持多類異常/告警等事件的智能故障定位,能夠為運維團(tuán)隊提供多維度的事件匯聚和根因定位。經(jīng)過實際驗證,無效上站減少 60%,根因識別準(zhǔn)確率 85%+,運維效率整體提升 15%,令運營商非常滿意。
Tractica/Ovum 預(yù)測,到 2025 年,全球電信業(yè)對人工智能軟件、硬件和服務(wù)的投資將達(dá) 380 億美元 , 成為最大的 AI 應(yīng)用市場。在中國,三大運營商也早已在人工智能領(lǐng)域布局,相信隨著新基建的深入,電信行業(yè)有望再次騰飛。有理由相信,華為AIOps系列云服務(wù)將為電信行業(yè)注入更高效的運維支撐能力,加速電信行業(yè)變革。
【51CTO原創(chuàng)稿件,合作站點轉(zhuǎn)載請注明原文作者和出處為51CTO.com】