自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

如果只把AIOps看做運維技術,未免也太膚淺了……

運維 新聞
如Gartner定義中提出,AIOps應用需要利用大數(shù)據(jù),現(xiàn)代機器學習技術和其他高級分析技術,是一種相對較高門檻的工作模式。

近日一篇《智能運維行業(yè)亂象:估值虛高、上市受阻、裁員頻現(xiàn)》網(wǎng)文在運維圈十分火爆,有一些觀點十分吸引人。今天,不對文章觀點做評價,摘一小段《數(shù)智萬物下運維》系列下我對金融企業(yè)智能運維的理解。

AIOps是運維的方向,但AIOps不能單純的認為一種技術手段或技術平臺,而應該是數(shù)智時代人機協(xié)同的運維模式。

一、人機協(xié)同的AIOps運維工作模式

一種新的工作模式出現(xiàn),必然會對原來穩(wěn)定的工作模式進行改變,改變通常會受到新挑戰(zhàn),所以新工作模式需要能解決當前運維工作中遇到的難題而出現(xiàn)。以金融行業(yè)的業(yè)務連續(xù)性管理為例,目標是提高公司的風險防范能力、有效地減少非計劃的業(yè)務中斷、防范運維操作風險,對于首次出現(xiàn)的未知異常能夠利用工具量化分析并快速定位,確保在重大災難性事件發(fā)生后能按計劃恢復業(yè)務連續(xù)性是傳統(tǒng)。在面對當前復雜的技術架構、不斷引入的創(chuàng)新技術、快速迭代的軟件版本、嚴峻的信息安全威脅下,傳統(tǒng)運維團隊原來被動救火式、問題驅(qū)動式、操作運維、經(jīng)驗運維已經(jīng)很難實現(xiàn)企業(yè)業(yè)務連續(xù)性的保障目標。金融企業(yè)運行安全穩(wěn)定,需要運維數(shù)據(jù)賦予數(shù)據(jù)洞察、輔助決策、跟蹤執(zhí)行的能力,提升復雜環(huán)境下的運維管理能力,即:

  • 實時獲得“發(fā)生了什么?”;
  • 關聯(lián)分析“為什么會發(fā)生?”;
  • 智能預測“將會發(fā)生什么?”;
  • 決策判斷“采取什么措施?”;
  • 自動執(zhí)行“如何快速執(zhí)行?”
  • 實時感知“工作執(zhí)行的效果?”

AIOps就是為了解決上述問題而生,相比傳統(tǒng)的運維工作模式,AIOps重點不是創(chuàng)造一種全新的運維工作模式,而是對現(xiàn)有“專家經(jīng)驗+最佳實踐流程+工具平臺” 運維模式的補充,為企業(yè)運維工作提供“洞察感知、運營決策、機器執(zhí)行”能力,支持向“人機協(xié)同”模式轉(zhuǎn)變。

為什么是“人機協(xié)同”的模式,而不是智能化的模式呢?因為從當前AIOps的應用情況看,雖然人工智能技術領先,但當面對復雜、多變、信息不完全的環(huán)境,特別是應用于需要復雜應急保障場景時,仍不具備替代專家,更多的應用在某些特定弱人工智能領域?!叭藱C協(xié)同”聚焦在通過機器輔助人的決策與執(zhí)行,是在原來運維組織內(nèi)部參與者,以及運維以外的研發(fā)、測試、廠商等協(xié)同網(wǎng)絡上,增加機器人角色,形成人機協(xié)同的運維模式。人機協(xié)同的運維模式,最關鍵的角色仍是人,利用人的創(chuàng)造力,結合機器所提供的數(shù)據(jù)和算法,輔助人進行運維工作開展。總的來說,人機協(xié)同需要發(fā)揮人與機器人特長,形成一個融合的解決方案,后續(xù)AIOps的重點推進方向可以圍繞三點:

  • “數(shù)據(jù)+算法”為運維專家賦能“實時感知、輔助決策”的能力。
  • 增加運維機器人崗位,重塑 “大計算” 、“海量數(shù)據(jù)分析”、“操作性”、“流程化”、“規(guī)律性” 、“7*24”、“人機體驗”等類型的運維工作。
  • 建立數(shù)字平臺化管理模式,閉環(huán)落實決策執(zhí)行。

二、數(shù)據(jù)、算法、場景、知識組成AIOps關鍵4要素

如Gartner定義中提出,AIOps應用需要利用大數(shù)據(jù),現(xiàn)代機器學習技術和其他高級分析技術,是一種相對較高門檻的工作模式。為了更好地落地AIOps,運維組織需要深刻地理解AIOps的內(nèi)涵,重點實現(xiàn)思路:以數(shù)據(jù)為基礎、算法為支撐、場景為導向,知識為擴展的AIOps4要素。

1、以數(shù)據(jù)為基礎

數(shù)據(jù)為先,AIOps需要快速生產(chǎn)高質(zhì)量數(shù)據(jù)的能力。“快速”的思路可以以“中臺”思路進行建設,建立統(tǒng)一的數(shù)據(jù)采控、實時與批量的數(shù)據(jù)處理能力、與運維相匹配的運維算法、存儲方案、主數(shù)據(jù)、指標模型等;“高質(zhì)量”則從將分散數(shù)據(jù)統(tǒng)一、在線后形成“活數(shù)據(jù)”,以及數(shù)據(jù)質(zhì)量上的治理。從技術實現(xiàn)看,具備實時“采、存、算、管、用”的數(shù)據(jù)流動全生命周期管理的能力。其中,數(shù)據(jù)采集是按需在線采集數(shù)據(jù)的能力;數(shù)據(jù)存儲是根據(jù)數(shù)據(jù)類型、數(shù)據(jù)應用特點對數(shù)據(jù)進行歸檔、整理、傳輸、共享;數(shù)據(jù)計算包括數(shù)據(jù)標注、清洗、建模、加工、標準化、質(zhì)量監(jiān)控,以及為了獲得數(shù)據(jù)洞察、決策、執(zhí)行而對數(shù)據(jù)進行分析統(tǒng)計;數(shù)據(jù)管理重點圍繞數(shù)據(jù)治理的,包括運維數(shù)據(jù)標準、主數(shù)據(jù)、元數(shù)據(jù)、數(shù)據(jù)質(zhì)量、數(shù)據(jù)安全的管理;數(shù)據(jù)使用重點圍繞數(shù)據(jù)服務角度涉及的數(shù)據(jù)目錄、服務門戶,以及配套的數(shù)據(jù)服務化能力。

2、以算法為支撐

算法大腦,適配、引入特定場景下運維算法,構建算法模型體系。機器學習尤其是深度學習的大規(guī)模應用,推動了人工智能的快速發(fā)展。隨著國內(nèi)TOB市場的火爆,AIOps上人工智能研究及應用正處于爆發(fā)期,引入AI技術的算法有三點優(yōu)勢:一是工作穩(wěn)定性高,人工智能可不知疲倦地進行工作,在規(guī)律性問題的分析時不受環(huán)境影響。二是降低操作風險,利用人工智能取代傳統(tǒng)人工經(jīng)驗操作,可更好地避免操作風險和道德風險。三是有效提高決策效率,人工智能可以快速地對大數(shù)據(jù)進行篩選和分析,幫助人們更高效率地決策。作為金融企業(yè),一方面,由于人才、薪酬結構等方面不足,在算法的建設上應該更多地與外部供應商合作;另一方面,對算法的追求不一定是技術的先進性,事實上規(guī)律性的專家經(jīng)驗落地也是一種算法的實現(xiàn),而且很多時候更加可靠。對于當前主流的算法參見上一節(jié)提到了的常用算法,這里不再重復。

3、以場景為導向

場景驅(qū)動,以痛點、價值期望切入點,用智能賦能運維場景,落地智能運維能力。AIOps從詞來看,應該包括“AI+Ops”,是用AI賦能運維場景的模式。有了上面提到的數(shù)據(jù)底座與算法大腦,下一步是AIOps運維模式的落地,主要將圍繞場景的落地,一種是利用算法賦能已有的運維場景,另一種是算法實現(xiàn)原來無法實現(xiàn)的運維場景。前者是一個快速見效的模式,后者是應對變化而做出的變化。

4、以知識為擴展

運維知識描述了大量運維領域的相關對象定義、技巧,以及排故/解決經(jīng)驗的信息。運維知識圖譜是把運維對象不同種類的信息連接在一起而得到的一個關系網(wǎng)絡,是對運維數(shù)據(jù)進行表達的關鍵技術。通過構建運維知識圖譜,從海量數(shù)據(jù)中自動挖掘各類運維主體,對其特性進行畫像和結構化描述,動態(tài)記錄運維主體之間的關聯(lián)關系。基于運維知識圖譜,利用自然語義等算法技術,可以幫助IT人員實現(xiàn)故障鏈傳播分析、根因定位、智能的變更影響分析、故障預測等多種AIOps場景。

三、AIOps的一些其他觀點

1、建立場景地圖,體系化、有節(jié)奏地落地AIOps

與AI技術在當前大部分領域的應用類似,AI是一種平臺能力,而不是業(yè)務。以網(wǎng)上銀行系統(tǒng)為例,PC端的網(wǎng)上銀行解決從柜臺到臨柜的便利性問題,手機銀行解決從鼠標鍵盤操作到手指劃屏、隨時操作的操控問題,AI的視頻、語言識別等技術又給手機銀行解決從觸屏到沉浸智能的體驗問題。在這個過程中,很多業(yè)務的本質(zhì)仍未改變,所以面對AIOps,運維組織需要建立場景地圖,基于場景地圖分好優(yōu)先級,看如何將AI的優(yōu)勢賦能給運維場景的具體環(huán)節(jié)。

2、“活數(shù)據(jù)”是運維智能化的基礎

活數(shù)據(jù)有兩個含義,一是指數(shù)據(jù)是活的,即數(shù)據(jù)全在線;二是數(shù)據(jù)被活用,即在數(shù)據(jù)不斷應用中完善并產(chǎn)生新數(shù)據(jù),形成數(shù)據(jù)回流。以往運維數(shù)據(jù)分析主要基于批量離線數(shù)據(jù)建立報告輔助決策,但很多運維工作場景需要實時數(shù)據(jù)分析支撐。所以,需要利用運維數(shù)據(jù)平臺實現(xiàn)機器數(shù)據(jù)實時采控落地數(shù)據(jù)資產(chǎn),再場景化實現(xiàn)數(shù)據(jù)消費,并建立數(shù)據(jù)應用執(zhí)行的反饋不斷優(yōu)化數(shù)據(jù)驅(qū)動的工作流程,形成更為準確的數(shù)據(jù)。所以,實現(xiàn)活數(shù)據(jù)中有三個關鍵要素,一是構建協(xié)同網(wǎng)絡的運維工作場景,協(xié)同網(wǎng)絡需要打破線上工作流程孤島,打通“人、組織、軟件、硬件”之間的網(wǎng)絡連接;二是運維組織要建立運維數(shù)據(jù)平臺將生產(chǎn)運行的相關數(shù)據(jù)匯聚在一起,并抽象成數(shù)據(jù)服務,以便利的方式為運維場景提供價值;三要不斷消費數(shù)據(jù),在數(shù)據(jù)消費中發(fā)現(xiàn)問題,修正數(shù)據(jù),挖掘數(shù)據(jù)增值服務,產(chǎn)生新的數(shù)據(jù)。

3、第一印象很重要

AIOps作為全新的工作模式,給用戶第一印象是可靠、可用,如果第一印象是懷疑態(tài)度,對后續(xù)工作模式的運營推廣會帶來較大挑戰(zhàn)。AIOps的算法最需要解決的問題是,改變?nèi)藢Α八惴蚀_性”的印象,即“算法”的引入不是為了創(chuàng)新,而是為了確實解決真實問題而出現(xiàn)。以輔助故障定位為例,一個正常運作的運維組織日常很多故障通常能夠通過專家經(jīng)驗、監(jiān)控工具、有效的協(xié)作機制得到處理。引入AIOps對于故障管理的賦能,一是為了更快,二是為了更準。得益于機器的自動化、算力等特點,通過設計好的線上應急場景,“快”的問題可預測能得到解決;但對于“準”則多少有黑盒子的意味,所以在應用算法時要持謹慎的思路,解決問題遠比算法先進重要。

最后,不管是運維團隊中的工具研發(fā),還是廠商,在推動AIOps模式時,都應關注一線運維專家的經(jīng)驗,以及落地運維模式的配套工作機制,才能將人、流程、工具與具體的“事”連接成真實可用的場景。

責任編輯:張燕妮 來源: 運維之路
相關推薦

2017-10-13 13:14:35

互聯(lián)網(wǎng)

2023-10-05 18:49:12

.Net?Newtonsof源碼

2017-08-30 11:51:12

AIOps智能運維

2021-10-02 10:48:05

密碼微軟無密碼登入

2022-03-04 10:38:48

人工智能智能運維AIOps

2018-08-09 15:04:19

DevOpsAIOps運維

2018-03-30 16:34:51

AIOps運維變革

2018-09-21 09:15:39

2018-09-14 13:04:43

華為云

2018-09-21 10:17:12

AIOps運維機器人

2013-07-09 13:24:42

2018-11-15 11:52:36

百度云運維AIOps

2023-01-16 14:31:40

模型AI

2021-08-30 17:19:50

云智慧

2023-12-07 08:46:41

Kafka服務問題網(wǎng)絡問題

2020-06-09 08:10:20

Kubernetes運維容器

2012-05-15 14:58:57

IT運維

2016-01-13 10:11:20

智能化運維運維自動化運維

2021-05-15 08:02:33

HashMap 散列函數(shù)哈希沖突
點贊
收藏

51CTO技術棧公眾號