阿里巴巴程超:監(jiān)控系統(tǒng)的終極發(fā)展是實(shí)現(xiàn)智能化
原創(chuàng)【51CTO.com原創(chuàng)稿件】七年一劍,華麗蛻變。自2012年起連續(xù)6年15場(chǎng)峰會(huì),凝聚大量技術(shù)專家,博觀而約取,厚積而薄發(fā)。2018WOT全球軟件與運(yùn)維技術(shù)峰會(huì)揚(yáng)帆起航,圍繞12大核心熱點(diǎn),匯聚海內(nèi)外60位一線專家,打造高端技術(shù)盛宴!在5月18-19日的2018WOT全球軟件與運(yùn)維技術(shù)峰會(huì)上,阿里巴巴高級(jí)技術(shù)專家程超先生將為廣大技術(shù)同仁帶來題為《構(gòu)建超大規(guī)模的秒級(jí)監(jiān)控平臺(tái)》的精彩演講。
程超先生擁有近十年的運(yùn)維系統(tǒng)開發(fā)經(jīng)驗(yàn),現(xiàn)任職于阿里巴巴基礎(chǔ)設(shè)施事業(yè)群,負(fù)責(zé)阿里巴巴集團(tuán)的監(jiān)控平臺(tái)建設(shè)。主導(dǎo)構(gòu)建了***代的阿里巴巴CMDB系統(tǒng)。近幾年專注在監(jiān)控領(lǐng)域,現(xiàn)在負(fù)責(zé)的監(jiān)控平臺(tái)覆蓋了阿里巴巴的所有事業(yè)群。具有構(gòu)建大規(guī)范,分布式監(jiān)控系統(tǒng)的研發(fā)經(jīng)驗(yàn)。
阿里巴巴高級(jí)技術(shù)專家程超
阿里巴巴三代監(jiān)控系統(tǒng)的演進(jìn)
在去年的雙11全球購(gòu)物狂歡節(jié)中,天貓全天交易額1682億元,交易峰值32.5萬/秒,承載這些秒級(jí)數(shù)據(jù)監(jiān)控的是阿里巴巴第三代監(jiān)控系統(tǒng)。回顧數(shù)據(jù)監(jiān)控平臺(tái)的演進(jìn)歷程,程超先生給予了概括性的描述:***代監(jiān)控系統(tǒng)主要是基于開源系統(tǒng)搭建的,很快就碰到了穩(wěn)定性和規(guī)?;膯栴};第二代監(jiān)控系統(tǒng)解決了穩(wěn)定性和規(guī)?;瘧?yīng)用的問題,但范圍主要定位在系統(tǒng),應(yīng)用層面的監(jiān)控,缺少鏈路,業(yè)務(wù)等關(guān)鍵點(diǎn)的監(jiān)控;第三代監(jiān)控系統(tǒng)主要面向dev Ops的監(jiān)控系統(tǒng),重點(diǎn)關(guān)注智能化,標(biāo)準(zhǔn)化,業(yè)務(wù)全鏈路等全新的業(yè)務(wù)要求。
穩(wěn)定性是考察監(jiān)控系統(tǒng)最重要的指標(biāo)
程超先生坦言,監(jiān)控系統(tǒng)最重要的基礎(chǔ)就是自身的穩(wěn)定性。團(tuán)隊(duì)在不斷的實(shí)踐和試錯(cuò)中改進(jìn),形成良性循環(huán)。要確保監(jiān)控系統(tǒng)的穩(wěn)定性,就需要建立一個(gè)自身監(jiān)控+演習(xí)常態(tài)化的反饋機(jī)制。自身監(jiān)控的問題解決相對(duì)簡(jiǎn)單,阿里巴巴早期時(shí)用開源的監(jiān)控系統(tǒng)來監(jiān)控自己的監(jiān)控系統(tǒng),后來逐漸衍變?yōu)樽约罕O(jiān)控自己的系統(tǒng)。這樣的優(yōu)勢(shì)在于,自己就是用戶,能不斷的在使用過程中去優(yōu)化產(chǎn)品體驗(yàn)。
所謂的演習(xí)常態(tài),就是阿里巴巴自身特有的監(jiān)控機(jī)制,通常以月為單位,定期演習(xí)各個(gè)模塊在故障中(比較機(jī)房斷網(wǎng),日志量突增,CMDB數(shù)據(jù)同步異常)的表現(xiàn)。除此之外,還要在線上跑實(shí)時(shí)回歸,不斷的去校驗(yàn)數(shù)據(jù),保證每次變更后不會(huì)有邏輯上的錯(cuò)誤。
監(jiān)控系統(tǒng)的三個(gè)發(fā)展趨勢(shì)
作為監(jiān)控平臺(tái)開發(fā)領(lǐng)域的專家,程超先生基于自己的工作領(lǐng)域,對(duì)監(jiān)控平臺(tái)的發(fā)展趨勢(shì)有著深入的理解。他認(rèn)為,在阿里巴巴集團(tuán)這個(gè)大規(guī)模的場(chǎng)景中,監(jiān)控系統(tǒng)的發(fā)展會(huì)有幾個(gè)方向:其一是標(biāo)準(zhǔn)化,需要預(yù)先定義標(biāo)準(zhǔn)化的指標(biāo),模板。實(shí)現(xiàn)標(biāo)準(zhǔn)化的目標(biāo)是降低基礎(chǔ)監(jiān)控的門檻,為智能化提供數(shù)據(jù)基礎(chǔ)。其次是一體化,包括橫向、縱向的打通監(jiān)控?cái)?shù)據(jù),以業(yè)務(wù)為核心來組織所有緯度的數(shù)據(jù),一體化的目標(biāo)是展示業(yè)務(wù)全貌,縮短故障定位的時(shí)間。***是智能化,這個(gè)方向能探索的可能性是最多的,其目標(biāo)是使監(jiān)控系統(tǒng)成為運(yùn)維大腦,最終實(shí)現(xiàn)無人值守。
想要了解更多?5月18-19日,北京粵財(cái)JW萬豪酒店,全球最值得關(guān)注的IT技術(shù)盛宴與您不見不散。2018WOT全球軟件與運(yùn)維技術(shù)峰會(huì)一定是您發(fā)現(xiàn)全新思路、挖掘***思想、拓展人脈的重要平臺(tái)。
目前我們的各項(xiàng)票種已全面發(fā)售。需要提醒您的是,購(gòu)票越早,折扣越大!與KOL零距離交流,呈現(xiàn)不一樣的"英雄盛宴"!
點(diǎn)擊官網(wǎng)了解詳情:wot.51cto.com
【51CTO原創(chuàng)稿件,合作站點(diǎn)轉(zhuǎn)載請(qǐng)注明原文作者和出處為51CTO.com】