自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

G行應(yīng)用監(jiān)控標(biāo)準(zhǔn)化演進(jìn)之路

安全 應(yīng)用安全
通過多年探索與實(shí)踐,G行逐步建立了應(yīng)用監(jiān)控標(biāo)準(zhǔn)化的實(shí)施方法模型、應(yīng)用服務(wù)模型、監(jiān)控指標(biāo)體系以及閉環(huán)量化管理機(jī)制,逐步完善了傳統(tǒng)應(yīng)用與分布式應(yīng)用的監(jiān)控手段,提升了監(jiān)控系統(tǒng)整體效能。面對(duì)日益復(fù)雜的應(yīng)用系統(tǒng)環(huán)境,G行后續(xù)將持續(xù)進(jìn)行監(jiān)控系統(tǒng)優(yōu)化,通過持續(xù)豐富應(yīng)用監(jiān)控指標(biāo)集、引入非侵入監(jiān)控?cái)?shù)據(jù)采集方式、支持自助式監(jiān)控配置管理模式等工作,提升應(yīng)用監(jiān)控能力。

?引言

應(yīng)用監(jiān)控是整個(gè)監(jiān)控體系的重要組成部分,面對(duì)各個(gè)應(yīng)用系統(tǒng)之間的差異性和復(fù)雜性特點(diǎn),如何全面有效的實(shí)施應(yīng)用監(jiān)控是應(yīng)用運(yùn)維人員和監(jiān)控管理員共同面臨的難題。G行通過多年的實(shí)踐證明,應(yīng)用監(jiān)控標(biāo)準(zhǔn)化是解決復(fù)雜IT環(huán)境下應(yīng)用系統(tǒng)有效監(jiān)控的一柄利劍,也是實(shí)現(xiàn)監(jiān)控?cái)?shù)字化和智能化的基礎(chǔ)。G行從監(jiān)控標(biāo)準(zhǔn)化方法論、監(jiān)控標(biāo)準(zhǔn)化模型、監(jiān)控對(duì)象模型、指標(biāo)定義及接入規(guī)范等多個(gè)層面進(jìn)行探索,有效促進(jìn)應(yīng)用監(jiān)控工作在組織層面的融合和打通,確?!叭纭痹瓌t的落地執(zhí)行,保障了應(yīng)用系統(tǒng)平穩(wěn)運(yùn)行。本文對(duì)G行應(yīng)用監(jiān)控標(biāo)準(zhǔn)化演進(jìn)之路進(jìn)行了回顧和介紹。

應(yīng)用監(jiān)控標(biāo)準(zhǔn)化的內(nèi)容和意義

1. 應(yīng)用系統(tǒng)的定義

應(yīng)用系統(tǒng)一般由計(jì)算機(jī)硬件系統(tǒng)、系統(tǒng)軟件、應(yīng)用軟件組成。硬件系統(tǒng)和操作系統(tǒng)、數(shù)據(jù)庫(kù)、中間件等軟件系統(tǒng)的標(biāo)準(zhǔn)化程度較高,具有相對(duì)通用的監(jiān)控指標(biāo)和監(jiān)控手段。應(yīng)用軟件基于通用的開發(fā)語言和開發(fā)框架,編寫應(yīng)用程序滿足不同的業(yè)務(wù)需求,具有差異性和復(fù)雜性,需要建立統(tǒng)一的監(jiān)控標(biāo)準(zhǔn)變不確定為確定,保障應(yīng)用系統(tǒng)業(yè)務(wù)連續(xù)性。因此應(yīng)用監(jiān)控標(biāo)準(zhǔn)化的管理對(duì)象主要是應(yīng)用軟件。

2. 應(yīng)用監(jiān)控標(biāo)準(zhǔn)化內(nèi)容

標(biāo)準(zhǔn)化,實(shí)質(zhì)上就是為標(biāo)準(zhǔn)制定、發(fā)布和實(shí)施過程而進(jìn)行的一切活動(dòng)。應(yīng)用監(jiān)控標(biāo)準(zhǔn)化重點(diǎn)是Metric監(jiān)控相關(guān)的指標(biāo)集、監(jiān)控對(duì)象、監(jiān)控工具等標(biāo)準(zhǔn)模型以及由此產(chǎn)生的閉環(huán)和量化管理活動(dòng)。對(duì)于應(yīng)用監(jiān)控中可能涉及到的日志和Tracing規(guī)范,有單獨(dú)的技術(shù)標(biāo)準(zhǔn)進(jìn)行闡述,不包含在本次監(jiān)控標(biāo)準(zhǔn)化范圍內(nèi)。

3. 應(yīng)用監(jiān)控標(biāo)準(zhǔn)化的意義

確?!叭纭痹瓌t落地:通過部署標(biāo)準(zhǔn)化的監(jiān)控指標(biāo)體系,全面掌控應(yīng)用系統(tǒng)運(yùn)行狀態(tài),對(duì)于生產(chǎn)故障的發(fā)現(xiàn),確保“監(jiān)控工具早于運(yùn)維人員、科技部門早于業(yè)務(wù)部門、銀行早于客戶”的“三早”原則的有效落地。

提升監(jiān)控管理水平:沉淀和固化運(yùn)維經(jīng)驗(yàn),將運(yùn)維工作中積累的監(jiān)控手段歸納總結(jié)后進(jìn)行組織級(jí)推廣部署,從全局角度提升監(jiān)控管理水平。

組織內(nèi)監(jiān)控工作融合:通過監(jiān)控標(biāo)準(zhǔn)化中的指標(biāo)接入規(guī)范、指標(biāo)測(cè)試規(guī)范、應(yīng)用監(jiān)控策略部署規(guī)范以及生產(chǎn)事件跟蹤機(jī)制,將監(jiān)控工作前移至應(yīng)用開發(fā)和測(cè)試環(huán)節(jié),形成管理閉環(huán)。

傳統(tǒng)環(huán)境應(yīng)用監(jiān)控標(biāo)準(zhǔn)化

監(jiān)控系統(tǒng)建立之初一切都是從零開始,每個(gè)應(yīng)用系統(tǒng)都是單獨(dú)進(jìn)行對(duì)接,單獨(dú)梳理監(jiān)控指標(biāo)、監(jiān)控策略,部署監(jiān)控后再根據(jù)運(yùn)行情況進(jìn)行調(diào)整。隨著監(jiān)控系統(tǒng)不斷完善,接入的應(yīng)用也越來越多,應(yīng)用類型五花八門,依賴人工經(jīng)驗(yàn)單打獨(dú)斗的方式已經(jīng)捉襟見肘,具體表現(xiàn)在:

  • 指標(biāo)不明確:每個(gè)類型的應(yīng)用應(yīng)該有什么樣的監(jiān)控指標(biāo)不明確。
  • 策略不明確:每個(gè)指標(biāo)需要如何設(shè)置閾值、報(bào)警級(jí)別不明確。
  • 接口不明確:指標(biāo)需要采用哪種接口、如何接入監(jiān)控系統(tǒng)不明確。
  • 現(xiàn)狀不明確:應(yīng)用的監(jiān)控策略實(shí)際應(yīng)用情況如何,這些問題在過去都要依賴手工查詢核實(shí),很難快速回答。

為了全面提升應(yīng)用監(jiān)控覆蓋率,規(guī)范應(yīng)用監(jiān)控工藝,提升監(jiān)控實(shí)施效率,迫切需要進(jìn)行應(yīng)用監(jiān)控標(biāo)準(zhǔn)化。

1. 應(yīng)用監(jiān)控標(biāo)準(zhǔn)化模型:

圖片

圖1 監(jiān)控標(biāo)準(zhǔn)化模型

  • 監(jiān)控對(duì)象:從監(jiān)控角度需要關(guān)注其狀態(tài)和性能指標(biāo)的應(yīng)用對(duì)象。
  • 監(jiān)控指標(biāo):用來識(shí)別監(jiān)控對(duì)象狀態(tài)的相關(guān)數(shù)據(jù)。
  • 監(jiān)控策略:用來度量和判斷監(jiān)控指標(biāo)優(yōu)劣的標(biāo)準(zhǔn)。
  • 監(jiān)控工具:實(shí)現(xiàn)從應(yīng)用監(jiān)控對(duì)象上采集監(jiān)控指標(biāo)所采用的技術(shù)手段,是監(jiān)控策略運(yùn)行的載體。
  • 監(jiān)控規(guī)則:監(jiān)控團(tuán)隊(duì)參考各專業(yè)團(tuán)隊(duì)日常運(yùn)維經(jīng)驗(yàn)結(jié)合業(yè)內(nèi)最佳實(shí)踐總結(jié)的監(jiān)控對(duì)象和監(jiān)控策略的對(duì)應(yīng)規(guī)則,用于指導(dǎo)監(jiān)控策略的部署和對(duì)策略運(yùn)行情況進(jìn)行事后審計(jì)。

2. 應(yīng)用監(jiān)控對(duì)象模型

監(jiān)控對(duì)象標(biāo)準(zhǔn)化:除了常規(guī)的操作系統(tǒng)、數(shù)據(jù)庫(kù)、中間件外,以監(jiān)控視角對(duì)一個(gè)應(yīng)用服務(wù)的組件進(jìn)行拆分和建模。

圖片

圖2 應(yīng)用監(jiān)控對(duì)象模型圖

3. 主要應(yīng)用監(jiān)控組件和指標(biāo)

基礎(chǔ)環(huán)境層

  • 網(wǎng)絡(luò)

TCP長(zhǎng)連接監(jiān)控:該指標(biāo)主要用于對(duì)Established狀態(tài)的TCP長(zhǎng)連接進(jìn)行監(jiān)控。一般通過固定端口號(hào)作為篩選條件統(tǒng)計(jì)連接數(shù)量,同時(shí)可對(duì)該連接的緩沖區(qū)隊(duì)列深度進(jìn)行監(jiān)控,以此發(fā)現(xiàn)網(wǎng)絡(luò)連接中斷或應(yīng)用處理瓶頸的異常。

  • 文件

產(chǎn)生異常文件:該指標(biāo)主要用于對(duì)應(yīng)用進(jìn)程是否產(chǎn)生錯(cuò)誤文件或未處理文件進(jìn)行監(jiān)控。C語言應(yīng)用常見錯(cuò)誤文件為bin目錄下產(chǎn)生coredump,或應(yīng)用程序自定義生成的.err文件。此外對(duì)于應(yīng)用目錄下超時(shí)未處理的文件,也可視同為發(fā)現(xiàn)異常文件而需要監(jiān)控和報(bào)警。

缺失關(guān)鍵文件:該指標(biāo)主要用于對(duì)應(yīng)用目錄下的數(shù)據(jù)文件存在性進(jìn)行監(jiān)控,通常結(jié)合時(shí)間段條件進(jìn)行綜合判斷,可提前發(fā)現(xiàn)數(shù)據(jù)文件未生成、未傳輸、文件名不符等異?,F(xiàn)象。

  • 內(nèi)存

GC次數(shù)/分鐘:該指標(biāo)用于對(duì)Java虛擬機(jī)每分鐘的FullGC次數(shù)進(jìn)行監(jiān)控,用于發(fā)現(xiàn)Java虛擬機(jī)堆內(nèi)存不足的問題。相比于對(duì)Heap空間使用率的監(jiān)控,通過對(duì)持續(xù)的、多次FullGC更加能夠準(zhǔn)確的發(fā)現(xiàn)應(yīng)用程序運(yùn)行中潛在的內(nèi)存問題。

直接內(nèi)存使用率:該指標(biāo)用于對(duì)Java直接內(nèi)存(堆外內(nèi)存)的使用率進(jìn)行監(jiān)控,用于發(fā)現(xiàn)Java直接內(nèi)存空間使用的容量問題。?

應(yīng)用組件層

●API調(diào)用

API調(diào)用異常:該指標(biāo)用于對(duì)應(yīng)用程序調(diào)用外部API接口存在的錯(cuò)誤和超時(shí)進(jìn)行監(jiān)控。常見的通用外部接口可能包括加密機(jī)API、Redis API、MQ API等,通過對(duì)調(diào)用接口的系統(tǒng)級(jí)錯(cuò)誤信息進(jìn)行實(shí)時(shí)監(jiān)控,能夠更早、更明確的提示故障根因。

●隊(duì)列

隊(duì)列深度:該指標(biāo)用于對(duì)應(yīng)用程序內(nèi)部自定義隊(duì)列的深度進(jìn)行監(jiān)控。隊(duì)列深度的單位可能是隊(duì)列內(nèi)消息數(shù)量、隊(duì)列內(nèi)超時(shí)待處理消息的數(shù)量等,用于發(fā)現(xiàn)應(yīng)用程序可能存在的性能瓶頸。

功能服務(wù)層

●定時(shí)任務(wù)

批量任務(wù)失敗/批量任務(wù)超時(shí):該指標(biāo)用于對(duì)批量任務(wù)的運(yùn)行狀態(tài)/運(yùn)行時(shí)間進(jìn)行監(jiān)控。尤其對(duì)關(guān)鍵批量任務(wù)(影響系統(tǒng)開門、客戶服務(wù)、監(jiān)管報(bào)送)設(shè)定高報(bào)警級(jí)別,確保及時(shí)通報(bào)和處理。

●應(yīng)用功能

系統(tǒng)換日狀態(tài):該指標(biāo)用于對(duì)各交易類系統(tǒng)的賬務(wù)日期更換狀態(tài)進(jìn)行監(jiān)控。

秘鑰交換狀態(tài):該指標(biāo)用于對(duì)聯(lián)機(jī)交易類系統(tǒng)和加密平臺(tái)之間秘鑰交換的結(jié)果進(jìn)行監(jiān)控。

應(yīng)用健康檢查:該指標(biāo)用于對(duì)應(yīng)用服務(wù)的存活狀態(tài)進(jìn)行外部探測(cè)檢查,用于及時(shí)發(fā)現(xiàn)服務(wù)夯死的情況,檢查方式通常為通過監(jiān)控工具發(fā)起http探測(cè)或模擬交易探測(cè)。

●業(yè)務(wù)服務(wù)

交易成功率/響應(yīng)率/交易量/響應(yīng)時(shí)間:此類指標(biāo)為聯(lián)機(jī)交易類應(yīng)用系統(tǒng)的通用指標(biāo),通過從容量、延遲、錯(cuò)誤3個(gè)維度度量應(yīng)用服務(wù)健康狀態(tài)。需要關(guān)注的是可細(xì)分為多個(gè)維度,如全局指標(biāo)/單交易碼、渠道、商戶、系統(tǒng)返回碼/業(yè)務(wù)返回碼等,通過維度+指標(biāo)組合分析發(fā)現(xiàn)和定位應(yīng)用系統(tǒng)交易的異常。

4. 監(jiān)控工具標(biāo)準(zhǔn)化

監(jiān)控工具的標(biāo)準(zhǔn)化,核心思想是根據(jù)各類工具的特性合理運(yùn)用工具,充分發(fā)揮工具特長(zhǎng)。根據(jù)監(jiān)控需求,監(jiān)控工具的選取因素包括:有代理/無代理采集、監(jiān)控主動(dòng)采集/監(jiān)控被動(dòng)接收、帶內(nèi)采集/帶外采集等。

自定義監(jiān)控指標(biāo):具有周期性和靈活性的特點(diǎn),適合使用有代理、主動(dòng)采集方式,如Zabbix、Prometheus等。

關(guān)鍵通知消息:具有實(shí)時(shí)和精準(zhǔn)的特點(diǎn),適合使用應(yīng)用主動(dòng)推送、監(jiān)控被動(dòng)接收的采集方式,如syslog、trap、webhook等。

交易數(shù)據(jù)指標(biāo):具有數(shù)據(jù)量大、數(shù)據(jù)原始程度高的特點(diǎn),適合采用旁路/帶外方式將原始數(shù)據(jù)進(jìn)行采集后送入專用的監(jiān)控工具進(jìn)行分析和處理,減少采集和分析對(duì)原有系統(tǒng)的影響。適用的工具包括BPC工具、CDC類工具(變更數(shù)據(jù)捕獲)等。

5. 監(jiān)控策略標(biāo)準(zhǔn)化

監(jiān)控策略標(biāo)準(zhǔn)化的重要內(nèi)容是報(bào)警級(jí)別。G行從兩個(gè)維度來定義報(bào)警級(jí)別:

  • 按照管理員視角來定義的級(jí)別:根據(jù)技術(shù)人員是否需要立即展開處置動(dòng)作來定級(jí),1級(jí)表示需技術(shù)人員立即處置的報(bào)警,2級(jí)表示需進(jìn)一步判斷分析的報(bào)警,3級(jí)表示暫無需處理的報(bào)警。
  • 按照業(yè)務(wù)人員/管理層的視角來定義的級(jí)別:根據(jù)業(yè)務(wù)影響的大小來定義報(bào)警級(jí)別,從高到低分別為重大影響、較大影響、一般影響、輕微影響、潛在影響和無影響。
  • 按照上述規(guī)則配置應(yīng)用監(jiān)控報(bào)警策略,當(dāng)報(bào)警發(fā)生時(shí)分別從兩個(gè)維度進(jìn)行展示、通報(bào)和升級(jí)等后續(xù)處理,滿足技術(shù)人員和管理層的差異化運(yùn)維需求。

6. 智能運(yùn)維技術(shù)的應(yīng)用

AIOps技術(shù)的推廣使用,為應(yīng)用監(jiān)控標(biāo)準(zhǔn)能力帶來了以下提升:

  • 動(dòng)態(tài)閾值豐富了監(jiān)控策略的管理模式:基于大數(shù)據(jù)、實(shí)時(shí)計(jì)算和無監(jiān)督算法的智能運(yùn)維技術(shù),對(duì)于各項(xiàng)運(yùn)行指標(biāo)的歷史數(shù)據(jù)生成預(yù)測(cè)基線,實(shí)時(shí)計(jì)算生產(chǎn)運(yùn)行數(shù)據(jù)的偏差程度,及時(shí)發(fā)現(xiàn)運(yùn)行指標(biāo)的異常情況。在原有的基于固定閾值監(jiān)控策略模式基礎(chǔ)上,動(dòng)態(tài)閾值豐富了監(jiān)控標(biāo)準(zhǔn)化策略,成為應(yīng)用系統(tǒng)交易監(jiān)控必須部署的標(biāo)準(zhǔn)監(jiān)控策略。
  • 多維分析技術(shù)提升故障根因定位能力:基于交易碼、返回碼、渠道碼、商戶碼以及服務(wù)處理節(jié)點(diǎn)信息等多維度的交易分析,在應(yīng)用系統(tǒng)聯(lián)機(jī)交易關(guān)鍵指標(biāo)發(fā)生異常時(shí),能夠快速推算出導(dǎo)致異常的組合因子,便于科技人員迅速定位故障原因,同時(shí)通過支持黑白名單機(jī)制預(yù)先固化運(yùn)維經(jīng)驗(yàn),提升故障告警準(zhǔn)確性。

分布式應(yīng)用監(jiān)控標(biāo)準(zhǔn)化

隨著容器技術(shù)、微服務(wù)以及分布式應(yīng)用的興起和部署,G行原有的面向傳統(tǒng)環(huán)境的應(yīng)用監(jiān)控面臨著巨大挑戰(zhàn),包括大量開源軟件的使用、應(yīng)用彈性擴(kuò)縮容常態(tài)化、CI/CD帶來的開發(fā)投產(chǎn)模式的變更等。G行在傳統(tǒng)環(huán)境監(jiān)控標(biāo)準(zhǔn)化的基礎(chǔ)上進(jìn)一步優(yōu)化了標(biāo)準(zhǔn)化工作模型,支持分布式應(yīng)用的監(jiān)控管理。

1. 監(jiān)控標(biāo)準(zhǔn)化工作模型

圖片

圖3 監(jiān)控標(biāo)準(zhǔn)化方法模型圖

2. 分布式監(jiān)控指標(biāo)參考

面對(duì)分布式環(huán)境下大量開源產(chǎn)品/組件的使用,監(jiān)控標(biāo)準(zhǔn)化的牛鼻子是監(jiān)控指標(biāo)標(biāo)準(zhǔn)化。

在監(jiān)控指標(biāo)選取方面,G行參考Google提出了黃金指標(biāo)概念,具體內(nèi)容如下圖所示:

圖片

圖4 黃金指標(biāo)模型圖

3. 分布式監(jiān)控指標(biāo)制定原則

  • 分層分類:監(jiān)控指標(biāo)進(jìn)行分層、分類,由專業(yè)團(tuán)隊(duì)和監(jiān)控團(tuán)隊(duì)合力豐富監(jiān)控標(biāo)準(zhǔn)。
  • 標(biāo)準(zhǔn)統(tǒng)一:無論傳統(tǒng)平臺(tái)還是容器云平臺(tái),對(duì)于同一類對(duì)象的監(jiān)控標(biāo)準(zhǔn)要統(tǒng)一,確保指標(biāo)全覆蓋。
  • 同類對(duì)標(biāo):對(duì)于相同類型的監(jiān)控對(duì)象,需對(duì)標(biāo)原有相似類型的監(jiān)控對(duì)象。
  • 敏捷迭代:通過主動(dòng)分析和監(jiān)控未達(dá)事件分析機(jī)制,持續(xù)補(bǔ)充和完善原有監(jiān)控規(guī)范。

4. 分布式應(yīng)用監(jiān)控模型

圖片

圖5 分布式監(jiān)控模型圖

在傳統(tǒng)的應(yīng)用服務(wù)監(jiān)控模型基礎(chǔ)上,增加了微服務(wù)組件,如注冊(cè)中心、配置中心、API網(wǎng)關(guān)等,增加了分布式應(yīng)用組件,如分布式緩存、分布式批量、分布式消息、分布式數(shù)據(jù)庫(kù)的監(jiān)控標(biāo)準(zhǔn)化。

5. 分布式指標(biāo)接入

通過監(jiān)控標(biāo)準(zhǔn)化中的指標(biāo)接入規(guī)范、指標(biāo)測(cè)試規(guī)范、應(yīng)用監(jiān)控策略部署規(guī)范以及生產(chǎn)事件跟蹤機(jī)制,將監(jiān)控工作前移至應(yīng)用開發(fā)和測(cè)試環(huán)節(jié),形成管理閉環(huán)。

監(jiān)控指標(biāo)的接口格式統(tǒng)一采用Prometheus采集規(guī)范,即應(yīng)用程序通過http協(xié)議主動(dòng)暴露數(shù)據(jù),監(jiān)控工具采用pull模型定期拉取監(jiān)控?cái)?shù)據(jù)。接口格式為:

<指標(biāo)名稱>{<標(biāo)簽名稱>=<標(biāo)簽值>, ...} 數(shù)據(jù)

指標(biāo)名稱:反映了被監(jiān)控樣本的含義。

標(biāo)簽:大括號(hào)中的標(biāo)簽反映了當(dāng)前樣本的特征維度,用于對(duì)樣本數(shù)據(jù)進(jìn)行過濾,聚合等。

數(shù)據(jù):采集到的具體值。

應(yīng)用指標(biāo)暴露方式主要分為以下兩種:

基于G行通用研發(fā)平臺(tái)開發(fā)的應(yīng)用程序:平臺(tái)已內(nèi)置了監(jiān)控SDK包,默認(rèn)支持暴露應(yīng)用或Spring Boot框架,按照要求進(jìn)行配置即可暴露監(jiān)控指標(biāo)。

非G行通用研發(fā)平臺(tái)開發(fā)的應(yīng)用程序:需要應(yīng)用程序基于Prometheus的client sdk 或Spring Boot Actuator開發(fā)監(jiān)控接口,按照監(jiān)控標(biāo)準(zhǔn)暴露應(yīng)用監(jiān)控指標(biāo)。

6. 基于標(biāo)簽的監(jiān)控自動(dòng)化部署機(jī)制

針對(duì)每類監(jiān)控對(duì)象我們都設(shè)計(jì)了監(jiān)控標(biāo)簽,監(jiān)控標(biāo)簽與一組標(biāo)準(zhǔn)監(jiān)控指標(biāo)和標(biāo)準(zhǔn)監(jiān)控策略對(duì)應(yīng),我們稱之為標(biāo)準(zhǔn)化監(jiān)控規(guī)則。監(jiān)控標(biāo)簽主要用于以下三個(gè)場(chǎng)景:

圖片

圖6 監(jiān)控標(biāo)簽應(yīng)用場(chǎng)景

監(jiān)控標(biāo)簽的工作機(jī)制如下:

  • 通過指定標(biāo)簽查詢指定數(shù)據(jù)
  • 通過標(biāo)簽實(shí)現(xiàn)豐富的聚合和查詢
  • 監(jiān)視具有特定服務(wù)發(fā)現(xiàn)注解的監(jiān)控目標(biāo)
  • 向目標(biāo)抓取請(qǐng)求添加 HTTP 查詢參數(shù)
  • 僅存儲(chǔ)從指定目標(biāo)中提取樣本的子集
  • 將抓取序列的兩個(gè)標(biāo)簽值合并為一個(gè)標(biāo)簽

平臺(tái)已有的應(yīng)用類型新接入時(shí)只需要使用制品庫(kù)提供的帶監(jiān)控基礎(chǔ)鏡像生成應(yīng)用鏡像,同時(shí)在容器云平臺(tái)通過圖形化方式生成帶有監(jiān)控標(biāo)簽的Service.yaml文件,后續(xù)基于該yaml文件的應(yīng)用發(fā)布投產(chǎn)后,監(jiān)控系統(tǒng)采集到的數(shù)據(jù)同步打上了監(jiān)控標(biāo)簽,自動(dòng)匹配對(duì)應(yīng)的監(jiān)控策略,實(shí)現(xiàn)了全自動(dòng)監(jiān)控對(duì)象發(fā)現(xiàn)和監(jiān)控策略對(duì)接,無需人工干預(yù),確保監(jiān)控標(biāo)準(zhǔn)化全覆蓋。

7. 量化監(jiān)控評(píng)價(jià)

通常監(jiān)控系統(tǒng)運(yùn)行效果評(píng)價(jià)的指標(biāo)是監(jiān)控發(fā)現(xiàn)率、報(bào)警壓縮率、報(bào)警根因定位率等,這些指標(biāo)都偏向于通過事后的量化統(tǒng)計(jì)體現(xiàn)監(jiān)控系統(tǒng)的效能。除了這些指標(biāo)外,G行還定義了監(jiān)控覆蓋率和監(jiān)控標(biāo)準(zhǔn)化率兩個(gè)指標(biāo)。

監(jiān)控標(biāo)準(zhǔn)化率的計(jì)算公式為:

監(jiān)控標(biāo)準(zhǔn)化率 =監(jiān)控檔案 /監(jiān)控標(biāo)準(zhǔn) *100%

監(jiān)控檔案 = ∑監(jiān)控對(duì)象 *已部署標(biāo)準(zhǔn)監(jiān)控策略

監(jiān)控標(biāo)準(zhǔn) = ∑監(jiān)控對(duì)象 *應(yīng)部署標(biāo)準(zhǔn)監(jiān)控策略

按照上述公式對(duì)應(yīng)用系統(tǒng)的所有組件進(jìn)行監(jiān)控標(biāo)準(zhǔn)化的度量,可獲得每個(gè)應(yīng)用系統(tǒng)的監(jiān)控標(biāo)準(zhǔn)化率。

圖片

圖7 應(yīng)用監(jiān)控量化評(píng)價(jià)效果圖

通過上述排名機(jī)制,可以獲知各個(gè)應(yīng)用系統(tǒng)的監(jiān)控策略和基線的偏差情況,對(duì)于缺失的監(jiān)控項(xiàng)需及時(shí)進(jìn)行補(bǔ)充部署監(jiān)控策略,對(duì)于非標(biāo)準(zhǔn)的監(jiān)控項(xiàng)(如個(gè)性化閾值、報(bào)警級(jí)別降低等情況)需進(jìn)行應(yīng)用系統(tǒng)的整改以滿足標(biāo)準(zhǔn)化要求。

目前G行已完成對(duì)全局類系統(tǒng)的應(yīng)用監(jiān)控標(biāo)準(zhǔn)化評(píng)分,后續(xù)還將持續(xù)優(yōu)化和推廣量化反饋機(jī)制,持續(xù)提升監(jiān)控效能。

小結(jié)與展望

通過多年探索與實(shí)踐,G行逐步建立了應(yīng)用監(jiān)控標(biāo)準(zhǔn)化的實(shí)施方法模型、應(yīng)用服務(wù)模型、監(jiān)控指標(biāo)體系以及閉環(huán)量化管理機(jī)制,逐步完善了傳統(tǒng)應(yīng)用與分布式應(yīng)用的監(jiān)控手段,提升了監(jiān)控系統(tǒng)整體效能。面對(duì)日益復(fù)雜的應(yīng)用系統(tǒng)環(huán)境,G行后續(xù)將持續(xù)進(jìn)行監(jiān)控系統(tǒng)優(yōu)化,通過持續(xù)豐富應(yīng)用監(jiān)控指標(biāo)集、引入非侵入監(jiān)控?cái)?shù)據(jù)采集方式、支持自助式監(jiān)控配置管理模式等工作,提升應(yīng)用監(jiān)控能力。

責(zé)任編輯:武曉燕 來源: 匠心獨(dú)運(yùn)維妙維效
相關(guān)推薦

2011-03-03 10:37:24

云計(jì)算戴爾

2016-10-07 22:09:59

2013-05-06 14:13:54

自組織網(wǎng)絡(luò)SON

2010-04-20 14:55:58

Oracle標(biāo)準(zhǔn)化

2021-11-09 10:00:02

EverDB自動(dòng)化數(shù)據(jù)庫(kù)

2015-09-01 10:28:56

云計(jì)算標(biāo)準(zhǔn)化需求標(biāo)準(zhǔn)化組織

2012-06-14 10:16:30

ibmdw

2021-05-14 13:57:01

數(shù)據(jù)標(biāo)準(zhǔn)組織技術(shù)

2024-09-29 08:54:36

2013-07-19 14:05:39

5G5G標(biāo)準(zhǔn)4G

2018-01-09 09:32:48

開源標(biāo)準(zhǔn)化基礎(chǔ)設(shè)施

2015-09-02 13:09:32

大數(shù)據(jù)標(biāo)準(zhǔn)化

2017-12-07 11:16:17

云計(jì)算云服務(wù)國(guó)際標(biāo)準(zhǔn)

2010-01-27 15:05:04

C++標(biāo)準(zhǔn)化

2012-07-27 09:33:56

云計(jì)算標(biāo)準(zhǔn)化

2015-08-25 10:40:22

運(yùn)維標(biāo)準(zhǔn)化

2009-12-21 13:42:10

Linux手機(jī)

2017-02-15 13:29:06

智慧物業(yè)紫薇物業(yè)信息化

2023-03-03 13:59:24

2024-04-02 07:59:06

G行科技客服
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)