自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

基于時(shí)序數(shù)據(jù)庫做監(jiān)控,這里有超流行的開源方案

運(yùn)維 數(shù)據(jù)庫運(yùn)維
在微服務(wù)架構(gòu)下,我們對(duì)服務(wù)進(jìn)行了拆分,所以用戶的每次請(qǐng)求不再是由某一個(gè)服務(wù)獨(dú)立完成了,而是變成了多個(gè)服務(wù)一起配合完成。這種情況下,一旦請(qǐng)求出現(xiàn)異常,我們必須得知道是在哪個(gè)服務(wù)環(huán)節(jié)出了故障,就需要對(duì)每一個(gè)服務(wù),以及各個(gè)指標(biāo)都進(jìn)行全面的監(jiān)控。

 在微服務(wù)架構(gòu)下,我們對(duì)服務(wù)進(jìn)行了拆分,所以用戶的每次請(qǐng)求不再是由某一個(gè)服務(wù)獨(dú)立完成了,而是變成了多個(gè)服務(wù)一起配合完成。這種情況下,一旦請(qǐng)求出現(xiàn)異常,我們必須得知道是在哪個(gè)服務(wù)環(huán)節(jié)出了故障,就需要對(duì)每一個(gè)服務(wù),以及各個(gè)指標(biāo)都進(jìn)行全面的監(jiān)控。

[[277024]]

一、什么是「 監(jiān)控系統(tǒng) 」?

在微服務(wù)架構(gòu)中,監(jiān)控系統(tǒng)按照原理和作用大致可以分為三類(并非嚴(yán)格分類,僅從日常使用角度來看):

  • 日志類(Log);
  • 調(diào)用鏈類(Tracing);
  • 度量類(Metrics)。

下面來分別對(duì)這三種常見的監(jiān)控模式進(jìn)行說明。

1、日志類

日志類比較常見,我們的框架代碼、系統(tǒng)環(huán)境,以及業(yè)務(wù)邏輯中一般都會(huì)產(chǎn)出一些日志,這些日志我們通常把它記錄后統(tǒng)一收集起來,方便在需要的時(shí)候進(jìn)行查詢。

日志類記錄的信息一般是一些事件、非結(jié)構(gòu)化的一些文本內(nèi)容。日志的輸出和處理的解決方案比較多,大家熟知的有ELK Stack方案(Elasticseach + Logstash + Kibana),如圖:

 

基于時(shí)序數(shù)據(jù)庫做監(jiān)控,這里有超流行的開源方案

 

使用Beats(可選)在每臺(tái)服務(wù)器上安裝后,作為日志客戶端收集器,然后通過Logstash進(jìn)行統(tǒng)一的日志收集、解析、過濾等處理,再將數(shù)據(jù)發(fā)送給Elasticsearch中進(jìn)行存儲(chǔ)分析,最后使用Kibana來進(jìn)行數(shù)據(jù)的展示。

當(dāng)然還可以升級(jí)方案為:

 

基于時(shí)序數(shù)據(jù)庫做監(jiān)控,這里有超流行的開源方案

 

這些方案都比較成熟,搭建起來也比較簡(jiǎn)單,除了用作監(jiān)控系統(tǒng)以外,還可以作為日志查詢系統(tǒng)使用,非常適用于做分析、以及問題調(diào)試使用。

2、調(diào)用鏈類(Tracing)

調(diào)用鏈類監(jiān)控主要是指記錄一個(gè)請(qǐng)求的全部流程。一個(gè)請(qǐng)求從開始進(jìn)入,在微服務(wù)中調(diào)用不同的服務(wù)節(jié)點(diǎn)后,再返回給客戶端,在這個(gè)過程中通過調(diào)用鏈參數(shù)來追尋全鏈路行為。通過這個(gè)方式可以很方便的知道請(qǐng)求在哪個(gè)環(huán)節(jié)出了故障,系統(tǒng)的瓶頸在哪兒。

這一類的監(jiān)控一般采用CAT工具 來完成,一般在大中型項(xiàng)目較多用到,因?yàn)榇罱ㄆ饋碛幸欢ǖ某杀?。后面?huì)有單獨(dú)文章來講解這個(gè)調(diào)用鏈監(jiān)控系統(tǒng)。

這也是簡(jiǎn)單的容錯(cuò)方式。就是指在服務(wù)之間調(diào)用時(shí),設(shè)置一個(gè)主動(dòng)超時(shí)時(shí)間,超過了這個(gè)時(shí)間閾值后,如果“被依賴的服務(wù)”還沒有返回?cái)?shù)據(jù)的話,“調(diào)用者”就主動(dòng)放棄,防止因“被依賴的服務(wù)”的故障所影響。

3、度量類(Metrics)

度量類主要采用時(shí)序數(shù)據(jù)庫的解決方案。它是以事件發(fā)生時(shí)間以及當(dāng)前數(shù)值的角度來記錄的監(jiān)控信息,是可以聚合運(yùn)算的,用于查看一些指標(biāo)數(shù)據(jù)和指標(biāo)趨勢(shì)。所以這類監(jiān)控主要不是用來查問題的,主要是用來看趨勢(shì)的。

Metrics一般有5種基本的度量類型:

  • Gauges(度量);
  • Counters(計(jì)數(shù)器);
  • Histograms(直方圖);
  • Meters(TPS計(jì)算器);
  • Timers(計(jì)時(shí)器)。

基于時(shí)間序列數(shù)據(jù)庫的監(jiān)控系統(tǒng)是非常適合做監(jiān)控告警使用的,所以現(xiàn)在也比較流行這個(gè)方案,如果我們要搭建一套新的監(jiān)控系統(tǒng),我也建議參考這類方案進(jìn)行。

因此本文接下來也會(huì)重點(diǎn)以時(shí)間序列數(shù)據(jù)庫的監(jiān)控系統(tǒng)為主角來描述。

二、「 監(jiān)控系統(tǒng) 」關(guān)注的對(duì)象和指標(biāo)都是什么?

一般我們做「監(jiān)控系統(tǒng)」都是需要做分層式監(jiān)控的,也就是說將我們要監(jiān)控的對(duì)象進(jìn)行分層,一般主要分為:

  • 系統(tǒng)層:系統(tǒng)層主要是指CPU、磁盤、內(nèi)存、網(wǎng)絡(luò)等服務(wù)器層面的監(jiān)控,這些一般也是運(yùn)維同學(xué)比較關(guān)注的對(duì)象;
  • 應(yīng)用層:應(yīng)用層指的是服務(wù)角度的監(jiān)控,比如接口、框架、某個(gè)服務(wù)的健康狀態(tài)等,一般是服務(wù)開發(fā)或框架開發(fā)人員關(guān)注的對(duì)象;
  • 用戶層:這一層主要是與用戶、與業(yè)務(wù)相關(guān)的一些監(jiān)控,屬于功能層面的,大多數(shù)是項(xiàng)目經(jīng)理或產(chǎn)品經(jīng)理會(huì)比較關(guān)注的對(duì)象。

知道了監(jiān)控的分層后,我們?cè)賮砜匆幌卤O(jiān)控的指標(biāo)一般有哪些:

  • 延遲時(shí)間:主要是響應(yīng)一個(gè)請(qǐng)求所消耗的延遲,比如某接口的HTTP請(qǐng)求平均響應(yīng)時(shí)間為100ms;
  • 請(qǐng)求量:是指系統(tǒng)的容量吞吐能力,例如每秒處理多少次請(qǐng)求(QPS)作為指標(biāo);
  • 錯(cuò)誤率:主要是用來監(jiān)控錯(cuò)誤發(fā)生的比例,比如將某接口一段時(shí)間內(nèi)調(diào)用時(shí)失敗的比例作為指標(biāo)。

三、基于時(shí)序數(shù)據(jù)庫的「 監(jiān)控系統(tǒng) 」有哪些?

下面介紹幾款目前業(yè)內(nèi)比較流行的基于時(shí)間序列數(shù)據(jù)庫的開源監(jiān)控方案。

1、Prometheus

Promethes是一款2012年開源的監(jiān)控框架,其本質(zhì)是時(shí)間序列數(shù)據(jù)庫,由Google前員工所開發(fā)。

Promethes采用拉的模式(Pull)從應(yīng)用中拉取數(shù)據(jù),并還支持Alert模塊可以實(shí)現(xiàn)監(jiān)控預(yù)警。它的性能非常強(qiáng)勁,單機(jī)可以消費(fèi)百萬級(jí)時(shí)間序列。

架構(gòu)如下:

 

基于時(shí)序數(shù)據(jù)庫做監(jiān)控,這里有超流行的開源方案

 

從看圖的左下角可以看到,Prometheus可以通過在應(yīng)用里進(jìn)行埋點(diǎn)后Pull到Prometheus Server里,如果應(yīng)用不支持埋點(diǎn),也可以采用exporter方式進(jìn)行數(shù)據(jù)采集。

從圖的左上角可以看到,對(duì)于一些定時(shí)任務(wù)模塊,因?yàn)槭侵芷谛赃\(yùn)行的,所以采用拉的方式無法獲取數(shù)據(jù),那么Prometheus也提供了一種推數(shù)據(jù)的方式,但是并不是推送到Prometheus Server中,而是中間搭建一個(gè)Pushgateway,定時(shí)任務(wù)模塊將metrics信息推送到這個(gè)Pushgateway中,然后Prometheus Server再依然采用拉的方式從Pushgateway中獲取數(shù)據(jù)。

需要拉取的數(shù)據(jù)既可以采用靜態(tài)方式配置在Prometheus Server中,也可以采用服務(wù)發(fā)現(xiàn)的方式(即圖的中上方Service discovery所示)。

PromQL:是Prometheus自帶的查詢語法,通過編寫PromQL語句可以查詢Prometheus里面的數(shù)據(jù)。

Alertmanager:是用于數(shù)據(jù)的預(yù)警模塊,支持通過多種方式去發(fā)送預(yù)警。

WebUI:是用來展示數(shù)據(jù)和圖形的,但是一般大多數(shù)是與Grafana結(jié)合,采用Grafana來展示。

2、OpenTSDB

OpenTSDB是在2010年開源的一款分布式時(shí)序數(shù)據(jù)庫,當(dāng)然其主要用于監(jiān)控方案中。

OpenTSDB采用的是HBase的分布式存儲(chǔ),它獲取數(shù)據(jù)的模式與Prometheus不同,采用的是推模式(Push)。

在展示層,OpenTSDB自帶有WebUI視圖,也可以與Grafana很好的集成,提供豐富的展示界面。

但OpenTSDB并沒有自帶預(yù)警模塊,需要自己去開發(fā)或者與第三方組件結(jié)合使用。

可以通過下圖來了解一下OpenTSDB的架構(gòu):

 

基于時(shí)序數(shù)據(jù)庫做監(jiān)控,這里有超流行的開源方案

 

3、InfluxDB

InfluxDB是在2013年開源的一款時(shí)序數(shù)據(jù)庫,在這里我們主要還是用于做監(jiān)控系統(tǒng)方案。它收集數(shù)據(jù)也是采用推模式(Push)。在展示層,InfluxDB也是自帶WebUI,也可以與Grafana集成。

 

基于時(shí)序數(shù)據(jù)庫做監(jiān)控,這里有超流行的開源方案

 

以上,就是我對(duì)微服務(wù)架構(gòu)中「 監(jiān)控系統(tǒng)」的一些思考。

責(zé)任編輯:華軒 來源: 今日頭條
相關(guān)推薦

2022-07-06 15:41:55

數(shù)據(jù)庫

2022-09-23 07:44:48

時(shí)序數(shù)據(jù)庫物聯(lián)網(wǎng)

2017-11-20 11:37:19

時(shí)序數(shù)據(jù)數(shù)據(jù)存儲(chǔ)HBase

2021-03-08 10:18:55

數(shù)據(jù)庫數(shù)據(jù)Prometheus

2021-03-15 10:10:29

數(shù)據(jù)庫數(shù)據(jù)查詢

2021-09-26 10:08:33

TSDB時(shí)序數(shù)據(jù)庫壓縮解壓

2020-03-11 09:50:21

時(shí)序數(shù)據(jù)庫快速檢索

2018-08-02 15:40:59

2022-07-11 10:45:12

數(shù)據(jù)庫分析

2020-03-17 10:35:40

大數(shù)據(jù)IT人工智能

2018-04-19 10:33:39

DevOps開源工具

2022-07-11 11:12:32

數(shù)據(jù)分析

2023-11-21 08:45:10

JSON性能程序

2022-12-18 19:38:31

時(shí)序數(shù)據(jù)庫數(shù)據(jù)庫

2021-03-01 10:20:52

存儲(chǔ)

2021-02-22 10:37:47

存儲(chǔ)Prometheus

2021-08-31 14:01:59

時(shí)序數(shù)據(jù)庫數(shù)據(jù)庫數(shù)據(jù)

2022-07-07 12:23:29

數(shù)據(jù)庫

2023-09-24 23:22:23

2022-07-07 12:37:27

數(shù)據(jù)
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)