自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

12個高價值Kubernetes健康指標(biāo),需要持續(xù)監(jiān)控

開發(fā) 前端
Kubernetes每天可以生成數(shù)百萬個新指標(biāo)。監(jiān)控集群運行狀況很具挑戰(zhàn)性的方面之一是篩選收集和關(guān)注這些指標(biāo)中的哪些很重要。下面介紹應(yīng)該監(jiān)控并為其創(chuàng)建警報的12個關(guān)鍵Kubernetes健

 Kubernetes每天可以生成數(shù)百萬個新指標(biāo)。監(jiān)控集群運行狀況很具挑戰(zhàn)性的方面之一是篩選收集和關(guān)注這些指標(biāo)中的哪些很重要。下面介紹應(yīng)該監(jiān)控并為其創(chuàng)建警報的12個關(guān)鍵Kubernetes健

康指標(biāo)。你所在的企業(yè)可能會略有不同,但是這12個是制定企業(yè)的Kubernetes監(jiān)控策略的良好起點。

 

12個高價值Kubernetes健康指標(biāo),需要持續(xù)監(jiān)控

 

崩潰循環(huán)

崩潰循環(huán)是指Pod啟動,崩潰然后繼續(xù)嘗試重新啟動但無法恢復(fù)的時間(它不斷崩潰并以循環(huán)方式重新啟動)。發(fā)生這種情況時,應(yīng)用程序無法運行。這可能是由于Pod中的應(yīng)用程序崩潰導(dǎo)致

的,也可能是由于Pod中的配置錯誤或部署過程導(dǎo)致的,這使得調(diào)試崩潰循環(huán)變得非常棘手。當(dāng)發(fā)生崩潰循環(huán)時,需要立即知道,弄清正在發(fā)生的事情以及是否需要采取緊急措施,保持應(yīng)用程

序可用。

CPU利用率

CPU利用率只是節(jié)點使用的CPU周期數(shù)。進行監(jiān)控非常重要,其原因有兩個。首先,你不希望耗盡應(yīng)用程序的處理資源。如果應(yīng)用程序受到CPU的限制,則需要增加CPU分配或向集群添加更多節(jié)

點。其次,你不希望CPU閑置。如果CPU使用率一直很低,則可能是資源過度分配,有可能浪費支出。

磁盤壓力

根據(jù)在Kubernetes配置中設(shè)置的閾值,磁盤壓力是表明節(jié)點使用過多磁盤空間或使用磁盤空間的速度過快的情況。這對于監(jiān)控非常重要,因為如果應(yīng)用程序合法需要更多空間,則可能意味著

需要添加更多磁盤空間。否則可能意味著應(yīng)用程序行為異常。無論哪種方式,這種情況都需要引起注意。

內(nèi)存壓力

內(nèi)存壓力是另一種資源狀況,表明節(jié)點內(nèi)存不足。類似于CPU資源配置,不想完全消耗內(nèi)存資源,但也不想過度分配內(nèi)存資源并浪費成本。那么需要注意這種情況,因為這可能意味著一個應(yīng)用

程序中存在內(nèi)存泄漏。

PID壓力

PID壓力是一種罕見的情況,在這種情況下,pod或容器會產(chǎn)生過多的進程,并使節(jié)點無法獲得可用的進程ID。每個節(jié)點具有有限數(shù)量的進程ID,從而在運行中的進程之間分配;如果ID用完了

,則無法啟動其他進程。Kubernetes允許為Pod設(shè)置PID閾值來限制其執(zhí)行失控的流程生成的能力,并且PID壓力條件意味著一個或多個Pod耗盡了其分配的PID,需要進行檢查。

網(wǎng)絡(luò)不可用

所有的節(jié)點都需要網(wǎng)絡(luò)連接,并且其狀態(tài)表示節(jié)點的網(wǎng)絡(luò)連接有問題與否。要么沒有正確設(shè)置(由于路由耗盡或配置錯誤),要么是與硬件的網(wǎng)絡(luò)連接存在物理問題。

Job失敗

Job的目的是在有限的時間內(nèi)運行pod,并在完成預(yù)期的功能時將其拆解。如果Job由于節(jié)點崩潰或重新引導(dǎo)或資源耗盡而未能成功完成,則需要知道該Job已失敗。這就是為什么需要監(jiān)控Job失

敗的原因。它們通常并不意味著應(yīng)用程序不可訪問,但是如果未解決,則可能會導(dǎo)致問題。

持久卷故障

持久卷是在集群上指定的存儲資源,可用作任何請求它的Pod的持久存儲。在它們的生命周期中,它們綁定到一個容器,然后在該容器不再需要時回收。如果回收由于某種原因而失敗,那么需

要知道持久性存儲存在問題。

暫掛Pod的延遲時間

在pod的生命周期中,如果它正在等待在節(jié)點上進行調(diào)度,則其狀態(tài)為“待處理”。如果卡在“掛起”狀態(tài),通常意味著沒有足夠的資源來安排和部署Pod。將需要更新CPU和內(nèi)存分配,刪除

pod或向集群添加更多節(jié)點。

Deployment故障

Deployment用于管理無狀態(tài)應(yīng)用程序-Pod是可互換的,不需要能夠到達任何特定的單個Pod,而只需到達特定類型的Pod即可。需要密切注意部署以確保它們正確完成。最好的方法是確保觀察

到的Deployment數(shù)量與所需的Deployment數(shù)量匹配。如果不匹配,則一個或多個Deployment失敗。

StatefulSets尚未就緒

StatefulSets用于管理有狀態(tài)的應(yīng)用程序,其中的Pod具有特定的角色,需要到達其他特定的Pod。而不是像Deployment那樣只需要特定類型的Pod。但是,監(jiān)控是相同的,需要確保觀察到的

StatefulSet的數(shù)量與所需的StatefulSet的數(shù)量匹配。如果存在不匹配,則一個或多個StatefulSet已失敗。

DaemonSets未準(zhǔn)備好

DaemonSets用于管理需要在集群中所有節(jié)點上運行的服務(wù)或應(yīng)用程序。如果你有要在每個節(jié)點上運行的日志收集daemon或監(jiān)控服務(wù),則需要使用DaemonSet。監(jiān)控與Deployment相同:需要確保

觀察到的DaemonSet數(shù)量與所需的DaemonSet數(shù)量匹配。如果不匹配,則一個或多個DaemonSet失敗。

結(jié)語

像Kubernetes的大多數(shù)方面一樣,監(jiān)控Kubernetes的運行狀況可能是一個復(fù)雜而具有挑戰(zhàn)性的過程,不容易下手。通過了解最需要關(guān)注的高價值健康狀況,至少可以開始制定策略,能夠過濾

掉集群所產(chǎn)生的大量數(shù)據(jù)“噪音”,并更加自信解決對確保良好體驗最重要的問題。

責(zé)任編輯:華軒 來源: 今日頭條
相關(guān)推薦

2023-05-11 07:08:07

Kubernetes監(jiān)控

2009-08-21 14:16:08

2013-11-11 09:23:31

2018-11-18 16:31:14

Kubernetes監(jiān)控容器

2009-06-03 14:44:56

ibmdwSOAWebsphere

2009-06-14 18:32:01

ibmdwWebSphere

2013-10-21 10:13:27

2018-07-18 14:39:29

2009-10-19 15:28:08

機房摩卡

2021-09-18 16:10:48

Spring BootJava微服務(wù)

2021-12-14 20:20:42

監(jiān)控組件指標(biāo)

2021-01-19 08:18:54

視頻監(jiān)控安全性視頻安全

2019-01-25 08:15:22

Redis命令內(nèi)存

2010-12-16 11:53:33

IBMEasy Blue

2013-08-02 09:59:01

軟件定義網(wǎng)絡(luò)SDN

2015-03-02 10:47:31

Gartner可穿戴設(shè)備

2013-12-20 09:27:38

公有云IBM云計算

2013-07-09 09:39:29

微軟鮑爾默WPC2013

2024-04-29 08:35:29

監(jiān)控Kafka集群

2021-09-16 14:36:39

網(wǎng)絡(luò)安全網(wǎng)絡(luò)攻擊網(wǎng)絡(luò)威脅
點贊
收藏

51CTO技術(shù)棧公眾號