Kubernetes監(jiān)控方面要避免的四個常見陷阱
譯文【51CTO.com快譯】Kubernetes(K8S)現(xiàn)在似乎是管理和部署基于微服務(wù)和容器的應(yīng)用程序的事實(shí)上標(biāo)準(zhǔn),不難理解個中原委。Kubernetes是***的開源社區(qū),得到了云原生計算基金會(CNCF)的支持,對DevOps友好,還具有混合云的優(yōu)勢。為啥不愛呢?
雖然在最近一次調(diào)查中69%的受訪者表示Kubernetes是容器編排方面的***,但是部署和管理Kubernetes未必輕而易舉。盡管Kubernetes具有靈活性,但是仍存在操作工作流程方面的復(fù)雜性――許多涉及應(yīng)用性能管理(APM),需要積極有效地應(yīng)對,才能使Kubernetes實(shí)現(xiàn)承諾的好處。
重新思考你的Kubernetes監(jiān)控策略
CNCF最近的一項(xiàng)調(diào)查顯示,38%的受訪者認(rèn)為監(jiān)控是采用Kubernetes面臨的***挑戰(zhàn)之一;企業(yè)規(guī)模擴(kuò)大后,這個挑戰(zhàn)變得更為艱巨。那么,現(xiàn)代IT***如何簡化Kubernetes監(jiān)控以提高效率,同時優(yōu)化性能?
目前的Kubernetes監(jiān)控方法因幾個原因而不盡如人意,比如缺乏端到端可見性和容易出錯的遷移。以下是你在監(jiān)控Kubernetes時可能遇到的四個常見挑戰(zhàn)和如何克服這些挑戰(zhàn)的提示。
***個挑戰(zhàn):缺乏端到端可見性
傳統(tǒng)Kubernetes監(jiān)控的最常見挑戰(zhàn)之一是缺乏端到端可見性,因而無法深入了解客戶接觸點(diǎn)和分布式應(yīng)用程序。
因此,IT團(tuán)隊(duì)無法深入了解最終用戶體驗(yàn)和應(yīng)用程序性能如何影響公司的關(guān)鍵績效指標(biāo)(KPI),因而無法知道修復(fù)或改進(jìn)什么。
為了解決這個問題,使用這樣的Kubernetes監(jiān)控解決方案很重要:為正常的性能列出基準(zhǔn),并借助機(jī)器學(xué)習(xí)的強(qiáng)大功能,出現(xiàn)問題時可以智能化地向IT團(tuán)隊(duì)發(fā)出警報。
第二個挑戰(zhàn):警報風(fēng)暴
雖然深入了解所有應(yīng)用程序問題似乎是好事,但是多個問題同時出現(xiàn)時,可能會迅速失控、成為障礙。畢竟,每當(dāng)工作完成或新容器啟用時,你果真需要警報嗎?
如果無法為警報確定優(yōu)先級,IT團(tuán)隊(duì)通常不得不響應(yīng)和排查每個問題的根本原因,這導(dǎo)致糟糕的用戶體驗(yàn)和收入損失。
可靠的Kubernetes監(jiān)控解決方案可以幫助你識別和解決具體的底層問題,深入到某一行代碼、某個設(shè)備、Kubernetes服務(wù)甚至某一個容器。
第三個挑戰(zhàn):故障排查方面的難題
應(yīng)用程序停運(yùn)的代價可能很慘重,關(guān)鍵的應(yīng)用程序故障每小時損失可能高達(dá)100萬美元。時間就是金錢,IT團(tuán)隊(duì)在檢查問題的根本原因時不該浪費(fèi)時間。
問題是,今天的許多監(jiān)控工具都無法在Kubernetes環(huán)境中執(zhí)行自動化的根本原因分析,使故障排查成為耗費(fèi)時間的棘手難題,常常導(dǎo)致平均修復(fù)時間(MTTR)很長、停機(jī)時間延長。
為了避免這種情況,確保你的Kubernetes監(jiān)控解決方案能夠深入了解應(yīng)用程序的依賴項(xiàng),并通過比較遷移前后的用戶體驗(yàn)來驗(yàn)證遷移成效。
第四個挑戰(zhàn):遷移到Kubernetes容易出錯
將傳統(tǒng)應(yīng)用程序遷移到Kubernetes可能容易出錯,且很耗時間。一些公司將現(xiàn)有的整體式應(yīng)用程序遷移到部署在Kubernetes上的微服務(wù),但如果對Kubernetes環(huán)境缺乏可見性,就無法看到每個微服務(wù)或傳統(tǒng)應(yīng)用程序的實(shí)時交互情況。
借助可通過單一管理平臺提供一步式安裝和統(tǒng)一監(jiān)控的解決方案,IT團(tuán)隊(duì)就可以充分利用現(xiàn)有的技能、流程和工具。
讓Kubernetes提供***的應(yīng)用程序性能
利用Kubernetes改變公司在分布式多云環(huán)境中部署和運(yùn)行應(yīng)用程序的方式已非常流行,而且絲毫沒有減緩的跡象。但對于在Kubernetes上運(yùn)行傳統(tǒng)應(yīng)用程序或基于微服務(wù)的應(yīng)用程序的企業(yè)來說,傳統(tǒng)監(jiān)控方法的缺點(diǎn)顯而易見。
因此,企業(yè)須重新考慮Kubernetes監(jiān)控方法,以便簡化復(fù)雜的企業(yè)工作流程、改善成本效率并提高生產(chǎn)力。如果對整個Kubernetes堆棧和Kubernetes編排的應(yīng)用程序擁有端到端統(tǒng)一可視性,IT團(tuán)隊(duì)就能提供***的應(yīng)用程序體驗(yàn),并確保Kubernetes方面的投入帶來更好的業(yè)務(wù)成果。
原文標(biāo)題:4 Common Kubernetes-Monitoring Traps to Avoid,作者:Eric Johanson
【51CTO譯稿,合作站點(diǎn)轉(zhuǎn)載請注明原文譯者和出處為51CTO.com】