四個令人意外的不可靠可觀測性的成本
有效的可觀測性可以減少業(yè)務中斷、故障排除時間和工程疲勞,同時提高客戶滿意度。
譯自4 Unexpected Costs of Unreliable Observability。作者Amanda Mitchell,Chronosphere的內(nèi)容營銷高級經(jīng)理。Amanda有20多年為品牌和媒體創(chuàng)造數(shù)字內(nèi)容的編輯經(jīng)驗。
有時候很難知道一個不利問題可以給您的業(yè)務帶來多少成本 - 直到它發(fā)生。雖然您的組織可能已經(jīng)掌握了服務停機時間的測量 - 計算收入損失、客戶滿意度評分、客戶流失和負面新聞 - 您是否花時間來全面理解當您的可觀測性平臺變慢或不可用時產(chǎn)生的全部業(yè)務成本?
當您的可觀測性平臺無法正常工作時,您的團隊最終會盲目飛行,對您的服務沒有可見性。反過來,您的業(yè)務可以快速經(jīng)歷業(yè)務和收入中斷、更長的故障排除時間、增加的工程疲勞和客戶滿意度下降。
以下是您的業(yè)務需要知道的四大不可靠可觀測性工具的成本。
云原生是不同的
技術環(huán)境正在不斷發(fā)展。向云原生移動允許您的業(yè)務在數(shù)字世界中保持高效和敏捷,在這個世界里,客戶希望快速交易和永不中斷的體驗。您監(jiān)控環(huán)境的能力需要超過您的平臺的承諾。然而,傳統(tǒng)的基礎設施和監(jiān)控系統(tǒng) - 用于監(jiān)控部署在虛擬機(VM)上的單體應用程序- 在滿足您和您的團隊所需的可靠性和規(guī)模方面無法匹敵,無法在今天的數(shù)字業(yè)務世界中脫穎而出。
業(yè)務和收入中斷
即使您的應用程序還在運行,當您的可觀測性平臺關閉時,您也無法完全經(jīng)營您的業(yè)務。例如,當可觀測性停止時,審計跟蹤可能中斷。這意味著在可觀測性平臺恢復之前,您無法允許任何交易。當可觀測性平臺不可用時,您還可能需要告訴您的工程師停止部署。在這兩種情況下,不可靠的可觀測性工具都會耗費您的時間和金錢。
更長的故障排除時間
當監(jiān)控和可觀測性平臺部分或完全停機時,保持您的環(huán)境運行需要相關的意外成本。故障排除時間更長,因為您的工程師正在追蹤來自替代來源的可觀測數(shù)據(jù)。您最好的工程師被從其他重要任務中抽離出來幫助管理停機。此外,永久的數(shù)據(jù)丟失也不是不可能的,這可能意味著任何趨勢分析都存在丟失的數(shù)據(jù)。不可靠的可觀測性降低了對可觀測性工具的信心。開發(fā)人員在推出新代碼時會猶豫 - 這會減慢部署和業(yè)務。
工程師疲勞
可觀測性停機時間的人為成本是真實的,導致疲勞,從而對您的收入和利潤產(chǎn)生負面影響。修復停機問題可能會導致加班加點、延長的值班時間和日益增長的挫敗感。由于疲勞,您的公司可能會失去最有價值的工程師,并且招聘新工程師一直是一個艱巨的挑戰(zhàn)。此外,根據(jù)Chronosphere的2023年云原生可觀測性報告,工程師花25%的時間(近一個工作日的時間)用于故障排除,疲勞問題普遍存在。
客戶滿意度
客戶不滿可能是不可靠可觀測性最明顯的成本。今天的客戶很聰明、不耐煩并有很高的期望 - 性能稍有下降就可能導致他們放棄搜索、請求或交易 - 導致收入損失。在2023年在線可靠性報告中,75%的受訪者表示頻繁的減速或故障會導致他們停止使用某個應用程序或網(wǎng)站。當您的可觀測性解決方案速度變慢或不可用時,您可能會錯過影響客戶的問題。客戶體驗的關鍵是滿足服務級別協(xié)議(SLA),但根據(jù)2023年云原生可觀測性報告,99%的工程師表示他們未能達到平均修復時間目標。
如何提高可觀測性投資回報率(ROI)
最近的一份Forrester Research報告顯示,可靠的可觀測性解決方案每年可以減少75%的嚴重事件。Chronosphere是一個單租戶、基于SaaS的云原生可觀測性平臺,它提供99.9%的服務級別協(xié)議(SLA),但在過去一年中,它為所有客戶提供了99.99%的服務。
與傳統(tǒng)的基礎設施和監(jiān)控工具相比,Chronosphere將正確的數(shù)據(jù)置于上下文中,允許您的工程師快速解決問題。這意味著組織可以消除業(yè)務和收入中斷、減少故障排除時間、減少工程師疲勞,同時提高客戶滿意度。
計算使用Chronosphere云原生可觀測性的投資回報率。