自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓

鴻蒙開發(fā)者社區(qū)

WOT技術大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設置退出

得物云原生全鏈路追蹤Trace2.0-采集篇

作者：櫛楓忻垣 2022-12-05 19:15:12

云計算云原生

縱觀得物在應用監(jiān)控采集領域的三大里程碑迭代，第一階段的 CAT 則是 0~1 的過程，它提供了應用服務對自身觀測的途徑，讓業(yè)務方第一次真實地了解了服務運行狀況，而第二階段開始，隨著業(yè)務發(fā)展的飛速提升，業(yè)務方對監(jiān)控系統(tǒng)的要求就不僅只是從無到有了，而是要精細，準確。

0xcc 開篇

2020 年 3月，得物技術團隊在三個月的時間內完成了整個交易體系的重構，交付了五彩石項目，業(yè)務系統(tǒng)也進入了微服務時代。系統(tǒng)服務拆分之后，雖然每個服務都會有不同的團隊各司其職，但服務之間的依賴也變得復雜，對服務治理等相關的基礎建設要求也更高。

對服務進行監(jiān)控是服務治理、穩(wěn)定性建設中的一個重要的環(huán)節(jié)，它能幫助提早發(fā)現(xiàn)問題，預估系統(tǒng)水位，以及對故障進行分析等等。從 2019 年末到現(xiàn)在，得物的應用服務監(jiān)控系統(tǒng)經(jīng)歷了三大演進階段，如今，整個得物的應用微服務監(jiān)控體系已經(jīng)全面融入云原生可觀測性技術 OpenTelemetry。

回顧過去十年間，應用服務監(jiān)控行業(yè)的競爭也很激烈，相關產(chǎn)品如雨后春筍般涌現(xiàn)，如推特在 2012 年開源的 Zipkin，韓國最大的搜索引擎和門戶網(wǎng)站 Naver 開源的 Pinpoint，近幾年 Uber 公司開源的 Jaeger，以及我們國內吳晟開源的 SkyWalking。

有人說，這些其實都歸功于 Google 在 2010 年基于其內部大規(guī)模分布式鏈路追蹤系統(tǒng) Dapper 實踐而發(fā)表的論文，它的設計理念是一切分布式調用鏈追蹤系統(tǒng)的始祖，但其實早在二十年前（2002年），當年世界上最大的電商平臺 eBay 就已擁有了調用鏈追蹤系統(tǒng) CAL(Centralized Application Logging)。2011 年，原eBay的中國研發(fā)中心的資深架構師吳其敏跳槽至大眾點評，并且深入吸收消化了 CAL 的設計思想，主導研發(fā)并開源了CAT(Centralized Application Tracking）。

CAT 作為國人主導的開源系統(tǒng)，其本地化工作也是做得非常到位，而憑借著架構簡單，開箱即用的特點，CAT 也是我們得物使用的第一個應用監(jiān)控系統(tǒng)。

0x01 第一階段

從0～1基于CAT的實時應用監(jiān)控

在得物五彩石項目交付之前，系統(tǒng)僅有基礎設施層面的監(jiān)控，CAT 的引入，很好地彌補了應用監(jiān)控盲區(qū)。它支持提供各個維度的性能監(jiān)控報表，健康狀況檢測，異常統(tǒng)計，對故障問題排查起到了積極推動的作用，同時也提供簡單的實時告警的能力。

CAT 擁有指標分鐘級別的聚合統(tǒng)計的能力，從 UI 上不難看出，它擁有豐富的報表統(tǒng)計能力和問題排障能力。

但隨著公司業(yè)務規(guī)模逐步擴大，微服務粒度也不可避免地變小，我們發(fā)現(xiàn)，CAT 已經(jīng)逐步無法滿足我們的使用場景了：

無法直觀呈現(xiàn)全鏈路視圖：

問題排障與日常性能分析的場景也越來越復雜，對于一個核心場景，其內部的調用鏈路通常復雜多變，站在流量角度上看，需要完整地知道它的來源，上下游鏈路，異步調用等等，這對于 CAT 來說可能略顯超綱。

缺少圖表定制化能力：

CAT 雖供多維度報表分析，但定制化能力非常有限，在當時，業(yè)內的圖表組件定制化解決方案逐步向 Grafana + Prometheus 靠攏，但若使用 CAT，則無法享受強大的圖表繪制能力。與此同時，隨著云原生社區(qū)可觀測性項目 OpenTracing 的崛起，大約不到半年時間我們逐步下線了 CAT，向 OpenTracing 生態(tài)演進。

0x02 第二階段

持續(xù)創(chuàng)造基于OpenTracing全鏈路采樣監(jiān)控

OpenTracing 為全鏈路追蹤 Trace 定制了完整的一套協(xié)議標準，本身并不提供實現(xiàn)細節(jié)。在 OpenTracing 協(xié)議中，Trace 被認為是 Span 的有向無環(huán)圖（DAG）。官方也例舉了以下 8 個 Span 的因果關系和他們組成的單 Trace示例圖：

在當時， OpenTracing 相關的開源社區(qū)也是異常活躍，它使用 Jaeger 來解決數(shù)據(jù)的收集，調用鏈則使用了甘特圖展示：

在 OpenTracing 生態(tài)中，我們對鏈路的采樣使用頭部采樣策略，對于指標 Metrics，OpenTracing 并沒有制定它的規(guī)范，但在 Google SRE Book 里，關于 Monitoring Distributed System 章節(jié)中提到了四類黃金指標：

吞吐量：如每秒請求數(shù)，通常的實現(xiàn)方式是，設定一個計數(shù)器，每完成一次請求將自增。通過計算時間窗口內的變化率來計算出每秒的吞吐量。

延遲：處理請求的耗時。

錯誤率/錯誤數(shù)：如 HTTP 500 錯誤。當然，有些即便是 HTTP 200 狀態(tài)也需要根據(jù)特定業(yè)務邏輯來區(qū)分當前請求是否屬于“錯誤”請求。

飽和度：類似服務器硬件資源如CPU,內存,網(wǎng)絡的使用率等等。

所以，我們決定使用 Micrometer 庫來對各個組件進行吞吐量，延遲和錯誤率的埋點，從而對 DB 類，RPC類的組件做性能監(jiān)控。因此也可以說，我們第二階段的監(jiān)控是以指標監(jiān)控為主，調用鏈監(jiān)控為輔的應用性能監(jiān)控。

2.1 使用 Endpoint 貫穿指標埋點幫助性能分析

在指標埋點過程中，我們在所有的指標中引入了“流量入口（Endpoint）”標簽。這個標簽的引入，實現(xiàn)了根據(jù)不同流量入口來區(qū)分關聯(lián) DB，緩存，消息隊列，遠程調用類的行為。通過流量入口，貫穿了一個實例的所有組件指標，基本滿足了以下場景的監(jiān)控：

RPC 調用排障，調用方除了擁有下游接口信息，也可溯源自身觸發(fā)該調用的接口。

接口高耗時分析，根據(jù)指標，可還原出單位時間窗口的耗時分解圖快速查看耗時組件。

2.2 關于選型的疑問

你可能會問，鏈路監(jiān)控領域在業(yè)內有現(xiàn)成的 APM 產(chǎn)品，比如 Zipkin, Pinpoint, SkyWalking 等，為什么當時會選擇 OpenTracing + Prometheus 自行埋點？主要有兩大因素：

第一，在當時，CAT 無法滿足全鏈路監(jiān)控和一些定制化的報表分析，而得物交易鏈路五彩石項目交付也趨于尾聲，貿然去集成外部一款龐大的 APM 產(chǎn)品在沒有充分的驗證下，會給服務帶來穩(wěn)定性風險，在極其有限的時間周期內不是個理智的選擇。

第二，監(jiān)控組件是隨著統(tǒng)一的基礎框架來發(fā)布，同時，由另一團隊牽頭開發(fā)的全鏈路影子庫路由組件借助了 OpenTracing 隨行數(shù)據(jù)透傳機制，且與監(jiān)控組件是強耦合關系，而基礎框架將統(tǒng)籌監(jiān)控，壓測和其他模塊，借助Spring Boot Starter 機制，一定程度上做到了功能的開箱即用，無縫集成。而使用字節(jié)碼增強方式的 Pinpoint, SkyWalking，無法很好地做到與基礎框架集成，若并行開發(fā)，也會多出基礎框架與 Java Agent 兩邊的管理和維護成本，減緩迭代速度。

在之后將近兩年的時間里，應用服務監(jiān)控覆蓋了得物技術部使用的將近 70% 的組件，為得物App在 2021 年實現(xiàn)全年 99.97% 的 SLA 提供了強有力的支持?，F(xiàn)在看來，基于 OpenTracing + Prometheus 生態(tài)，很好地解決了分布式系統(tǒng)的調用鏈監(jiān)控，借助 Grafana 圖表工具，做到了靈活的指標監(jiān)控，融合基礎框架，讓業(yè)務方開箱即用…然而，我們說第二階段是基于 OpenTracing 全鏈路采樣監(jiān)控，隨著業(yè)務的高速發(fā)展，這套架構的不足點也逐漸顯露出來。

2.3 架構特點

體驗層面

指標：覆蓋面廣，維度細，能清晰地根據(jù)各模塊各維度來統(tǒng)計分析，基本做到了監(jiān)控靈活的圖表配置需求。但不可否認它是一種時序聚合數(shù)據(jù)，無法細化為個體。假如在某個時間點發(fā)生過幾次高耗時操作，當吞吐量達到一定時，平均耗時指標曲線仍然趨于平穩(wěn)，沒有明顯的突出點，導致問題發(fā)現(xiàn)能力降低。

鏈路：1%的采樣率使得業(yè)務服務基本不會因調用鏈發(fā)送量大而導致性能問題，但同時也往往無法從錯誤，高耗時的場景中找到正好采樣的鏈路。期間，我們曾經(jīng)考慮將頭部采樣策略改為尾部采樣，但面臨著非常高昂的 SDK 改造成本和復雜調用情況下（如異步）采樣策略的回溯，且無法保證發(fā)生每個高耗時，錯誤操作時能還原整個完整的調用鏈路。

集成方式：業(yè)務和基礎框架均采用 Maven 來構建項目，使用 Spring Boot Starter "all in one"開箱即用方式集成，極大降低了集成成本的同時，也給依賴沖突問題埋下了隱患。

項目迭代層面

迭代周期分化矛盾，與基礎框架的集成是當時快速推廣落地全鏈路監(jiān)控的不二選擇，通過這種方式，Java 服務的接入率曾一度接近100%，但在業(yè)務高速發(fā)展的背景下，基礎框架的迭代速度已經(jīng)遠遠跟不上業(yè)務迭代速度了，這也間接制約了整個監(jiān)控系統(tǒng)的迭代。

數(shù)據(jù)治理層面

數(shù)據(jù)治理成本逐步偏高，由于基礎框架和業(yè)務系統(tǒng)的迭代節(jié)奏天然的不一致，且每個業(yè)務系統(tǒng)也有自身的迭代節(jié)奏，放眼全網(wǎng)后端服務上看，基礎框架版本參差不齊。

盡管監(jiān)控系統(tǒng)在每一次迭代時都會盡可能保證最大的向后兼容，但將近兩年的迭代周期里，不同版本造成的數(shù)據(jù)差異也極大制約了監(jiān)控門戶系統(tǒng)天眼的迭代，開發(fā)人員長時間奔波于數(shù)據(jù)上的妥協(xié)，在很多功能的實現(xiàn)上曲線救國。

穩(wěn)定性層面

相關預案依托于 Spring 框架 Bean 的自動裝配邏輯，業(yè)務方理解成本低，便于變更，但缺少細粒度的預案，比如運行時期間特定邏輯降級等等。

2021 年下半年開始，為了充分平衡以上的收益與風險，我們決定將監(jiān)控采集端與基礎框架解耦，獨立迭代。在此之前，在 CNCF（云原生計算基金會）的推動下，OpenTracing 也與 OpenCensus 合并成為了一個新項目 OpenTelemetry。

0x03 第三階段

向前一步基于OpenTelemetry全鏈路應用性能監(jiān)控

OpenTelemetry 的定位在于可觀測性領域中對遙測數(shù)據(jù)采集和語義規(guī)范的統(tǒng)一，有 CNCF (云原生計算基金會)的加持，近兩年里隨著越來越多的人關注和參與，整個體系也越發(fā)成熟穩(wěn)定。

其實，我們在2020年底就已開始關注 OpenTelemetry 項目，只不過當時該項目仍處于萌芽階段， Trace, Metrics API 還在 Alpha 階段，有很多不穩(wěn)定因素，考慮到需盡快投入生產(chǎn)使用，筆者曾在 2021 年中到年末期間也或多或少參與了 OpenTelemetry 社區(qū)相關 issue 的討論，遙測模塊的開發(fā)，底層數(shù)據(jù)協(xié)議的一致和一些 BUG 的修復。在這半年期間，相關 API 和 SDK 隨著越來越多的人參與也逐步趨于穩(wěn)定。

OpenTelemetry架構（圖源自 ??opentelemetry.io??）

3.1 邁入 Trace2.0 時代

OpenTelemetry 的定位致力于將可觀測性三大要素 Metrics,Trace,Log 進行統(tǒng)一，在遙測 API 制定上，提供了統(tǒng)一的上下文以便 SDK 實現(xiàn)層去關聯(lián)。如 Metrics 與 Trace 的關聯(lián)，筆者認為體現(xiàn)在 OpenTelemetry 在 Metrics 的實現(xiàn)上包含了對 OpenMetrics 標準協(xié)議的支持，其中 Exemplar 格式的數(shù)據(jù)打通了 Trace 與 Metrics 的橋梁：

OpenMetrics 是建立在 Prometheus 格式之上的規(guī)范，做了更細粒度的調整，且基本向后兼容 Prometheus 格式。

在這之前，Metrics 指標類型的數(shù)據(jù)無法精確關聯(lián)到具體某個或某些 Trace 鏈路，只能根據(jù)時間戳粗略關聯(lián)特定范圍內的鏈路。這個方案的缺陷源自指標采集器 vmagent 每隔 10s~30s 的 Pull 模式中，指標的時間戳取決于采集時刻，與 Trace 調用時間并不匹配。

Exemplar 數(shù)據(jù)在直方圖度量格式末尾會追加當前上下文中的 Trace ID,Span ID 信息，如下：

shadower_virtual_field_map_operation_seconds_bucket{holder="Filter:Factory",key="WebMvcMetricsFilter",operatinotallow="get",tcl="AppClassLoader",value="Servlet3FilterMappingResolverFactory",le="0.2"} 3949.0 1654575981.216 # {span_id="48f29964fceff582",trace_id="c0a80355629ed36bcd8fb1c6c89dedfe"} 1.0 1654575979.751

為了采集 Exemplar 格式指標，同時又需防止分桶標簽“l(fā)e”產(chǎn)生的高基數(shù)問題，我們二次開發(fā)了指標采集 vmagent，額外過濾攜帶 Exemplar 數(shù)據(jù)的指標，并將這類數(shù)據(jù)異步批量發(fā)送到了 Kafka，經(jīng)過 Flink 消費后落入 Clickhouse 后，由天眼監(jiān)控門戶系統(tǒng)提供查詢接口和UI。

分位線統(tǒng)計與Exemplar 數(shù)據(jù)關聯(lián)UI示意圖

在數(shù)據(jù)上報層，OpenTelemetry Java SDK 使用了比 JDK 原生的阻塞隊列性能更好的 Mpsc (多生產(chǎn)單消費）隊列，它使用大量的 long 類型字段來做內存區(qū)域填充，用空間換時間解決了偽共享問題，減少了并發(fā)情況下的寫競爭來提高性能。

在流量高峰時期，鏈路數(shù)據(jù)的發(fā)送隊列這一塊的性能從火焰圖上看 CPU 占比平均小于2%，日常服務CPU整體水位與0采樣相比幾乎沒有明顯差距，因此我們經(jīng)過多方面壓測對比后，決定在生產(chǎn)環(huán)境客戶端側開放鏈路數(shù)據(jù)的全量上報，實現(xiàn)了在得物技術史上的全鏈路 100% 采樣，終結了一直以來因為低采樣率導致問題排查困難的問題，至此，在第三階段，得物的全鏈路追蹤技術正式邁入 Trace2.0 時代。

得益于 OpenTelemetry 整體的可插拔式 API 設計，我們二次開發(fā)了 OpenTelemetry Java Instrumentation 項目 Shadower Java，擴展了諸多功能特性：

3.2 引入控制平面管理客戶端采集行

使用控制平面，通過客戶端監(jiān)聽機制來確保配置項的下發(fā)動作，包括：

實時動態(tài)采樣控制
診斷工具 Arthas 行為控制
實時全局降級預案
遙測組件運行時開關
實時 RPC 組件出入?yún)⑹占_關
實時高基數(shù)指標標簽的降級控制
按探針版本的預案管理
基于授權數(shù)的灰度接入策略。

... ...

控制平面的引入，彌補了無降級預案的空白，也提供了更加靈活的配置，支持了不同流量場景下快速變更數(shù)據(jù)采集方案：

3.3 獨立的啟動模塊

為了解決業(yè)務方因集成基礎框架而長期面臨的依賴沖突問題，以及多版本共存引起的數(shù)據(jù)格式分散與兼容問題，我們自研了無極探針工具箱 Promise, 它是個通用的 javaagent launcher, 結合遠端存儲，支持可配置化任意 javaagent 的下載，更新，安裝和啟動：

[plugins]enables = shadower,arthas,pyroscope,chaos-agent[shadower]artifact_key = /javaagent/shadower-%s-final.jarboot_class = com.shizhuang.apm.javaagent.bootstrap.AgentBootStrapclassloader = systemdefault_version = 115.16[arthas]artifact_key = /tools/arthas-bin.zip;boot_class = com.taobao.arthas.agent334.AgentBootstrapboot_artifact = arthas-agent.jarpremain_args = .attachments/arthas/arthas-core.jar;;ip=127.0.0.1[pyroscope]artifact_key = /tools/pyroscope.jar[chaos-agent]artifact_key = /javaagent/chaos-agent.jarboot_class = com.chaos.platform.agent.DewuChaosAgentBootstrapclassloader = systemapply_envs = dev,test,local,pre,xdw

3.4 基于 Otel API 的擴展

3.4.1 豐富的組件度量

在第二階段 OpenTracing 時期，我們使用 Endpoint 貫穿了多個組件的指標埋點，這個優(yōu)秀的特性也延續(xù)至第三階段，我們基于底層 Prometheus SDK 設計了一套完善的指標埋點 SDK，并且借助字節(jié)碼插樁的便捷，優(yōu)化并豐富了更多了組件庫。（在此階段，OpenTelemetry SDK 主版本是 1.3.x ，相關 Metrics SDK 還處于Alpha 階段）

Otel 的 Java Instrumnetation 主要使用 WeakConcurrentMap 來做異步鏈路上下文數(shù)據(jù)傳遞和同線程上下文關聯(lián)的容器，由于 Otel 對許多流行組件庫做了增強，因此 WeakConcurrentMap 的使用頻率也是非常高的，針對這個對象的 size 做監(jiān)控，有助于排查因探針導致的內存泄露問題，且它的增長率一旦達到我們設定的閾值便會告警，提早進行人工干預，執(zhí)行相關預案，防止線上故障發(fā)生。

部分自監(jiān)控面板

3.4.2擴展鏈路透傳協(xié)

1) 引入RPC ID

為了更好地關聯(lián)上下游應用，讓每個流量都有“身份”，我們擴展了 TextMapPropagator 接口，讓每個流量在鏈路上都知道請求的來源，這對跨區(qū)域，環(huán)境調用排障場景起到關鍵性作用。

此外，對于跨端場景，我們參考了阿里鷹眼調用鏈RPCID模型，增加了RpcID字段，這個字段在每次發(fā)生跨端調用時末尾數(shù)值會自增，而對于下游應用，字段本身的層級自增：

該字段擁有以下作用：

支持提供精簡化的調用鏈路視圖，查詢臃腫鏈路（如那些涉及緩存，DB調用大于 2000 Span的鏈路）時只提供 RPC 調用節(jié)點和調用層次關系。

鏈路保真，客戶端鏈路數(shù)據(jù)上報隊列并不是個無界限隊列，當客戶端自身調用頻繁時，若上報隊列堆積達到閾值即會丟棄，這會造成整個鏈路的不完整，當然這是預期內的現(xiàn)象，但若沒有RpcID字段，鏈路視圖將無法關聯(lián)丟失的節(jié)點，從而導致整個鏈路層級混亂失真。

2) 自定義 Trace ID

為了實現(xiàn)鏈路詳情頁高效的檢索效率，我們擴展 TraceID 生成邏輯，ID的前8位使用實例IP，中8位使用當前時間戳，后16位采用隨機數(shù)生成。

32位自定義traceId：c0a8006b62583a724327993efd1865d8

c0a8006b  62583a72   4327993efd1865d8
   |         |             |
高8位(IP) 中8位(Timestmap) 低16位(Random)

這樣的好處有兩點：

通過 TraceID 反向解析時間戳，鎖定時間范圍，有助于提高存儲庫 Clickhouse 的檢索效率，此外也能幫助決定當前的 Trace 應該查詢熱庫還是冷庫。

綁定實例 IP，有助于關聯(lián)當前 Trace 流量入口所屬的實例，在某些極端場景，當鏈路上的節(jié)點檢索不到時，也能通過實例和時間兩個要素來做溯源。

3) 異步調用識別

業(yè)務系統(tǒng)為了提高服務吞吐量，充分運用硬件資源，異步調用場景可謂無處不在。我們基于Otel實現(xiàn)的異步鏈路上下文傳遞的基礎上，額外擴充了"async_flag"字段來標識當前節(jié)點相對于父節(jié)點的調用關系，從而在展示層上能迅速找出發(fā)生異步調用的場景

3.4.3 更清晰的調用鏈結構

在 Otel 支持的部分組件中，有些操作不涉及到網(wǎng)絡調用，或者具有非常頻繁的操作，如 MVC 過程，數(shù)據(jù)庫連接獲取等，通常來說這類節(jié)點在鏈路詳情主視圖中的意義不大，因此我們對這類節(jié)點的產(chǎn)生邏輯進行了優(yōu)化調整，使得整個鏈路主體結構聚焦于“跨端”，同時，對部分核心組件關鍵內部方法細節(jié)做了增強，以“事件”的形式掛載于它們的父節(jié)點上，便于更細粒度的排查：

RPC 調用關鍵內部事件

DB 調用連接獲取事件

3.4.4 profiling 的支持

1）線程棧分析的集成。通過集成 Arthas 這類工具，可以很方便地查看某個實例線程的實時堆棧信息，同時對采樣間隔做控制，避免頻繁抓取影響業(yè)務自身性能。

2）通過集成 pyroscope，打通高延遲性能排查最后一公里。Pyroscope 對 async profiler 做了二次開發(fā)，同時也支持 Otel 去集成，但截至目前，官方并沒有實現(xiàn)完整的 Profiling 行為的生命周期，而 Profiling 行為一定程度上會影響性能，于是我們對官方 Pyroscope 的生命周期做了擴展，實現(xiàn)“停止”行為的同時，采用時間輪算法來檢測特定操作的耗時，當達到期望的閾值將觸發(fā)開啟 profiling, 待操作結束或超過最大閾值則停止。

關于性能診斷相關的運用，請期待后續(xù)診斷專題。

0xff 結語

縱觀得物在應用監(jiān)控采集領域的三大里程碑迭代，第一階段的 CAT 則是 0~1 的過程，它提供了應用服務對自身觀測的途徑，讓業(yè)務方第一次真實地了解了服務運行狀況，而第二階段開始，隨著業(yè)務發(fā)展的飛速提升，業(yè)務方對監(jiān)控系統(tǒng)的要求就不僅只是從無到有了，而是要精細，準確。

因此，快速迭代的背景下，功能與架構演進層面的矛盾，加上外部云原生大背景下可觀測領域的發(fā)展因素，促使我們進行了基于 OpenTelemetry 體系的第三階段的演進。功能，產(chǎn)品層面均取得了優(yōu)異的結果。如今，我們即將進行下一階段的演進，深度結合調用鏈與相關診斷工具，以第三階段為基礎，讓得物全鏈路追蹤技術正式邁入性能分析診斷時代。

參考文章：

Dapper, a Large-Scale Distributed Systems Tracing Infrastructurehttps://storage.googleapis.com/pub-tools-public-publication-data/pdf/36356.pdf
大眾點評開源分布式監(jiān)控平臺 CAT 深度剖析-阿里云開發(fā)者社區(qū)https://developer.aliyun.com/article/269295
趣談“分布式鏈路追蹤“組件發(fā)展史
https://xie.infoq.cn/article/8e06e8d9e43d1768e021225cb
Jaeger Samplinghttps://www.jaegertracing.io/docs/1.39/sampling/
A brief history of OpenTelemetry (So Far) | Cloud Native Computing Foundationhttps://www.cncf.io/blog/2019/05/21/a-brief-history-of-opentelemetry-so-far/
The OpenMetrics project — Creating a standard for exposing metrics datahttps://openmetrics.io/
Merging OpenTracing and OpenCensus: A Roadmap to Convergence
Monitoring Distributed Systems

責任編輯：武曉燕來源：得物技術

得物云原生全鏈路

51CTO技術棧公眾號

業(yè)務
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學堂精培企業(yè)培訓 CTO訓練營

<p id="ylbmo"><li id="ylbmo"><pre id="ylbmo"></pre></li></p>

<style id="ylbmo"></style>