自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項目管理免費題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設(shè)置退出

性能分析和調(diào)試工具：Linux跟蹤器之選

作者：佚名 2018-03-13 11:38:14

系統(tǒng) Linux

跟蹤器是一個高級的性能分析和調(diào)試工具，如果你使用過 strace(1) 或者 tcpdump(8)，你不應(yīng)該被它嚇到 ... 你使用的就是跟蹤器。系統(tǒng)跟蹤器能讓你看到很多的東西，而不僅是系統(tǒng)調(diào)用或者數(shù)據(jù)包，因為常見的跟蹤器都可以跟蹤內(nèi)核或者應(yīng)用程序的任何東西。

Linux 跟蹤很神奇！

跟蹤器tracer是一個高級的性能分析和調(diào)試工具，如果你使用過 strace(1) 或者 tcpdump(8)，你不應(yīng)該被它嚇到 ... 你使用的就是跟蹤器。系統(tǒng)跟蹤器能讓你看到很多的東西，而不僅是系統(tǒng)調(diào)用或者數(shù)據(jù)包，因為常見的跟蹤器都可以跟蹤內(nèi)核或者應(yīng)用程序的任何東西。

有大量的 Linux 跟蹤器可供你選擇。由于它們中的每個都有一個官方的（或者非官方的）的吉祥物，我們有足夠多的選擇給孩子們展示。

你喜歡使用哪一個呢？

我從兩類讀者的角度來回答這個問題：大多數(shù)人和性能/內(nèi)核工程師。當(dāng)然，隨著時間的推移，這也可能會發(fā)生變化，因此，我需要及時去更新本文內(nèi)容，或許是每年一次，或者更頻繁。（LCTT 譯注：本文***更新于 2015 年）

對于大多數(shù)人

大多數(shù)人（開發(fā)者、系統(tǒng)管理員、運維人員、網(wǎng)絡(luò)可靠性工程師（SRE）…）是不需要去學(xué)習(xí)系統(tǒng)跟蹤器的底層細(xì)節(jié)的。以下是你需要去了解和做的事情：

1. 使用 perf_events 進行 CPU 剖析

可以使用 perf_events 進行 CPU 剖析profiling。它可以用一個火焰圖來形象地表示。比如：

git clone --depth 1 https://github.com/brendangregg/FlameGraph
perf record -F 99 -a -g -- sleep 30
perf script | ./FlameGraph/stackcollapse-perf.pl | ./FlameGraph/flamegraph.pl > perf.svg

Linux 的 perf_events（即 perf，后者是它的命令）是官方為 Linux 用戶準(zhǔn)備的跟蹤器/分析器。它位于內(nèi)核源碼中，并且維護的非常好（而且現(xiàn)在它的功能還在快速變強）。它一般是通過 linux-tools-common 這個包來添加的。

perf 可以做的事情很多，但是，如果我只能建議你學(xué)習(xí)其中的一個功能的話，那就是 CPU 剖析。雖然從技術(shù)角度來說，這并不是事件“跟蹤”，而是采樣sampling。最難的部分是獲得完整的棧和符號，這部分在我的 Linux Profiling at Netflix 中針對 Java 和 Node.js 討論過。

2. 知道它能干什么

正如一位朋友所說的：“你不需要知道 X 光機是如何工作的，但你需要明白的是，如果你吞下了一個硬幣，X 光機是你的一個選擇！”你需要知道使用跟蹤器能夠做什么，因此，如果你在業(yè)務(wù)上確實需要它，你可以以后再去學(xué)習(xí)它，或者請會使用它的人來做。

簡單地說：幾乎任何事情都可以通過跟蹤來了解它。內(nèi)部文件系統(tǒng)、TCP/IP 處理過程、設(shè)備驅(qū)動、應(yīng)用程序內(nèi)部情況。閱讀我在 lwn.net 上的 ftrace 的文章，也可以去瀏覽 perf_events 頁面，那里有一些跟蹤（和剖析）能力的示例。

3. 需要一個前端工具

如果你要購買一個性能分析工具（有許多公司銷售這類產(chǎn)品），并要求支持 Linux 跟蹤。想要一個直觀的“點擊”界面去探查內(nèi)核的內(nèi)部，以及包含一個在不同堆棧位置的延遲熱力圖。就像我在 Monitorama 演講中描述的那樣。

我創(chuàng)建并開源了我自己的一些前端工具，雖然它是基于 CLI 的（不是圖形界面的）。這樣可以使其它人使用跟蹤器更快更容易。比如，我的 perf-tools，跟蹤新進程是這樣的：

# ./execsnoop
Tracing exec()s. Ctrl-C to end.
 PID PPID ARGS
 22898 22004 man ls
 22905 22898 preconv -e UTF-8
 22908 22898 pager -s
 22907 22898 nroff -mandoc -rLL=164n -rLT=164n -Tutf8
[...]

在 Netflix 公司，我正在開發(fā) Vector，它是一個實例分析工具，實際上它也是一個 Linux 跟蹤器的前端。

對于性能或者內(nèi)核工程師

一般來說，我們的工作都非常難，因為大多數(shù)人或許要求我們?nèi)ジ闱宄绾稳ジ櫮硞€事件，以及因此需要選擇使用哪個跟蹤器。為完全理解一個跟蹤器，你通常需要花至少一百多個小時去使用它。理解所有的 Linux 跟蹤器并能在它們之間做出正確的選擇是件很難的事情。（我或許是唯一接近完成這件事的人）

在這里我建議選擇如下，要么：

A）選擇一個全能的跟蹤器，并以它為標(biāo)準(zhǔn)。這需要在一個測試環(huán)境中花大量的時間來搞清楚它的細(xì)微差別和安全性。我現(xiàn)在的建議是 SystemTap 的***版本（例如，從源代碼構(gòu)建）。我知道有的公司選擇的是 LTTng ，盡管它并不是很強大（但是它很安全），但他們也用的很好。如果在 sysdig 中添加了跟蹤點或者是 kprobes，它也是另外的一個候選者。

B）按我的 Velocity 教程中的流程圖。這意味著盡可能使用 ftrace 或者 perf_events，eBPF 已經(jīng)集成到內(nèi)核中了，然后用其它的跟蹤器，如 SystemTap/LTTng 作為對 eBPF 的補充。我目前在 Netflix 的工作中就是這么做的。

以下是我對各個跟蹤器的評價：

1. ftrace

我愛 ftrace，它是內(nèi)核黑客***的朋友。它被構(gòu)建進內(nèi)核中，它能夠利用跟蹤點、kprobes、以及 uprobes，以提供一些功能：使用可選的過濾器和參數(shù)進行事件跟蹤；事件計數(shù)和計時，內(nèi)核概覽；函數(shù)流步進function-flow walking。關(guān)于它的示例可以查看內(nèi)核源代碼樹中的 ftrace.txt。它通過 /sys 來管理，是面向單一的 root 用戶的（雖然你可以使用緩沖實例以讓其支持多用戶），它的界面有時很繁瑣，但是它比較容易調(diào)校hackable，并且有個前端：ftrace 的主要創(chuàng)建者 Steven Rostedt 設(shè)計了一個 trace-cmd，而且我也創(chuàng)建了 perf-tools 集合。我最詬病的就是它不是可編程的programmable，因此，舉個例子說，你不能保存和獲取時間戳、計算延遲，以及將其保存為直方圖。你需要轉(zhuǎn)儲事件到用戶級以便于進行后期處理，這需要花費一些成本。它也許可以通過 eBPF 實現(xiàn)可編程。

2. perf_events

perf_events 是 Linux 用戶的主要跟蹤工具，它的源代碼位于 Linux 內(nèi)核中，一般是通過 linux-tools-common 包來添加的。它又稱為 perf，后者指的是它的前端，它相當(dāng)高效（動態(tài)緩存），一般用于跟蹤并轉(zhuǎn)儲到一個文件中（perf.data），然后可以在之后進行后期處理。它可以做大部分 ftrace 能做的事情。它不能進行函數(shù)流步進，并且不太容易調(diào)校（而它的安全/錯誤檢查做的更好一些）。但它可以做剖析（采樣）、CPU 性能計數(shù)、用戶級的棧轉(zhuǎn)換、以及使用本地變量利用調(diào)試信息debuginfo進行行級跟蹤line tracing。它也支持多個并發(fā)用戶。與 ftrace 一樣，它也不是內(nèi)核可編程的，除非 eBPF 支持（補丁已經(jīng)在計劃中）。如果只學(xué)習(xí)一個跟蹤器，我建議大家去學(xué)習(xí) perf，它可以解決大量的問題，并且它也相當(dāng)安全。

3. eBPF

擴展的伯克利***濾器extended Berkeley Packet Filter（eBPF）是一個內(nèi)核內(nèi)in-kernel的虛擬機，可以在事件上運行程序，它非常高效（JIT）。它可能最終為 ftrace 和 perf_events 提供內(nèi)核內(nèi)編程in-kernel programming，并可以去增強其它跟蹤器。它現(xiàn)在是由 Alexei Starovoitov 開發(fā)的，還沒有實現(xiàn)完全的整合，但是對于一些令人印象深刻的工具，有些內(nèi)核版本（比如，4.1）已經(jīng)支持了：比如，塊設(shè)備 I/O 的延遲熱力圖latency heat map。更多參考資料，請查閱 Alexei 的 BPF 演示，和它的 eBPF 示例。

4. SystemTap

SystemTap 是一個非常強大的跟蹤器。它可以做任何事情：剖析、跟蹤點、kprobes、uprobes（它就來自 SystemTap）、USDT、內(nèi)核內(nèi)編程等等。它將程序編譯成內(nèi)核模塊并加載它們 —— 這是一種很難保證安全的方法。它開發(fā)是在內(nèi)核代碼樹之外進行的，并且在過去出現(xiàn)過很多問題（內(nèi)核崩潰或凍結(jié)）。許多并不是 SystemTap 的過錯 —— 它通常是***對內(nèi)核使用某些跟蹤功能，并率先遇到 bug。***版本的 SystemTap 是非常好的（你需要從它的源代碼編譯），但是，許多人仍然沒有從早期版本的問題陰影中走出來。如果你想去使用它，花一些時間去測試環(huán)境，然后，在 irc.freenode.net 的 #systemtap 頻道與開發(fā)者進行討論。（Netflix 有一個容錯架構(gòu)，我們使用了 SystemTap，但是我們或許比起你來說，更少擔(dān)心它的安全性）我最詬病的事情是，它似乎假設(shè)你有辦法得到內(nèi)核調(diào)試信息，而我并沒有這些信息。沒有它我實際上可以做很多事情，但是缺少相關(guān)的文檔和示例（我現(xiàn)在自己開始幫著做這些了）。

5. LTTng

LTTng 對事件收集進行了優(yōu)化，性能要好于其它的跟蹤器，也支持許多的事件類型，包括 USDT。它的開發(fā)是在內(nèi)核代碼樹之外進行的。它的核心部分非常簡單：通過一個很小的固定指令集寫入事件到跟蹤緩沖區(qū)。這樣讓它既安全又快速。缺點是做內(nèi)核內(nèi)編程不太容易。我覺得那不是個大問題，由于它優(yōu)化的很好，可以充分的擴展，盡管需要后期處理。它也探索了一種不同的分析技術(shù)。很多的“黑匣子”記錄了所有感興趣的事件，以便可以在 GUI 中以后分析它。我擔(dān)心該記錄會錯失之前沒有預(yù)料的事件，我真的需要花一些時間去看看它在實踐中是如何工作的。這個跟蹤器上我花的時間最少（沒有特別的原因）。

6. ktap

ktap 是一個很有前途的跟蹤器，它在內(nèi)核中使用了一個 lua 虛擬機，不需要調(diào)試信息和在嵌入時設(shè)備上可以工作的很好。這使得它進入了人們的視野，在某個時候似乎要成為 Linux 上***的跟蹤器。然而，由于 eBPF 開始集成到了內(nèi)核，而 ktap 的集成工作被推遲了，直到它能夠使用 eBPF 而不是它自己的虛擬機。由于 eBPF 在幾個月過去之后仍然在集成過程中，ktap 的開發(fā)者已經(jīng)等待了很長的時間。我希望在今年的晚些時間它能夠重啟開發(fā)。

7. dtrace4linux

dtrace4linux 主要由一個人（Paul Fox）利用業(yè)務(wù)時間將 Sun DTrace 移植到 Linux 中的。它令人印象深刻，一些供應(yīng)器provider可以工作，還不是很***，它最多應(yīng)該算是實驗性的工具（不安全）。我認(rèn)為對于許可證的擔(dān)心，使人們對它保持謹(jǐn)慎：它可能永遠也進入不了 Linux 內(nèi)核，因為 Sun 是基于 CDDL 許可證發(fā)布的 DTrace；Paul 的方法是將它作為一個插件。我非常希望看到 Linux 上的 DTrace，并且希望這個項目能夠完成，我想我加入 Netflix 時將花一些時間來幫它完成。但是，我一直在使用內(nèi)置的跟蹤器 ftrace 和 perf_events。

8. OL DTrace

Oracle Linux DTrace 是將 DTrace 移植到 Linux （尤其是 Oracle Linux）的重大努力。過去這些年的許多發(fā)布版本都一直穩(wěn)定的進步，開發(fā)者甚至談到了改善 DTrace 測試套件，這顯示出這個項目很有前途。許多有用的功能已經(jīng)完成：系統(tǒng)調(diào)用、剖析、sdt、proc、sched、以及 USDT。我一直在等待著 fbt（函數(shù)邊界跟蹤，對內(nèi)核的動態(tài)跟蹤），它將成為 Linux 內(nèi)核上非常強大的功能。它最終能否成功取決于能否吸引足夠多的人去使用 Oracle Linux（并為支持付費）。另一個羈絆是它并非完全開源的：內(nèi)核組件是開源的，但用戶級代碼我沒有看到。

9. sysdig

sysdig 是一個很新的跟蹤器，它可以使用類似 tcpdump 的語法來處理系統(tǒng)調(diào)用syscall事件，并用 lua 做后期處理。它也是令人印象深刻的，并且很高興能看到在系統(tǒng)跟蹤領(lǐng)域的創(chuàng)新。它的局限性是，它的系統(tǒng)調(diào)用只能是在當(dāng)時，并且，它轉(zhuǎn)儲所有事件到用戶級進行后期處理。你可以使用系統(tǒng)調(diào)用來做許多事情，雖然我希望能看到它去支持跟蹤點、kprobes、以及 uprobes。我也希望看到它支持 eBPF 以查看內(nèi)核內(nèi)概覽。sysdig 的開發(fā)者現(xiàn)在正在增加對容器的支持。可以關(guān)注它的進一步發(fā)展。

深入閱讀

我自己的工作中使用到的跟蹤器包括：

ftrace ：我的 perf-tools 集合（查看示例目錄）；我的 lwn.net 的 ftrace 跟蹤器的文章；一個 LISA14 演講；以及帖子：函數(shù)計數(shù)、 iosnoop、 opensnoop、 execsnoop、 TCP retransmits、 uprobes 和 USDT。
perf_events ：我的 perf_events 示例頁面；在 SCALE 的一個 Linux Profiling at Netflix 演講；和帖子：CPU 采樣、靜態(tài)跟蹤點、熱力圖、計數(shù)、內(nèi)核行級跟蹤、off-CPU 時間火焰圖。
eBPF : 帖子 eBPF：一個小的進步，和一些 BPF-tools （我需要發(fā)布更多）。
SystemTap ：很久以前，我寫了一篇使用 SystemTap 的文章，它有點過時了。最近我發(fā)布了一些 systemtap-lwtools，展示了在沒有內(nèi)核調(diào)試信息的情況下，SystemTap 是如何使用的。
LTTng ：我使用它的時間很短，不足以發(fā)布什么文章。
ktap ：我的 ktap 示例頁面包括一行程序和腳本，雖然它是早期的版本。
dtrace4linux ：在我的系統(tǒng)性能書中包含了一些示例，并且在過去我為了某些事情開發(fā)了一些小的修補，比如， timestamps。
OL DTrace ：因為它是對 DTrace 的直接移植，我早期 DTrace 的工作大多與之相關(guān)（鏈接太多了，可以去我的主頁上搜索）。一旦它更加***，我可以開發(fā)很多專用工具。
sysdig ：我貢獻了 fileslower 和 subsecond offset spectrogram 的 chisel。
其它：關(guān)于 strace，我寫了一些告誡文章。

不好意思，沒有更多的跟蹤器了！ … 如果你想知道為什么 Linux 中的跟蹤器不止一個，或者關(guān)于 DTrace 的內(nèi)容，在我的從 DTrace 到 Linux 的演講中有答案，從第 28 張幻燈片開始。

責(zé)任編輯：龐桂玉來源： Linux中國

Linux 跟蹤器性能分析

51CTO技術(shù)棧公眾號

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營

<sup id="h6qwd"></sup>