在Linux中使用top命令的建議
通過這篇教程提升你的
top
命令的知識。
嘗試找出你的機(jī)器正在運(yùn)行什么程序,以及哪個(gè)進(jìn)程耗盡了內(nèi)存導(dǎo)致系統(tǒng)非常非常慢 —— 這是 top
命令所能勝任的工作。
top
是一個(gè)非常有用的程序,其作用類似于 Windows 任務(wù)管理器或 MacOS 的活動(dòng)監(jiān)視器。在 *nix 機(jī)器上運(yùn)行 top
將實(shí)時(shí)顯示系統(tǒng)上運(yùn)行的進(jìn)程的情況。
- $ top
取決于你運(yùn)行的 top
版本,你會看到類似如下內(nèi)容:
- top - 08:31:32 up 1 day, 4:09, 0 users, load average: 0.20, 0.12, 0.10
- Tasks: 3 total, 1 running, 2 sleeping, 0 stopped, 0 zombie
- %Cpu(s): 0.5 us, 0.3 sy, 0.0 ni, 99.2 id, 0.0 wa, 0.0 hi, 0.0 si, 0.0 st
- KiB Mem: 4042284 total, 2523744 used, 1518540 free, 263776 buffers
- KiB Swap: 1048572 total, 0 used, 1048572 free. 1804264 cached Mem
- PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND
- 1 root 20 0 21964 3632 3124 S 0.0 0.1 0:00.23 bash
- 193 root 20 0 123520 29636 8640 S 0.0 0.7 0:00.58 flask
- 195 root 20 0 23608 2724 2400 R 0.0 0.1 0:00.21 top
你所用的 top
版本可能跟這個(gè)看起來不一樣,特別是在顯示的列上。
如何閱讀輸出的內(nèi)容
你可以根據(jù)輸出判斷你正在運(yùn)行的內(nèi)容,但嘗試去解釋結(jié)果你可能會有些困惑。
前幾行包含一堆統(tǒng)計(jì)信息(詳細(xì)信息),后跟一個(gè)包含結(jié)果列的表(列)。讓我們從后者開始吧。
列
這些是系統(tǒng)正在運(yùn)行的進(jìn)程。默認(rèn)按 CPU 使用率降序排序。這意味著在列表頂部的程序正使用更多的 CPU 資源并對你的系統(tǒng)造成更重的負(fù)擔(dān)。對于資源使用而言,這些程序是字面上的消耗資源最多的(top)進(jìn)程。不得不說,top
這個(gè)名字起得很妙。
最右邊的 COMMAND
一列報(bào)告進(jìn)程名(啟動(dòng)它們的命令)。在這個(gè)例子里,進(jìn)程名是 bash
(一個(gè)我們正在運(yùn)行 top
的命令解釋器)、flask
(一個(gè) Python 寫的 web 框架)和 top
自身。
其它列提供了關(guān)于進(jìn)程的有用信息:
PID
:進(jìn)程 ID,一個(gè)用來定位進(jìn)程的唯一標(biāo)識符USER
:運(yùn)行進(jìn)程的用戶PR
:任務(wù)的優(yōu)先級NI
:Nice 值,優(yōu)先級的一個(gè)更好的表現(xiàn)形式VIRT
:虛擬內(nèi)存的大小,單位是 KiB(kibibytes)RES
:常駐內(nèi)存大小,單位是 KiB(物理內(nèi)存和虛擬內(nèi)存的一部分)SHR
:共享內(nèi)存大小,單位是 KiB(共享內(nèi)存和虛擬內(nèi)存的一部分)S
:進(jìn)程狀態(tài),一般 I 代表空閑,R 代表運(yùn)行,S 代表休眠,Z 代表僵尸進(jìn)程,T 或 t 代表停止(還有其它更少見的選項(xiàng))%CPU
:自從上次屏幕更新后的 CPU 使用率%MEM
:自從上次屏幕更新后的RES
常駐內(nèi)存使用率TIME+
:自從程序啟動(dòng)后總的 CPU 使用時(shí)間COMMAND
:啟動(dòng)命令,如之前描述那樣
確切知道 VIRT
,RES
和 SHR
值代表什么在日常操作中并不重要。重要的是要知道 VIRT
值最高的進(jìn)程就是內(nèi)存使用最多的進(jìn)程。當(dāng)你在用 top
排查為什么你的電腦運(yùn)行無比卡的時(shí)候,那個(gè) VIRT
數(shù)值最大的進(jìn)程就是元兇。如果你想要知道共享內(nèi)存和物理內(nèi)存的確切意思,請查閱 top 手冊的 Linux Memory Types 段落。
是的,我說的是 kibibytes 而不是 kilobytes。通常稱為 kilobyte 的 1024 值實(shí)際上是 kibibyte。希臘語的 kilo(χίλιοι)意思是一千(例如一千米是 1000 米,一千克是 1000 克)。Kibi 是 kilo 和 binary 的合成詞,意思是 1024 字節(jié)(或者 2^10 )。但是,因?yàn)檫@個(gè)詞很難說,所以很多人在說 1024 字節(jié)的時(shí)候會說 kilobyte。top
試圖在這里使用恰當(dāng)?shù)男g(shù)語,所以按它說的理解就好。
屏幕更新說明
實(shí)時(shí)屏幕更新是 Linux 程序可以做的 非???/strong> 的事之一。這意味著程序能實(shí)時(shí)更新它們顯示的內(nèi)容,所以看起來是動(dòng)態(tài)的,即使它們用的是文本。非??幔≡谖覀兊睦又?,更新時(shí)間間隔很重要,因?yàn)橐恍┙y(tǒng)計(jì)數(shù)據(jù)(%CPU
和 %MEM
)是基于上次屏幕更新的數(shù)值的。
因?yàn)槲覀冞\(yùn)行在一個(gè)持久性的程序中,我們就可以輸入一些命令來實(shí)時(shí)修改配置(而不是停止應(yīng)用,然后用一個(gè)不同的命令行選項(xiàng)再次運(yùn)行)。
按下 h
調(diào)用幫助界面,該界面也顯示了默認(rèn)延遲(屏幕更新的時(shí)間間隔)。這個(gè)值默認(rèn)(大約)是 3 秒,但你可以輸入 d
(大概是 delay 的意思)或者 s
(可能是 screen 或 seconds 的意思)來修改它。
細(xì)節(jié)
在進(jìn)程列表上面有一大堆有用的信息。有些細(xì)節(jié)看起來有點(diǎn)兒奇怪,讓人困惑。但是一旦你花點(diǎn)兒時(shí)間來逐個(gè)過一遍,你會發(fā)現(xiàn),在緊要關(guān)頭,這些是非常有用的。
第一行包含系統(tǒng)的大致信息:
top
:我們正在運(yùn)行top
!你好!top
!XX:YY:XX
:當(dāng)前時(shí)間,每次屏幕更新的時(shí)候更新up
(接下去是X day, YY:ZZ
):系統(tǒng)的 uptime,或者自從系統(tǒng)啟動(dòng)后已經(jīng)過去了多長時(shí)間load average
(后跟三個(gè)數(shù)字):分別是過去一分鐘、五分鐘、15 分鐘的系統(tǒng)負(fù)載
第二行(Task
)顯示了正在運(yùn)行的任務(wù)的信息,不用解釋。它顯示了進(jìn)程總數(shù)和正在運(yùn)行的、休眠中的、停止的進(jìn)程數(shù)和僵尸進(jìn)程數(shù)。這實(shí)際上是上述 S
(狀態(tài))列的總和。
第三行(%Cpu(s)
)顯示了按類型劃分的 CPU 使用情況。數(shù)據(jù)是屏幕刷新之間的值。這些值是:
us
:用戶進(jìn)程sy
:系統(tǒng)進(jìn)程ni
:nice 用戶進(jìn)程id
:CPU 的空閑時(shí)間,這個(gè)值比較高時(shí)說明系統(tǒng)比較空閑wa
:等待時(shí)間,或者消耗在等待 I/O 完成的時(shí)間hi
:消耗在硬件中斷的時(shí)間si
:消耗在軟件中斷的時(shí)間st
:“虛擬機(jī)管理程序從該虛擬機(jī)竊取的時(shí)間”
你可以通過點(diǎn)擊 t
(toggle)來展開或折疊 Task
和 %Cpu(s)
行。
第四行(Kib Mem
)和第五行(KiB Swap
)提供了內(nèi)存和交換空間的信息。這些數(shù)值是:
- 總內(nèi)存容量
- 已用內(nèi)存
- 空閑內(nèi)存
- 內(nèi)存的緩沖值
- 交換空間的緩存值
默認(rèn)它們是用 KiB 為單位展示的,但是按下 E
(擴(kuò)展內(nèi)存縮放 extend memory scaling)可以輪換不同的單位:KiB、MiB、GiB、TiB、PiB、EiB(kilobytes、megabytes、gigabytes、terabytes、petabytes 和 exabytes)
top
用戶手冊有更多選項(xiàng)和配置項(xiàng)信息。你可以運(yùn)行 man top
來查看你系統(tǒng)上的文檔。還有很多 HTML 版的 man 手冊,但是請留意,這些手冊可能是針對不同 top 版本的。
兩個(gè) top 的替代品
你不必總是用 top
查看系統(tǒng)狀態(tài)。你可以根據(jù)你的情況用其它工具來協(xié)助排查問題,尤其是當(dāng)你想要更圖形化或更專業(yè)的界面的時(shí)候。
htop
htop
很像 top
,但是它帶來了一些非常有用的東西:它可以以圖形界面展示 CPU 和內(nèi)存使用情況。
這是我們在剛才運(yùn)行 top
的同一環(huán)境中 htop
的樣子。顯示更簡潔,但功能卻很豐富。
任務(wù)統(tǒng)計(jì)、負(fù)載、uptime 和進(jìn)程列表仍然在,但是它有了漂亮、彩色、動(dòng)態(tài)的每核 CPU 使用情況,還有圖形化的內(nèi)存使用情況。
以下是不同顏色的含義(你也可以通過按下 h
來獲得這些信息的幫助)。
CPU 任務(wù)優(yōu)先級或類型:
- 藍(lán)色:低優(yōu)先級
- 綠色:正常優(yōu)先級
- 紅色:內(nèi)核任務(wù)
- 藍(lán)色:虛擬任務(wù)
- 條狀圖末尾的值是已用 CPU 的百分比
內(nèi)存:
- 綠色:已經(jīng)使用的內(nèi)存
- 藍(lán)色:緩沖的內(nèi)存
- 黃色:緩存內(nèi)存
- 條狀圖末尾的值顯示已用內(nèi)存和總內(nèi)存
如果顏色對你沒用,你可以運(yùn)行 htop -C
來禁用它們;那樣 htop
將使用不同的符號來展示 CPU 和內(nèi)存類型。
它的底部有一組激活的快捷鍵提示,可以用來操作過濾結(jié)果或改變排序順序。試著按一些快捷鍵看看它們能做什么。不過嘗試 F9
時(shí)要小心,它會調(diào)出一個(gè)信號列表,這些信號會殺死(即停止)一個(gè)過程。我建議在生產(chǎn)環(huán)境之外探索這些選項(xiàng)。
htop
的作者 Hisham Muhammad(是的,htop
的名字就是源自 Hisham 的)在二月份的 FOSDEM 2018 做了一個(gè)簡短的演講。他闡述了 htop
不僅有簡潔的圖形界面,還有更現(xiàn)代的進(jìn)程信息統(tǒng)計(jì)展示方式,這都是之前的工具(如 top
)所不具備的。
你可以在手冊頁面或 htop 網(wǎng)站閱讀更多關(guān)于 htop
的信息。(提示:網(wǎng)站背景是一個(gè)動(dòng)態(tài)的 htop
。)
docker stats
如果你在用 Docker,你可以運(yùn)行 docker stats
來為容器狀態(tài)生成一個(gè)有豐富上下文的界面。
這可能比 top
更有幫助,因?yàn)樗皇前催M(jìn)程分類,而是按容器分類的。這點(diǎn)特別有用,當(dāng)某個(gè)容器運(yùn)行緩慢時(shí),查看哪個(gè)容器耗資源最多比運(yùn)行 top
再找到容器的進(jìn)程要快。
借助于上面對 top
和 htop
術(shù)語的解釋,你應(yīng)該會更容易理解 docker stats
中的那些。然而,docker stats 文檔對每一列都提供了詳盡的描述。