【推薦】最常用的20個監(jiān)控Linux系統(tǒng)性能的命令行工具
對于每個系統(tǒng)管理員或網(wǎng)絡(luò)管理員來說,每天要監(jiān)控和調(diào)試 Linux 系統(tǒng)性能問題都是非常困難的工作。我已經(jīng)有5年 Linux 管理員的工作經(jīng)歷,知道如何監(jiān)控系統(tǒng)使其保持正常運行。為此,我們編寫了對于 Linux/Unix 系統(tǒng)管理員非常有用的并且最常用的20個命令行系統(tǒng)監(jiān)視工具。這些命令可以在所有版本的 Linux 下使用去監(jiān)控和查找系統(tǒng)性能的實際原因。這些監(jiān)控命令足夠你選擇適合你的監(jiān)控場景。
1.top — Linux 系統(tǒng)進程監(jiān)控
top 命令是性能監(jiān)控程序,它可以在很多 Linux/Unix 版本下使用,并且它也是 Linux 系統(tǒng)管理員經(jīng)常使用的監(jiān)控系統(tǒng)性能的工具。Top 命令可以定期顯示所有正在運行和實際運行并且更新到列表中,它顯示出 CPU 的使用、內(nèi)存的使用、交換內(nèi)存、緩存大小、緩沖區(qū)大小、過程控制、用戶和更多命令。它也會顯示內(nèi)存和 CPU 使用率過高的正在運行的進程。當我們對 Linux 系統(tǒng)需要去監(jiān)控和采取正確的行動時,top 命令對于系統(tǒng)管理員是非常有用的。讓我們看下 top 命令的實際操作。
- # top
2.vmstat — 虛擬內(nèi)存統(tǒng)計
vmstat 命令是用于顯示虛擬內(nèi)存、內(nèi)核線程、磁盤、系統(tǒng)進程、I/O 模塊、中斷、CPU 活躍狀態(tài)等更多信息。在默認的情況下,Linux 系統(tǒng)是沒有 vmstat 這個命令的,如果你要使用它,必須安裝一個包名叫 sysstat 的程序包。命令格式常用用法如下:
- # vmstat
- procs -----------memory---------- ---swap-- -----io---- --system-- -----cpu-----
- r b swpd free inact active si so bi bo in cs us sy id wa st
- 1 0 0 810420 97380 70628 0 0 115 4 89 79 1 6 90 3 0
3.lsof — 打開文件列表
lsof 命令對于很多 Linux/Unix 系統(tǒng)都可以使用,主要以列表的形式顯示打開的文件和進程。
打開的文件主要包括磁盤文件、網(wǎng)絡(luò)套接字、管道、設(shè)備和進程。使用這個命令的主要原因是一個一個盤不能卸載并且顯示文件正在使用或者打開的錯誤信息。這個命令很容易看出哪些文件正在使用。這個命令最常用的格式:
- # lsof
- COMMAND PID USER FD TYPE DEVICE SIZE NODE NAME
- init 1 root cwd DIR 104,2 4096 2 /
- init 1 root rtd DIR 104,2 4096 2 /
- init 1 root txt REG 104,2 38652 17710339 /sbin/init
- init 1 root mem REG 104,2 129900 196453 /lib/ld-2.5.so
- init 1 root mem REG 104,2 1693812 196454 /lib/libc-2.5.so
- init 1 root mem REG 104,2 20668 196479 /lib/libdl-2.5.so
- init 1 root mem REG 104,2 245376 196419 /lib/libsepol.so.1
- init 1 root mem REG 104,2 93508 196431 /lib/libselinux.so.1
- init 1 root 10u FIFO 0,17 953 /dev/initctl
4.tcpdump — 網(wǎng)絡(luò)數(shù)據(jù)包分析器
tcpdump 是一種使用最廣泛的命令行網(wǎng)絡(luò)數(shù)據(jù)包分析器或數(shù)據(jù)包嗅探程序,主要用于捕獲和過濾 TCP/IP 包收到或者轉(zhuǎn)移在一個網(wǎng)絡(luò)的特定借口信息。它也提供了一個選項參數(shù)去保存將捕獲的包在一個文件中用于以后分析使用,tcpdump 幾乎在所有的 Linux 版本中都是可用的。
- # tcpdump -i eth0
- tcpdump: verbose output suppressed, use -v or -vv for full protocol decode
- listening on eth0, link-type EN10MB (Ethernet), capture size 96 bytes
- 22:08:59.617628 IP tecmint.com.ssh > 115.113.134.3.static-mumbai.vsnl.net.in.28472: P 2532133365:2532133481(116) ack 3561562349 win 9648
- 22:09:07.653466 IP tecmint.com.ssh > 115.113.134.3.static-mumbai.vsnl.net.in.28472: P 116:232(116) ack 1 win 9648
- 22:08:59.617916 IP 115.113.134.3.static-mumbai.vsnl.net.in.28472 > tecmint.com.ssh: . ack 116 win 64347
5.netstat — 網(wǎng)絡(luò)統(tǒng)計
netstat 命令是一個監(jiān)控網(wǎng)絡(luò)數(shù)據(jù)包傳入和傳出的統(tǒng)計界面的命令行工具。它對于許多系統(tǒng)管理員去監(jiān)控網(wǎng)絡(luò)性能和解決網(wǎng)絡(luò)相關(guān)問題是一個非常有用的工具。
- # tcpdump -i eth0
- tcpdump: verbose output suppressed, use -v or -vv for full protocol decode
- listening on eth0, link-type EN10MB (Ethernet), capture size 96 bytes
- 22:08:59.617628 IP tecmint.com.ssh > 115.113.134.3.static-mumbai.vsnl.net.in.28472: P 2532133365:2532133481(116) ack 3561562349 win 9648
- 22:09:07.653466 IP tecmint.com.ssh > 115.113.134.3.static-mumbai.vsnl.net.in.28472: P 116:232(116) ack 1 win 9648
- 22:08:59.617916 IP 115.113.134.3.static-mumbai.vsnl.net.in.28472 > tecmint.com.ssh: . ack 116 win 64347
6.htop — 進程監(jiān)控
htop 是一個更加先進的交互式的實時監(jiān)控工具。htop 與 top 命令非常相似,但是他有一些非常豐富的功能,如用戶友好界面管理進程、快捷鍵、橫向和縱向進程等更多的。htop 是一個第三方工具并不包括在 Linux 系統(tǒng)中,你需要使用包管理工具進行安裝。
- # htop
7.iotop — 監(jiān)控 Linux 磁盤 I/O
iotop 也是和 top 和 htop 命令相似,但是它會有一個報告功能去監(jiān)控和顯示實時的磁盤 I/O 輸入和輸出的程序進程。這個工具對于查找精確的高的磁盤讀/寫過程是非常有用的。
- # htop
8.iostat — 輸入/輸出統(tǒng)計
iostat 是收集和展示系統(tǒng)輸入和輸出存儲設(shè)備統(tǒng)計的簡單工具。這個工具通常用于查找存儲設(shè)備性能問題,包括設(shè)備、本地磁盤、例如 NFS 遠程磁盤。
- # iostat
- Linux 2.6.18-238.9.1.el5 (tecmint.com) 09/13/2012
- avg-cpu: %user %nice %system %iowait %steal %idle
- 2.60 3.65 1.04 4.29 0.00 88.42
- Device: tps Blk_read/s Blk_wrtn/s Blk_read Blk_wrtn
- cciss/c0d0 17.79 545.80 256.52 855159769 401914750
- cciss/c0d0p1 0.00 0.00 0.00 5459 3518
- cciss/c0d0p2 16.45 533.97 245.18 836631746 384153384
- cciss/c0d0p3 0.63 5.58 3.97 8737650 6215544
- cciss/c0d0p4 0.00 0.00 0.00 8 0
- cciss/c0d0p5 0.63 3.79 5.03 5936778 7882528
- cciss/c0d0p6 0.08 2.46 2.34 3847771 3659776
9.IPTraf —實時IP局域網(wǎng)監(jiān)控
IPTraf 是一個基于開源的 Linux 系統(tǒng)實時網(wǎng)絡(luò)(IP 網(wǎng)絡(luò))監(jiān)測的工具。它能收集到各種各樣的信息,如通過網(wǎng)絡(luò)對 IP 流量監(jiān)測,包括 TCP 標志信息、ICMP 詳細細節(jié)、TCP/UDP 流量故障、TCP 連接的數(shù)據(jù)包和拜恩計數(shù)。并且它還收集 TCP,UDP,ICMP,IP,非 IP,IP 校驗錯誤,界面活性等一般信息和詳細信息的接口統(tǒng)計數(shù)據(jù)。
10.Psacct 或者 Acct — 監(jiān)視用戶活動
Psacct 或者 Acct 是用于監(jiān)測每個用戶對系統(tǒng)的活躍狀態(tài)的一個非常有用的工具。在后臺有兩個守護進程在運行,一個是密切關(guān)注系統(tǒng)上每個用戶的整體活動,另一個進程關(guān)注有哪些資源被它們消耗。
這個工具對于系統(tǒng)管理員是非常有用的去跟蹤每個用戶的活動,可以知道用戶正在做什么,發(fā)出了什么樣的命令,占用了多少資源,多長時間活躍在系統(tǒng)上。
#p#
11.Monit — 程序和服務(wù)監(jiān)測
這是一個免費的開源的基于 Web 程序的自動監(jiān)控和管理系統(tǒng)進程、程序、文件、目錄、權(quán)限、校驗文件系統(tǒng)。它監(jiān)控的服務(wù)包括 Apache、MYSQL、Mail、FTP、Nginx 等等。系統(tǒng)狀態(tài)是可以從命令行或者自己的網(wǎng)絡(luò)接口來查看。
12.NetHogs — 監(jiān)視每個進程的網(wǎng)絡(luò)帶寬
NetHogs 是一個開源的漂亮的小程序(類似于 Linux 上面的 top 命令),在您的系統(tǒng)上保持每個進程的網(wǎng)絡(luò)活動狀態(tài)。它也保持了一個程序或者應(yīng)用實時的網(wǎng)絡(luò)流量帶寬使用情況。
13.iftop — 網(wǎng)絡(luò)帶寬監(jiān)控
iftop 是另一個基于終端的開源的系統(tǒng)監(jiān)測工具,主要功能是通過你自己系統(tǒng)上的網(wǎng)絡(luò)接口顯示一個經(jīng)常更新的網(wǎng)絡(luò)帶寬利用率的列表(即源主機和目的主機)。iftop監(jiān)控的是網(wǎng)絡(luò)的使用情況,而 top 監(jiān)控的是 CPU 的使用情況。iftop 監(jiān)視一個選定的接口并且顯示兩臺主機之間當前寬帶的使用情況。
14.Monitorix — 系統(tǒng)和網(wǎng)絡(luò)監(jiān)控
Monitorix 是一個盡可能多的在 Linux/Unix 上一個輕量級監(jiān)控工具,主要設(shè)計是監(jiān)控正在運行的系統(tǒng)和網(wǎng)絡(luò)資源。它有一個內(nèi)置的 HTTP web 服務(wù)去定期收集系統(tǒng)和網(wǎng)絡(luò)信息并顯示成圖片。它可以監(jiān)視系統(tǒng)的平均負載使用、內(nèi)存的分配、磁盤驅(qū)動器、系統(tǒng)服務(wù)、網(wǎng)絡(luò)端口、郵件統(tǒng)計(Sendmail、Postfix、Dovecot 等等)、MYSQL 數(shù)據(jù)庫等等更多的服務(wù)。它的主要目的是監(jiān)控整個系統(tǒng)的性能,并且有助于監(jiān)測故障、瓶頸、異常活動等狀況。
15.Arpwatch — 以太網(wǎng)活動監(jiān)控器
Arpwatch是一種用來監(jiān)視 Linux 網(wǎng)絡(luò)的以太網(wǎng)的網(wǎng)絡(luò)流量的地址解析(網(wǎng)絡(luò)地址轉(zhuǎn)換)的一個程序。它一直隨著網(wǎng)絡(luò)時間戳的變化監(jiān)視以太網(wǎng)流量和產(chǎn)生日志的 IP 和 MAC 地址對。當一個 IP 地址或 MAC 地址對發(fā)生變化的時候,它會發(fā)送電子郵件通知管理員。
并且,它在檢測 ARP 攻擊是非常有用的。
16.Suricata — 網(wǎng)絡(luò)安全監(jiān)控
Suricata 是一個高性能的開源的網(wǎng)絡(luò)安全與入侵檢測與預(yù)防 Linux、FreeBSD、Windows 等操作系統(tǒng)的監(jiān)控工具。它是一個非營利基金 OISF(Open Information Security Foundation)擁有的。
17.VnStat PHP — 監(jiān)測網(wǎng)絡(luò)帶寬
VnStat PHP 是一個 Web 前端應(yīng)用最流行的社交工具叫“vnstat”。 VnStat PHP 使用了很好的圖形模式監(jiān)控網(wǎng)絡(luò)流量的使用情況。它顯示了每時、每天、每月的總結(jié)報告中的網(wǎng)絡(luò)流量使用情況。
18.Nagios — 網(wǎng)絡(luò)/服務(wù)器監(jiān)控
Nagios 是一個領(lǐng)先的開源的強大的監(jiān)控系統(tǒng),網(wǎng)絡(luò)/系統(tǒng)管理員在他們影響主要業(yè)務(wù)流程之前識別和解決服務(wù)器相關(guān)的問題。Nagios 可以監(jiān)控遠程 Linux、Windows、開關(guān)、單窗口的路由器和打印機。它能顯示你的網(wǎng)絡(luò)和服務(wù)器關(guān)鍵的告警,有利于在錯誤反生之前幫助你解決問題。
19.Nmon — 監(jiān)控Linux系統(tǒng)性能
Nmon(即奈吉爾性能監(jiān)視器)工具用來監(jiān)視 Linux 系統(tǒng)的所有資源包括:CPU、內(nèi)存、磁盤使用率、網(wǎng)絡(luò)上的進程、NFS、內(nèi)核等等。這個工具有兩個模式:即在線模式和捕捉模式。在線模式適用于實時監(jiān)控,捕捉模式用于存儲輸出為 CSV 格式后的處理。
20.Collectl — 一體化性能檢測工具
Collectl 是另一個功能強大的基于命令行的監(jiān)控工具,它可用于收集有關(guān)系統(tǒng)資源的信息,包括 CPU 使用率、內(nèi)存、網(wǎng)絡(luò)、節(jié)點、進程、NFS、TCP 套接等等。
我們想知道你使用什么樣的監(jiān)控程序來監(jiān)控你的服務(wù)器性能?如果我們錯過你想要的任何工具,請通過評論告知我們,并且不要忘記分享他。