如何找到并殺死Linux數據中心服務器上的僵尸進程?
譯文【51CTO.com快譯】Linux進程經常誤入歧途,什么都不做,甚至不耗用CPU周期。雖然僵尸進程不像運行中的流氓應用程序那樣占用寶貴資源,但可能會構成威脅。如何構成威脅?某個進程成為僵尸進程時,它保留其進程ID(PID)。由于Linux系統的PID數量有限(不過數量很大),如果足夠的PID淪為僵尸,其他進程就無法啟動。
發(fā)生這種情況的可能性非常小。然而更重要的是,僵尸進程表明應用程序出現了岔子,某個程序中可能存在著錯誤。不應容忍數據中心軟件上的錯誤,需要加以解決。你可能需要檢查并殺死僵尸進程,才能解決問題。
因此,某個進程成為僵尸進程時,你怎么做?你要找到并殺死那些僵尸進程。下面教你怎么做。
找出僵尸進程
首先要做的是找出僵尸進程。幸好,由于ps命令,這很簡單。通過grep顯示ps命令的輸出,列出STAT是Z(代表僵尸)的任何進程。打開終端窗口,執(zhí)行下列命令:
- ps aux | grep 'Z'
上述命令的輸出將列出輸出中包含Z的任何進程(圖A)。
圖A
如你所見,許多運行中的進程呈僵尸狀態(tài)。該命令還將列出輸出中包含字母Z的任何進程,因此你要忽略STAT列中沒有Z的任何進程。
殺死僵尸進程
我們想要使用kill命令來終結那些僵尸進程。命令的輸出將包括所有僵尸進程的PID,因此想終結其中一個,只要執(zhí)行命令:
- kill PID
其中PID是相關進程的進程ID。因此,如果你想終終結淪為僵尸的thunderbird進程(其PID是20589),命令是:
- kill 20589
就是這樣。
你完全可以編寫一個bash腳本來自動處理這項任務,不過可能會殺死必要進程。由于存在這個風險,我總是建議你手動處理此任務。考慮到我們面對的是生產級數據中心服務器(不過我在桌面系統上進行了演示),尤其應該這樣。
如果你發(fā)現服務和應用程序崩潰,應該檢查有無僵尸進程,并終結它們。一旦你知道了哪些進程是僵尸進程,應提交錯誤報告,或者聯系并告知開發(fā)人員(如果應用程序常常崩潰,更應如此)。
原文標題:How to find and kill zombie processes on your Linux data center servers,作者:Jack Wallen
【51CTO譯稿,合作站點轉載請注明原文譯者和出處為51CTO.com】