如何在 Linux 上殺死一個(gè)僵尸進(jìn)程
要?dú)⑺酪粋€(gè)僵尸進(jìn)程,你必須從進(jìn)程列表中刪除其名稱。
這里有一個(gè)和 Unix 紀(jì)元一樣古老的故事。自從有了 C 和 Unix,以及(后來(lái)的)Linux,我們就有了“僵尸”。具體來(lái)說,有一些進(jìn)程被標(biāo)記為“僵尸進(jìn)程”。一些人誤解它,另一些人忽視它,而它對(duì)我們?cè)S多人試圖 “殺死” 這些進(jìn)程的努力免疫,沒有什么成效。這是為什么呢?
Linux 中的進(jìn)程是什么?
這一切始于執(zhí)行 Linux 中的一個(gè)程序時(shí),當(dāng)它被執(zhí)行時(shí),它的運(yùn)行實(shí)例被稱為進(jìn)程。你可以用 ps 命令 查看你的 Linux 環(huán)境中的所有進(jìn)程:
$ ps -ax
PID TTY STAT TIME COMMAND
1 ? Ss 0:01 /usr/lib/systemd/systemd rhgb --switched-root --sys
2 ? S 0:00 [kthreadd]
3 ? I< 0:00 [rcu_gp]
4 ? I< 0:00 [rcu_par_gp]
有時(shí)一個(gè)進(jìn)程啟動(dòng)另一個(gè)進(jìn)程,使第一個(gè)進(jìn)程成為第二個(gè)進(jìn)程的父進(jìn)程。pstree
命令是一個(gè)很好的工具,可以讓你看到系統(tǒng)中進(jìn)程的“家譜”:
$ pstree -psn
systemd(1)─┬─systemd-journal(952)
├─systemd-udevd(963)
├─systemd-oomd(1137)
├─systemd-resolve(1138)
├─systemd-userdbd(1139)─┬─systemd-userwor(12707)
│ ├─systemd-userwor(12714)
│ └─systemd-userwor(12715)
├─auditd(1140)───{auditd}(1141)
├─dbus-broker-lau(1164)───dbus-broker(1165)
├─avahi-daemon(1166)───avahi-daemon(1196)
├─bluetoothd(1167)
每個(gè)進(jìn)程在系統(tǒng)中都會(huì)被分配一個(gè)編號(hào)。進(jìn)程編號(hào)(PID)1 被分配給啟動(dòng)過程中執(zhí)行的第一個(gè)進(jìn)程,PID 1 之后的每一個(gè)進(jìn)程都是它的子孫。PID 1 進(jìn)程是初始化進(jìn)程,在大多數(shù)新版本的 Linux 中,它只是一個(gè)指向 systemd
程序的符號(hào)鏈接。
用 kill 命令結(jié)束一個(gè)進(jìn)程
你可以用 kill
命令來(lái)終止 Linux 系統(tǒng)中的進(jìn)程。盡管名字叫 “殺死”,但 kill
命令和其他一些命令,如 pkill
和 killall
,都是為向一個(gè)或多個(gè)進(jìn)程發(fā)送信號(hào)而編寫/設(shè)計(jì)的。當(dāng)沒有指定信號(hào)時(shí),它發(fā)送的默認(rèn)信號(hào)是 SIGTERM
信號(hào),以終止進(jìn)程。
當(dāng)一個(gè)父進(jìn)程死亡或被殺死,而其子進(jìn)程沒有跟隨其父進(jìn)程的死亡,我們稱該進(jìn)程為“孤兒進(jìn)程”。
如何殺死一個(gè)僵尸進(jìn)程
另一方面,僵尸進(jìn)程是不能被“殺死”的!你可能會(huì)問為什么?因?yàn)樗鼈円呀?jīng)死了!
每一個(gè)子進(jìn)程,當(dāng)被終止時(shí),都會(huì)成為一個(gè)僵尸進(jìn)程,然后被父進(jìn)程刪除。當(dāng)進(jìn)程退出并釋放它所使用的資源時(shí),它的名字仍然在操作系統(tǒng)的進(jìn)程表中。這時(shí),父進(jìn)程的工作就是把它的名字從進(jìn)程表中刪除。如果沒有刪除,我們就有了僵尸進(jìn)程,它不再是一個(gè)真正的進(jìn)程,而只是操作系統(tǒng)進(jìn)程表上的一個(gè)條目。
這就是為什么試圖對(duì)一個(gè)失效的(僵尸)進(jìn)程執(zhí)行 “殺死” 命令,即使使用 -9
(SIGKILL
)選項(xiàng)也不起作用,因?yàn)闆]有什么可以殺死的。
因此,要?dú)⑺酪粋€(gè)僵尸進(jìn)程,比如從進(jìn)程列表(進(jìn)程表)中刪除其名稱,你必須殺死其父進(jìn)程。例如,如果 PID 5878 是一個(gè)僵尸進(jìn)程,而它的父進(jìn)程是 PID 4809,那么要?dú)⑺澜┦M(jìn)程(5878),就必須結(jié)束父進(jìn)程(4809):
$ sudo kill -9 4809 # 4809 是父進(jìn)程,而非僵尸
我對(duì)僵尸的最后一句警告:在殺死父進(jìn)程時(shí)要非常小心。如果一個(gè)進(jìn)程的父進(jìn)程是 PID 1,而你殺了它,你就會(huì)重新啟動(dòng)自己!
而這將是一個(gè)更可怕的故事!