聊聊 PHP 多進(jìn)程模式下的孤兒進(jìn)程和僵尸進(jìn)程
大家好,我是碼農(nóng)先森。
在 PHP 的編程實踐中多進(jìn)程通常都是在 cli 腳本的模式下使用,我依稀還記得在多年以前為了實現(xiàn)從數(shù)據(jù)庫導(dǎo)出千萬級別的數(shù)據(jù),第一次在 PHP 腳本中采用了多進(jìn)程編程。
在此之前我從未接觸過多進(jìn)程,只知道 PHP-FPM 進(jìn)程管理器是多進(jìn)程模型,但從未在編程中進(jìn)行實踐。多進(jìn)程雖然能帶來效率上的提升,但依然會帶來不少的問題,如果初學(xué)者使用多進(jìn)程,那注定會遇到各種奇奇怪怪的 Bug 比如并發(fā)操作數(shù)據(jù)庫引起死鎖、共用內(nèi)存變量資源造成串?dāng)?shù)據(jù)、忘記回收進(jìn)程資源導(dǎo)致產(chǎn)生孤兒進(jìn)程、僵尸進(jìn)程等。
反正如果我們長期都是 PHP-FPM 模式下編程的話,在使用多進(jìn)程編程時需要慎之又慎,避免出現(xiàn)意想不到的問題。不過這次我想分享的內(nèi)容是多進(jìn)程模式下的孤兒進(jìn)程和僵尸進(jìn)程,通過示例代碼來看看這兩者進(jìn)程是如何產(chǎn)生的,又應(yīng)該如何解決,內(nèi)容不難但是在實際的編程中是可能比較容易忽視的點。
按照慣例我們先看看孤兒進(jìn)程和僵尸進(jìn)程的基礎(chǔ)概念。
- 孤兒進(jìn)程:是指一個進(jìn)程的父進(jìn)程已經(jīng)終止,但該子進(jìn)程仍然在運行。當(dāng)父進(jìn)程結(jié)束時,操作系統(tǒng)會將其所有的子進(jìn)程重新分配給 init 進(jìn)程。init 進(jìn)程會負(fù)責(zé)這些孤兒進(jìn)程,并確保它們能夠正確結(jié)束。孤兒進(jìn)程不會造成資源泄漏,因為最終它們會被 init 進(jìn)程管理并正確清理。
- 僵尸進(jìn)程:是指一個已經(jīng)完成執(zhí)行的進(jìn)程,但仍在進(jìn)程表中保留了一些信息。這通常發(fā)生在父進(jìn)程未調(diào)用 wait() 或相關(guān)函數(shù)來獲取子進(jìn)程的退出狀態(tài)時。僵尸進(jìn)程處于 Z 狀態(tài),是一種占用系統(tǒng)資源但不占用 CPU 的進(jìn)程。僵尸進(jìn)程會繼續(xù)占用系統(tǒng)的進(jìn)程 ID,如果大量產(chǎn)生將導(dǎo)致進(jìn)程 ID 耗盡,可能會影響系統(tǒng)的正常運行。
這兩者進(jìn)程的基礎(chǔ)概念應(yīng)該還比較好理解,孤兒進(jìn)程的產(chǎn)生就是緣于父進(jìn)程的不負(fù)責(zé),自己先跑路了,導(dǎo)致自己的子進(jìn)程變成了孤兒,最后孤兒進(jìn)程被系統(tǒng)給回收了,可以理解為被政府的福利院收養(yǎng)了。
僵尸進(jìn)程的產(chǎn)生就是兒子進(jìn)程執(zhí)行完了沒有退出,但是父進(jìn)程又不知情,無法及時回收兒子進(jìn)程的資源,導(dǎo)致自己的兒子進(jìn)程變成了僵尸進(jìn)程,僵尸進(jìn)程往往比孤兒進(jìn)程對系統(tǒng)的危害更大,接下來我們來看看具體的代碼示例。
首先看看孤兒進(jìn)程示例,使用 pcntl_fork 函數(shù)創(chuàng)建了一個子進(jìn)程,子進(jìn)程會每間隔 1 秒鐘獲取一次自己進(jìn)程的 ID 和父進(jìn)程的 ID,而父進(jìn)程在 2 秒鐘之后就退出跑路了,自此子進(jìn)程就變成了孤兒進(jìn)程,被系統(tǒng)進(jìn)程收養(yǎng)了。
<?php
// 孤兒進(jìn)程示例
$pid = pcntl_fork();
if ($pid < 0) {
exit('fork error');
} else if($pid > 0) {
// 父進(jìn)程執(zhí)行空間 ...
// getmypid 函數(shù)獲取當(dāng)前父進(jìn)程ID
echo "父進(jìn)程ID: " . getmypid() . PHP_EOL;
// 2 秒之后退出當(dāng)前的父進(jìn)程
// 父進(jìn)程先行跑路了
sleep(2);
exit();
}
// 子進(jìn)程執(zhí)行空間 ...
// getmypid 函數(shù)獲取當(dāng)前子進(jìn)程ID
$cid = getmypid();
echo "當(dāng)前子進(jìn)程: {$cid}" . PHP_EOL;
// 每隔 1 秒獲取一下進(jìn)程ID
for($i = 1; $i <= 10; $i++){
// posix_getppid 函數(shù)獲取當(dāng)前子進(jìn)程的父進(jìn)程ID
sleep(1);
echo "當(dāng)前子進(jìn)程ID: " . $cid. ", 父進(jìn)程ID: " . posix_getppid() . PHP_EOL;
}
// 由于父進(jìn)程跑路了,子進(jìn)程變成了孤兒進(jìn)程 ...
執(zhí)行 php index.php 觀察輸出結(jié)果,可以看出間隔一段時間之后父進(jìn)程的 ID 就變成 1 了,即為系統(tǒng)進(jìn)程。
## 執(zhí)行程序
[manongsen@root php_test]$ php index.php
父進(jìn)程ID: 3484
當(dāng)前子進(jìn)程: 3485
當(dāng)前子進(jìn)程ID: 3485, 父進(jìn)程ID: 3484
當(dāng)前子進(jìn)程ID: 3485, 父進(jìn)程ID: 3484
當(dāng)前子進(jìn)程ID: 3485, 父進(jìn)程ID: 1
當(dāng)前子進(jìn)程ID: 3485, 父進(jìn)程ID: 1
當(dāng)前子進(jìn)程ID: 3485, 父進(jìn)程ID: 1
當(dāng)前子進(jìn)程ID: 3485, 父進(jìn)程ID: 1
當(dāng)前子進(jìn)程ID: 3485, 父進(jìn)程ID: 1
當(dāng)前子進(jìn)程ID: 3485, 父進(jìn)程ID: 1
當(dāng)前子進(jìn)程ID: 3485, 父進(jìn)程ID: 1
當(dāng)前子進(jìn)程ID: 3485, 父進(jìn)程ID: 1
然后再看看僵尸進(jìn)程示例,同樣也使用 pcntl_fork 創(chuàng)建了一個子進(jìn)程,然后子進(jìn)程先行執(zhí)行完了,父進(jìn)程還未執(zhí)行完,這時子進(jìn)程變成為了僵尸進(jìn)程。當(dāng)然僵尸進(jìn)程也不會一直存在,如果父進(jìn)程退出了其也會結(jié)束自身進(jìn)程,反之就會一直存在占用著系統(tǒng)資源。
<?php
// 僵尸進(jìn)程示例
$pid = pcntl_fork();
if ($pid < 0) {
exit('fork error');
} else if($pid > 0) {
// 父進(jìn)程執(zhí)行空間 ...
// getmypid 函數(shù)獲取當(dāng)前父進(jìn)程ID
echo "父進(jìn)程ID: " . getmypid() . PHP_EOL;
// 120 秒之后退出當(dāng)前的父進(jìn)程
sleep(120);
exit();
}
// 子進(jìn)程執(zhí)行空間 ...
// getmypid 函數(shù)獲取當(dāng)前子進(jìn)程ID
$cid = getmypid();
echo "當(dāng)前子進(jìn)程: {$cid}" . PHP_EOL;
// 10 秒之后退出子進(jìn)程
sleep(10);
執(zhí)行 php index.php 觀察輸出結(jié)果,通過查看子進(jìn)程信息中有一個 Z+ 標(biāo)識,則表示該進(jìn)程已經(jīng)成為了僵尸進(jìn)程。
## 執(zhí)行程序
[manongsen@root php_test]$ php index.php
父進(jìn)程ID: 85804
當(dāng)前子進(jìn)程: 85805
## 查看進(jìn)程信息
[manongsen@root php_test]$ ps aux | grep 85805
root 90776 0.0 0.0 408169072 1408 s060 U+ 22:06下午 0:00.00 grep 85805
root 85805 0.0 0.0 0 0 s062 Z+ 22:06下午 0:00.00 (php)
最后來看看正常進(jìn)程的示例,也先使用 pcntl_fork 創(chuàng)建了一個子進(jìn)程,但與上面兩個例子不同的是在其父進(jìn)程中會調(diào)用 pcntl_wait 函數(shù)一直等待子進(jìn)程結(jié)束。在子進(jìn)程 10 秒鐘過后,父進(jìn)程會接受到子進(jìn)程執(zhí)行完畢的通知,然后回收子進(jìn)程的資源。
<?php
// 正常進(jìn)程示例
$pid = pcntl_fork();
if ($pid < 0) {
exit('fork error');
} else if($pid > 0) {
// 父進(jìn)程執(zhí)行空間 ...
// getmypid 函數(shù)獲取當(dāng)前父進(jìn)程ID
echo "父進(jìn)程ID: " . getmypid() . PHP_EOL;
// 一直等待到子進(jìn)程結(jié)束后回收資源
$cid = pcntl_wait($status);
echo "父進(jìn)程ID: " . getmypid() . ", 接收到子進(jìn)程ID: {$cid} 退出" . PHP_EOL;
exit();
}
// 子進(jìn)程執(zhí)行空間 ...
// getmypid 函數(shù)獲取當(dāng)前子進(jìn)程ID
$cid = getmypid();
echo "當(dāng)前子進(jìn)程: {$cid}" . PHP_EOL;
// 睡眠 10 秒
sleep(10);
執(zhí)行 php index.php 觀察輸出結(jié)果,可以看出子進(jìn)程執(zhí)行完畢之后,父進(jìn)程接收到了子進(jìn)程的通知。
## 執(zhí)行程序
[manongsen@root php_test]$ php index.php
父進(jìn)程ID: 49954
當(dāng)前子進(jìn)程: 49955
父進(jìn)程ID: 49954, 接收到子進(jìn)程ID: 49955 退出
## 查看進(jìn)程 49955
[manongsen@root php_test]$ ps aux | grep 49955
root 19516 0.0 0.0 407972944 1216 s062 R+ 22:23下午 0:00.00 grep 49955
root 49955 0.0 0.0 437931336 372 s060 S+ 22:23下午 0:00.00 php index.php
## 再次查看進(jìn)程 49955
[manongsen@root php_test]$ ps aux | grep 49955
root 26599 0.0 0.0 407963440 480 s062 R+ 22:24下午 0:00.00 grep 49955
通過這上面的例子可以看出,多進(jìn)程中正確的使用方式是要在父進(jìn)程中使用 pcntl_wait 函數(shù)等待子進(jìn)程的結(jié)束,而不是只管 pcntl_fork 生產(chǎn)完子進(jìn)程,然后就對子進(jìn)程不聞不問了。
從生活化的例子來說就是,你不能只管生娃,生完之后就不管養(yǎng)育了,這種操作肯定是不行的,道德和法律層面這一關(guān)你都過不去。利用 pcntl_wait 這個函數(shù)可以很優(yōu)雅的解決了孤兒進(jìn)程和僵尸進(jìn)程,但在實際的編程中很容易忽視這一點,因此這一點值得注意。