Linux系統(tǒng)編程—時序競態(tài)
##時序競態(tài)
什么是時序競態(tài)?將同一個程序執(zhí)行兩次,正常情況下,前后兩次執(zhí)行得到的結(jié)果應(yīng)該是一樣的。但由于系統(tǒng)資源競爭的原因,前后兩次執(zhí)行的結(jié)果有可能得到不一樣的結(jié)果,這個現(xiàn)象就是時序競態(tài)。
##pause函數(shù)
函數(shù)原型:
- int pause(void);
函數(shù)作用:
進程調(diào)用pause函數(shù)時,會造成進程主動掛起(處于阻塞狀態(tài),并主動放棄CPU),并且等待信號將其喚醒。
返回值:
我們知道,信號的處理方式有三種:1. 默認(rèn)動作;2. 忽略處理;3. 捕捉。進程收到一個信號后,會先處理響應(yīng)信號,再喚醒pause函數(shù)。于是有下面幾種情況:
- 如果信號的默認(rèn)處理動作是終止進程,則進程將被終止,也就是說一收到信號進程就終止了,pause函數(shù)根本就沒有機會返回;
- 如果信號的默認(rèn)處理動作是忽略,則進程將直接忽略該信號,相當(dāng)于沒收到這個信號,進程繼續(xù)處于掛起狀態(tài),pause函數(shù)不返回;
- 如果信號的處理動作是捕捉,則進程調(diào)用完信號處理函數(shù)之后,pause返回-1,errno設(shè)置為EINTR,表示“被信號中斷”。
- pause收到的信號不能被屏蔽,如果被屏蔽,那么pause就不能被喚醒。
因為alarm函數(shù)可以在設(shè)定的時間之后發(fā)送SIGALRM信號,pause函數(shù)又可以將進程掛起等待信號,則二者結(jié)合可以自己寫一個sleep函數(shù),如下:
- #include <unistd.h>
- #include <signal.h>
- #include <stdio.h>
- void sig_alrm(int signo)
- {
- /* nothing to do */
- }
- unsigned int mysleep(unsigned int nsecs)
- {
- unsigned int unslept;
- signal(SIGALRM, &sig_alrm);
- unslept = alarm(nsecs);
- pause();
- return unslept;
- }
- int main(void)
- {
- while(1){
- mysleep(2);
- printf("Two seconds passed\n");
- }
- return 0;
- }
##時序競態(tài)前導(dǎo)例
在講時序競態(tài)具體現(xiàn)象之前,我們先來看一個生活中常見的場景:
想午睡10分鐘,于是定了個10分鐘的鬧鐘,希望10分鐘后鬧鐘將自己叫醒。
正常情況:定好鬧鐘,午睡,10分鐘后鬧鐘叫醒自己;
異常情況:定好鬧鐘,躺下睡覺2分鐘,被同學(xué)叫醒去打球,打了20分鐘后回來繼續(xù)睡覺。但在打球期間,鬧鐘早就響過了,將不會再喚醒自己。
這個例子與之后要講的時序競態(tài)有很大的相似之處。
##時序競態(tài)問題分析
我們再回過頭來看上面所寫的mysleep程序。這個函數(shù)有可能是下面的時序:
- SIGALRM默認(rèn)動作是終止進程,因此我們要將其捕捉,對SIGALRM注冊信號處理函數(shù);
- 調(diào)用alarm(1)函數(shù)定時1秒鐘;
- alarm(1)調(diào)用結(jié)束,定時器開始計時。就在這時,進程失去CPU,進入就緒態(tài)等待CPU(相當(dāng)于被同學(xué)叫醒去打球)。失去CPU的方式有可能是內(nèi)核調(diào)度了優(yōu)先級更高的進程取代了當(dāng)前進程,使得當(dāng)前進程無法獲得CPU;
- 我們知道,alarm函數(shù)如果采用自然定時法的話,定時器將一直計時,與進程狀態(tài)無關(guān)。于是,1秒后,鬧鐘定時時間到,內(nèi)核向當(dāng)前進程發(fā)送SIGALRM信號。高優(yōu)先級進程尚未執(zhí)行完畢,當(dāng)前進程仍然無法獲得CPU,繼續(xù)處于就緒態(tài),信號無法處理(處于未決狀態(tài));
- 優(yōu)先級高的進程執(zhí)行完畢,當(dāng)前進程獲得CPU資源,內(nèi)核調(diào)度回當(dāng)前進程執(zhí)行。SIGALRM信號遞達(dá),并被進程處理;
- 信號處理完畢后,返回當(dāng)前主控流程,并調(diào)用pause()函數(shù),掛起等待alarm函數(shù)發(fā)送的SIGALRM信號將自己喚醒;
- 但實際SIGALRM信號已經(jīng)處理完畢,pause()函數(shù)永遠(yuǎn)不會等到。
##解決時序競態(tài)問題
通過以上時序分析,我們可以看出,造成時序競態(tài)的原因就是SIGALRM信號在進程失去CPU的時候就已經(jīng)發(fā)送過來。為了防止這個現(xiàn)象出現(xiàn),我們可以先將該信號阻塞,將其“抓住”,再在解除阻塞的時候立刻調(diào)用pause函數(shù)掛起等待。這樣即使在調(diào)用alarm就失去CPU,也可以在進程重新獲得CPU時將抓到的SIGALRM信號重新“放出來”,并將之后的pause函數(shù)喚醒。
但在解除阻塞與pause等待掛起信號之間,還是有可能失去CPU,除非將這兩個步驟做成一個“原子操作”。Linux系統(tǒng)提供的sigsuspend函數(shù)就具備這個功能。所以,在時序要求比較嚴(yán)格的場合下都應(yīng)該使用sigsuspend函數(shù),而非pause函數(shù)。
函數(shù)原型:
- int sigsuspend(const sigset_t *mask);
函數(shù)作用:掛起等待信號;
函數(shù)參數(shù):mask,傳入?yún)?shù),sigsuspend函數(shù)調(diào)用期間,進程信號屏蔽字由參數(shù)mask指定。
具體用法:可將某個信號(如SIGALRM)從臨時信號屏蔽字mask中刪除,也就是在調(diào)用sigsuspend函數(shù)時對該信號解除屏蔽,然后掛起等待信號。但我們此時已經(jīng)改變了進程的信號屏蔽字,所以調(diào)用完sigsuspend函數(shù)之后,應(yīng)將進程的信號屏蔽字恢復(fù)原樣。
- #include <unistd.h>
- #include <signal.h>
- #include <stdio.h>
- void sig_alrm(int signo)
- {
- /* nothing to do */
- }
- unsigned int mysleep(unsigned int nsecs)
- {
- struct sigaction newact, oldact;
- sigset_t newmask, oldmask, suspmask;
- unsigned int unslept;
- //1.為SIGALRM設(shè)置捕捉函數(shù),一個空函數(shù)
- newact.sa_handler = sig_alrm;
- sigemptyset(&newact.sa_mask);
- newact.sa_flags = 0;
- sigaction(SIGALRM, &newact, &oldact);
- //2.設(shè)置阻塞信號集,阻塞SIGALRM信號
- sigemptyset(&newmask);
- sigaddset(&newmask, SIGALRM);
- sigprocmask(SIG_BLOCK, &newmask, &oldmask); //信號屏蔽字 mask
- //3.定時n秒,到時后可以產(chǎn)生SIGALRM信號
- alarm(nsecs);
- /*4.構(gòu)造一個調(diào)用sigsuspend臨時有效的阻塞信號集,
- * 在臨時阻塞信號集里解除SIGALRM的阻塞*/
- suspmask = oldmask;
- sigdelset(&suspmask, SIGALRM);
- /*5.sigsuspend調(diào)用期間,采用臨時阻塞信號集suspmask替換原有阻塞信號集
- * 這個信號集中不包含SIGALRM信號,同時掛起等待,
- * 當(dāng)sigsuspend被信號喚醒返回時,恢復(fù)原有的阻塞信號集*/
- sigsuspend(&suspmask);
- unslept = alarm(0);
- //6.恢復(fù)SIGALRM原有的處理動作,呼應(yīng)前面注釋1
- sigaction(SIGALRM, &oldact, NULL);
- //7.解除對SIGALRM的阻塞,呼應(yīng)前面注釋2
- sigprocmask(SIG_SETMASK, &oldmask, NULL);
- return(unslept);
- }
- int main(void)
- {
- while(1){
- mysleep(2);
- printf("Two seconds passed\n");
- }
- return 0;
- }
##可重入函數(shù)/不可重入函數(shù)
一個函數(shù)在被調(diào)用執(zhí)行期間尚未調(diào)用結(jié)束的時候,由于某種時序,該函數(shù)又被重復(fù)調(diào)用,這種情況稱為「重入」。如果從信號處理程序返回,則繼續(xù)執(zhí)行進程斷點處的正常指令序列,從重新恢復(fù)到斷點重新執(zhí)行的過程中,函數(shù)所依賴的環(huán)境沒有發(fā)生改變,就說這個函數(shù)是可重入的,反之就是不可重入的。
如果要將函數(shù)做成可重入函數(shù),則函數(shù)內(nèi)不能含有全局變量及static變量,也不能使用malloc、free。
本文授權(quán)轉(zhuǎn)載自公眾號「良許Linux」。良許,世界500強外企Linux開發(fā)工程師,公眾號里分享大量Linux干貨,歡迎關(guān)注!