深究 Linux 多線程中的信號量 Semaphore
理解 Semaphore,從一個好的翻譯開始
Semaphore,對多線程有過了解的人都聽說過,一般我們解釋為“信號量”??墒?,這個單詞對我們來說還是比較陌生,它和另一個單詞 Singal(信號)什么關(guān)系呢?想要真正理解這個概念,必須得從它的翻譯開始。事實上,Semaphore 最好的翻譯應(yīng)該為“信號計數(shù)量”,承認(rèn)了這一點,想必你也清楚了:它和 Signal 不是一回事!

劍橋詞典翻譯,并不容易理解
信號:簡單來說就是消息,是由用戶、系統(tǒng)或者進(jìn)程發(fā)送給目標(biāo)進(jìn)程的信息,用來通知目標(biāo)進(jìn)程某個狀態(tài)的改變或系統(tǒng)異常,對應(yīng)的是異步的場景(我之前的文章有詳細(xì)介紹過)。
信號量:首先是一個變量,其次是計數(shù)器。它是多線程環(huán)境下使用的一種設(shè)施,信號量在創(chuàng)建時需要設(shè)置一個初始值,表示同時可以有幾個任務(wù)(線程)可以訪問某一塊共享資源。
- 一個任務(wù)要想訪問共享資源,前提是信號量大于0,當(dāng)該任務(wù)成功獲得資源后,將信號量的值減 1;
- 若當(dāng)前信號量的值小于 0,表明無法獲得信號量,該任務(wù)必須被掛起,等待信號量恢復(fù)為正值的那一刻;
- 當(dāng)任務(wù)執(zhí)行完之后,必須釋放信號量,對應(yīng)操作就是信號量的值加 1。
另外,對信號量的操作(加、減)都是原子的。互斥鎖(Mutex)就是信號量初始值為 1 時的特殊情形,即同時只能有一個任務(wù)可以訪問共享資源區(qū)。

Semaphore 再理解
我們來設(shè)想這樣一個場景(上圖):假如北京的國家大劇院有一場免費的音樂會演出,可是現(xiàn)在正值疫情期間,劇院規(guī)定:劇院觀眾總?cè)藬?shù)要限制,但是允許大家中途退場,把票給其他人,其他人可以中途進(jìn)場。于是,第一批先到的人從劇院門口票箱中取到了票,然后進(jìn)場欣賞演出。后到的人就因為劇院滿了,在門口等待。過了一段時間,有人嫌節(jié)目太無聊了,提前退場了,退場時他把門票放回去了。這樣,其他人拿著這個人的票進(jìn)場了。隨后,又有人退場了,但是他忘記把票放回去了。這也沒關(guān)系,大不了劇院內(nèi)可容納的總?cè)藬?shù)少了一個罷了。
上面的例子中,音樂會現(xiàn)場就是一塊共享資源區(qū),觀眾就是任務(wù)(線程),而票箱中的門票數(shù)就是信號量。信號量用作并發(fā)量限制,由于總的門票數(shù)是固定的,所以不會出現(xiàn)音樂廳被擠爆的情況。
上述的例子中,我們允許退場的觀眾把票帶走,這是為什么呢?因為劇院工作人員可以隨時在票箱里補充些門票呀(線程生產(chǎn)者)。說到這,你們是不是有點似曾相識呀?對啰,就是線程池,但還是有些不同,你們自己品味吧。
Semaphore 實操練習(xí)
信號量類型為 sem_t,類型及相關(guān)操作定義在頭文件 semaphore.h 中,
創(chuàng)建信號量
- int sem_init(sem_t *sem, int pshared, unsigned int value);
信號量的值加 1
- int sem_post(sem_t *sem);
信號量的值減 1
- int sem_wait(sem_t *sem);
信號量銷毀
- int sem_destroy(sem_t *sem);
具體參數(shù)含義及返回值,這里就不贅述了。下面展示了一個例子:
你總共有三種類型的下載任務(wù)(類型 id 為 1、2、3),每次從鍵盤讀取一種類型的任務(wù)進(jìn)行下載,但是 CPU 最多可以同時執(zhí)行 2 個下載任務(wù)(創(chuàng)建兩個線程)。
- #include <stdio.h>
- #include <pthread.h>
- #include <semaphore.h>
- #define MAXNUM (2)
- sem_t semDownload;
- pthread_t a_thread, b_thread, c_thread;
- int g_phreadNum = 1;
- void func1(void *arg)
- {
- // 等待信號量的值 > 0
- sem_wait(&semDownload);
- printf("============== Downloading taskType 1 ============== \n");
- sleep(5);
- printf("============== Finished taskType 1 ============== \n");
- g_phreadNum--;
- // 等待線程結(jié)束
- pthread_join(a_thread, NULL);
- }
- void func2(void *arg)
- {
- sem_wait(&semDownload);
- printf("============== Downloading taskType 2 ============== \n");
- sleep(3);
- printf("============== Finished taskType 2 ============== \n");
- g_phreadNum--;
- pthread_join(b_thread, NULL);
- }
- void func3(void *arg)
- {
- sem_wait(&semDownload);
- printf("============== Downloading taskType 3 ============== \n");
- sleep(1);
- printf("============== Finished taskType 3 ============== \n");
- g_phreadNum--;
- pthread_join(c_thread, NULL);
- }
- int main()
- {
- // 初始化信號量
- sem_init(&semDownload, 0, 0);
- int taskTypeId;
- while (scanf("%d", &taskTypeId) != EOF)
- {
- // 輸入 0, 測試程序是否能正常退出
- if (taskTypeId == 0 && g_phreadNum <= 1)
- {
- break;
- } else if (taskTypeId == 0)
- {
- printf("Can not quit, current running thread num is %d\n", g_phreadNum - 1);
- }
- printf("your choose Downloading taskType %d\n", taskTypeId);
- // 線程數(shù)超過 2 個則不下載
- if (g_phreadNum > MAXNUM)
- {
- printf("!!! You've reached the max number of threads !!!\n");
- continue;
- }
- // 用戶選擇下載 Task
- switch (taskTypeId)
- {
- case 1:
- // 創(chuàng)建線程 1
- pthread_create(&a_thread, NULL, func1, NULL);
- // 信號量 + 1,進(jìn)而觸發(fā) func1 的任務(wù)
- sem_post(&semDownload);
- // 總線程數(shù) + 1
- g_phreadNum++;
- break;
- case 2:
- pthread_create(&b_thread, NULL, func2, NULL);
- sem_post(&semDownload);
- g_phreadNum++;
- break;
- case 3:
- pthread_create(&c_thread, NULL, func3, NULL);
- sem_post(&semDownload);
- g_phreadNum++;
- break;
- default:
- printf("!!! error taskTypeId %d !!!\n", taskTypeId);
- break;
- }
- }
- // 銷毀信號量
- sem_destroy(&semDownload);
- return 0;
- }
上述例子中,采用了 pthread_join() 的方式,即子線程合入主線程,主線程阻塞等待子線程結(jié)束,然后回收子線程資源。而線程加入還有另外一種方式:pthread_detach(),即主線程與子線程分離,主線程不用關(guān)注子線程什么時候結(jié)束,子線程結(jié)束后,資源自動回收。
程序運行結(jié)果如下:

還要注意一點:pthread.h 非 linux 系統(tǒng)的默認(rèn)庫, gcc 編譯參數(shù)需要手動添加選項:-lpthread、-pthread.