圖解 | 打工人看騰訊這道多線程面試題
本文轉(zhuǎn)載自微信公眾號「后端技術(shù)指南針」,作者指南針氪金入口 。轉(zhuǎn)載本文請聯(lián)系后端技術(shù)指南針公眾號。
1. 騷動的周五
小黑是大白前同事,現(xiàn)在倆人在不同的公司,但是都做后端開發(fā)工作。
雖然兩個人都在北京,但是距離不算近,一個在望京,一個在中關(guān)村,算是北京幾大IT聚集圈之二了。
兩個人日常除了工作,業(yè)余活動并不多,當(dāng)然頭發(fā)也不多,宇宙中心五道口成了二人的集結(jié)地。
眨了5次眼,又到周五了,仿佛空氣都彌漫著明天放假的歡快氣息,當(dāng)然還有騷動的大白和小黑:
大白看著時間差不多了,檢查完上線監(jiān)控報警,沒啥問題,背上電腦走出了寫字樓。
中關(guān)村到五道口還是比較近的,掃上低碳環(huán)保的青桔單車,一路向北到北大東門轉(zhuǎn)彎來到了五道口地區(qū)。
小黑也坐上13號線,人貼人差點擠成肉餅,美食召喚下他還是在8點準(zhǔn)時到了老地方。
大白:黑哥,你啥時候面的騰訊?掛了?你咋不找我內(nèi)推我們公司呀!
小黑:還沒掛,等GM面呢,你們公司手撕紅黑樹,整不了啊。
大白:就你這樣,這么喜歡穿紅衛(wèi)衣和黑褲子,不問你紅黑樹才怪。話說騰訊都問啥了?
小黑:騰訊的面試整體感覺還是不錯的,面試很寬泛,從操作系統(tǒng)、網(wǎng)絡(luò)到系統(tǒng)設(shè)計、常用組件都會問,并且不偏不怪。
大白:那確實不錯,是本著去挖掘和探測候選人技術(shù)邊界,有啥奈斯的問題嗎?講講啊
小黑:有個問題算是我的盲區(qū)了,給了幾個Linux系統(tǒng)函數(shù),讓我看哪些是線程安全的,哪些是可重入的,并解釋下為啥。
大白:哦哦,這是考察對線程安全函數(shù)和可重入函數(shù)的理解。那你咋回答的?
小黑:臥槽,我說我不太會呀,然后就jump下一題了。要不你給我講講?我先干一個!
小黑說完,噸噸噸,一大杯啤酒下肚了,大白見狀扶了扶好幾年沒換的眼鏡,開始和小黑討論什么是線程安全和可重入。
2. 多線程和并發(fā)
在使用C++開發(fā)的服務(wù)端程序中多線程還是主流,一般來說會有個線程池來處理接收的請求,這樣可以有效提供服務(wù)器的并發(fā)能力和CPU的利用率。
但是,多線程也是一把雙刃劍。
單線程模式下,一切都是那么單調(diào)而穩(wěn)定,所有的資源都是自己的,我的資源我做主。
多線程模式下,一個進(jìn)程下裝載了多個線程,每個線程除了部分資源是獨享外,多個線程對大部分系統(tǒng)資源是共享的。
多個線程共享的進(jìn)程資源:
- 內(nèi)存
- 文件描述符
- 地址空間
- 全局?jǐn)?shù)據(jù)
- ...
每個線程獨享的資源:
- 線程寄存器
- 線程棧
- 線程ID、錯誤返回碼、信號屏蔽碼
- ...
敲黑板劃重點:
1.進(jìn)程是系統(tǒng)進(jìn)行資源分配和調(diào)度的基本單位,線程是CPU調(diào)度和分派的基本單位;
2.進(jìn)程是線程的載體,進(jìn)程有獨立地址空間,所有線程共享所在進(jìn)程的地址空間;
3.進(jìn)程是系統(tǒng)資源的大股東,而線程基本上不擁有系統(tǒng)資源,只占用少量在運行中必不可少的資源,比如程序計數(shù)器、一組寄存器和調(diào)用棧;
同一個進(jìn)程中的多個線程有點像合租,大家共用大部分資源,自己獨占一小部分資源,相互影響,然而但單進(jìn)程單線程就是整租,自己獨占所有資源,誰也不影響。
掌握多線程中資源共享和相互影響的特點之后,再來看看線程安全和可重入就容易很多。
3. 什么是線程安全
計算機(jī)中所謂的安全大多是指結(jié)果的正確且可預(yù)測性。
前面我們知道,多線程運行起來雖然可以提高并發(fā)能力,但是多個線程會共享很多資源,比如寫全局?jǐn)?shù)據(jù),這種情況下就需要額外干預(yù),否則將引發(fā)錯亂的結(jié)果。
線程安全是在擁有共享數(shù)據(jù)的多條線程并行執(zhí)行的進(jìn)程中,可以正常且正確的執(zhí)行,不會出現(xiàn)數(shù)據(jù)污染等意外情況,反之則稱為線程不安全。
通俗一點講,線程安全就怎么跑都不亂,線程不安全就是一跑就可能五花八門。
所以可能產(chǎn)生線程不安全根本原因在于:共享數(shù)據(jù)且共享數(shù)據(jù)可變。
這些共享數(shù)據(jù)包括全局變量、局部靜態(tài)變量等,每個線程都可能對這個數(shù)據(jù)進(jìn)行操作,并且操作結(jié)果會影響其他線程。
我們還經(jīng)常提到另外一個術(shù)語:線程安全函數(shù)/線程安全類。
線程安全函數(shù)的一些特征:
- 無任何共享的數(shù)據(jù),都是局部數(shù)據(jù);
- 存在寫共享數(shù)據(jù),但是進(jìn)行了加鎖處理,可以實現(xiàn)多線程的同步調(diào)用;
- 存在讀但無寫共享數(shù)據(jù),無需加鎖;
從圖中可以看到:
- 同一進(jìn)程內(nèi)有四個工作線程;
- 公共函數(shù)A 只執(zhí)行打印操作,無論何時何線程調(diào)用,結(jié)果都是確定且正確的,因此是線程安全函數(shù);
- 公共函數(shù)B 使用了全局變量Count,并對其進(jìn)行遞增1操作,但是沒有進(jìn)行加鎖同步處理,因此結(jié)果是不確定的,為線程不安全函數(shù);
- 公共函數(shù)C 使用了全局變量Factor,并對其進(jìn)行遞增2操作,使用了互斥鎖進(jìn)行同步確保結(jié)果的正確,是線程安全函數(shù);
在編寫多線程程序時,如果涉及多個線程操作一個公共函數(shù),如果該函數(shù)本身不是線程安全的。
例如當(dāng)一個函數(shù)F是線程安全函數(shù),但是F調(diào)用線程不安全函數(shù)G時,同樣需要對G進(jìn)行加鎖處理,否則函數(shù)F也將不安全。
在《深入理解計算機(jī)系統(tǒng)》一書中深入指出了線程不安全函數(shù)的分類:
- 不保護(hù)共享產(chǎn)量的函數(shù)
- 保持跨越多個調(diào)用狀態(tài)的函數(shù)
- 返回指向靜態(tài)變量的指針的函數(shù)
- 調(diào)用線程不安全函數(shù)的函數(shù)
前面介紹的幾個例子大部分都是全局變量的不加鎖控制相關(guān)的,還有兩種就是:
- 函數(shù)本次調(diào)用依賴于上次調(diào)用結(jié)果,也就是所謂的跨狀態(tài),典型的Linux中的rand()函數(shù);
- 函數(shù)將結(jié)果放在一個全局的指針中,典型的gethostbyname、localtime、strtok等;
- // 函數(shù)原型
- struct tm * localtime(const time_t *clock);
- /* localtime example */
- #include <stdio.h>
- #include <time.h>
- int main ()
- {
- time_t rawtime;
- struct tm * timeinfo;
- time (&rawtime);
- timeinfo = localtime (&rawtime);
- return 0;
- }
在localtime中將結(jié)果存放在timeinfo中,這個全局變量可以被任意的線程操作,因此將引發(fā)線程不安全。
對于Linux中線程不安全的函數(shù)可以查閱:
- https://man7.org/linux/man-pages/man7/pthreads.7.html
4. 可重入函數(shù)
在理解了線程安全的相關(guān)定義和形成原因之后,我們來看下什么是可重入。
先來看看可重入的相關(guān)定義:
一個程序可以在任意時刻被中斷,然后系統(tǒng)去執(zhí)行另外一段代碼,結(jié)束后又調(diào)用繼續(xù)原來的子程序不會出錯,則稱其為可重入(reentrant或re-entrant)。
從根本上來說:
- 可重入函數(shù)只使用自己棧上的變量,不依賴任何外部數(shù)據(jù),可以允許有該函數(shù)的多個副本在運行,因為每個調(diào)用者產(chǎn)生的函數(shù)棧都是相互獨立的;
- 不可重入函數(shù)使用了一些系統(tǒng)資源,如果被中斷的話,可能會出現(xiàn)問題;
可重入函數(shù)又分為兩大類:
- 顯式可重入:所有函數(shù)的參數(shù)都是值傳遞,并且只使用本地棧變量,那么函數(shù)就是顯示可重入的,無論如何調(diào)用,都是可重入的,是絕對無條件的。
- 隱式可重入:可重入函數(shù)中的一些參數(shù)是引用傳遞,只有在調(diào)用線程的時候傳遞指向非共享數(shù)據(jù)的指針時,它才是可重入的,是相對有條件的。
可重入函數(shù)需要滿足以下幾個條件:
- 函數(shù)內(nèi)部不使用靜態(tài)或者全局?jǐn)?shù)據(jù)
- 函數(shù)不返回靜態(tài)或全局?jǐn)?shù)據(jù),數(shù)據(jù)的產(chǎn)生都由調(diào)用者提供
- 不調(diào)用不可重入函數(shù)
從本質(zhì)上來說,可重入函數(shù)實現(xiàn)了算法和數(shù)據(jù)的分離,函數(shù)內(nèi)部的計算不依賴于外部,不影響也不受外部影響,是一種高效且安全的函數(shù)。
可重入函數(shù)都是線程安全函數(shù),線程安全不一定是可重入函數(shù)。
不可重入函數(shù)可以遵守可重入規(guī)則去改造,從而變?yōu)榭芍厝牒瘮?shù)。
5. 小結(jié)
本文從多線程并發(fā)編程的一些特征進(jìn)行闡述,引出了多線程下資源的共享本質(zhì)。
正因為臨界資源和競態(tài)條件的存在,就產(chǎn)生了線程安全問題,在編寫多線程程序時一定要考慮線程不安全帶來的問題。
在理解線程安全的概念之后進(jìn)一步引出了可重入函數(shù)。
從本質(zhì)上來說,都是并發(fā)環(huán)境下由于共享資源帶來的問題。
就這樣,小黑聽完之后雖然一知半解,但也頻頻點頭,一看表快10點了,兩個打工人結(jié)完賬,消失在了去13號線五道口站的夜色中。