面試官:你是如何評估一個線程池需要設置多少個線程
見字如面,我是威哥,一個從普通二本院校畢業(yè),從未曾接觸分布式、微服務、高并發(fā)到通過技術分享實現(xiàn)職場蛻變,成長為RocketMQ社區(qū)優(yōu)秀布道師、大廠資深架構師,出版《RocketMQ技術內(nèi)幕》一書,歡迎大家關注我,一起交流進步。
Java并發(fā)編程是大廠第一輪面試中的高頻面試題,而線程池又是其中的典型代表,本文將梳理關于線程池的工作機制,并提出靈魂之問:你對線程池的工作機制這么了解,那你在工作中是如何判斷一個線程池需要創(chuàng)建多少個線程的呢?
1、線程池基本工作原理與面試指南
1.1 java線程池的核心屬性
JAVA 線程池的核心屬性如下:
- int corePoolSize
核心線程數(shù)
- int maximumPoolSize
線程池最大線程數(shù)
- long keepAliveTime
線程保持活躍的時間
- TimeUnit unit
keepAliveTime 的時間單位
- BlockingQueue< Runnable > workQueue
任務擠壓隊列
- ThreadFactory threadFactory
線程創(chuàng)建工廠類
- RejectedExecutionHandler handler
拒絕策略
1.2 向線程池提交任務時線程創(chuàng)建過程
那當用戶向線程池提交一個任務的時候,線程池會如何創(chuàng)建線程呢?
首先線程池會判斷當前已創(chuàng)建的線程是否小于 corePoolSize (核心線程數(shù)),如果小于,則無論已創(chuàng)建的線程是否空閑,都會選擇創(chuàng)建一個新的線程來執(zhí)行該任務,直到已創(chuàng)建的線程等于核心線程數(shù)。
當線程池中已創(chuàng)建的線程數(shù)等于核心核心線程數(shù)時,用戶繼續(xù)向線程池提交任務時,此時會先判斷任務隊列是否已滿:
1)如果任務隊列未滿,則將任務放入隊列中。
2)如果任務隊列已滿,則判斷當前線程數(shù)量是否超過了最大線程數(shù)量,如果未超過,則創(chuàng)建一個新的線程來執(zhí)行該任務,如果線程池已創(chuàng)建的線程數(shù)量等最大線程數(shù),則執(zhí)行拒絕策略。
溫馨提示:所以如果線程池使用的隊列無界隊列,最大線程數(shù)會變的沒有意義。
1.3 線程池的拒絕策略、使用場景
JUC 默認提供了如下拒絕策略:
- AbortPolicy
拒絕,直接拋出 RejectedExecutionException,默認值。
- CallerRunsPolicy
由調(diào)用線程直接運行任務的 run 方法,即異步轉同步。
- DiscardOldestPolicy
丟棄任務隊列中最先進入的任務。
- DiscardPolicy
拒絕了,就不執(zhí)行,“當沒事人事”樣。
拒絕策略觸發(fā)的條件:線程池使用的是有界任務隊列時,才有可能被觸發(fā),當隊列已滿,并且線程池創(chuàng)建的線程已經(jīng)達到了最大允許的線程池時。
默認情況下,通常使用 AbortPolicy 即可。
CallerRunsPolicy 異步轉同步在出現(xiàn)拒絕的情況下其實意義不大,沒有想出其合適的場景,因為需要執(zhí)行拒絕策略的時候,已經(jīng)處理變慢了,再同步執(zhí)行任務,只會增加服務器的負載,不利于恢復問題。
DiscardOldestPolicy 這種策略,通常用于類似記錄軌跡,偶爾丟失點數(shù)據(jù)沒關系,但希望最新的數(shù)據(jù)能得到保存。
DiscardPolicy 策略,通常用來異步打印日志,直接忽略不執(zhí)行,期望保存舊的數(shù)據(jù)。
1.4 如何選擇阻塞隊列
阿里內(nèi)部的開源規(guī)范明確禁止使用無界隊列,如果使用無界隊列,任務會不受限制的往線程池中提交,有可能造成內(nèi)存溢出。
如果使用無界隊列,最大線程數(shù)這個參數(shù)將會失效,因為永遠也不會創(chuàng)建多于核心線程數(shù)量的線程。
1.5 線程池工廠有何實際用處
ThreadFactory threadFactory,線程池工廠,在使用線程池時,強烈推薦使用自己定義的線程工廠,這樣能為線程池中的線程進行命名,方便跟大家使用 jsatck 命令查看線程棧時,能快速識別對應的線程。
1.6 keepAliveTime參數(shù)的作用
keepAliveTime :通俗點來說,這個參數(shù)表示線程的最大空閑時間,即如果線程沒有在執(zhí)行任務,能存活的時間。
默認情況下,該參數(shù)只針對超過核心線程數(shù)(corePoolSize) 的線程,可通過將allowCoreThreadTimeOut設置為true,則核心線程數(shù)也會因為空閑而被關閉。
2、如何為線程池設置合適的線程
目前根據(jù)我看過的一些開源框架,設置多少個線程數(shù)量通常是根據(jù)應用的類型:IO密集型、CPU密集型。
- IO密集型通常設置為2n+1,其中n為CPU核數(shù)
- CPU密集型通常設置為 n+1。
實際情況往往復雜的多,并不會按照這個進行設置,上面的公式通常適合框架類,例如netty,dubbo這種底層通訊框架通常會參考上述標準進行設置。
關于在實際業(yè)務開發(fā)中,如何為一個線程池設置合適的線程呢?
其實對于IO密集型類型的應用,網(wǎng)上還有一個公式:線程數(shù) = CPU核心數(shù)/(1-阻塞系數(shù))
引入了阻塞系數(shù)的概念,一般為0.8~0.9之間,
在我們的業(yè)務開發(fā)中,基本上都是IO密集型,因為往往都會去操作數(shù)據(jù)庫,訪問redis,es等存儲型組件,涉及到磁盤IO,網(wǎng)絡IO。
那什么場景下是CPU密集型呢?純計算類,例如計算圓周率的位數(shù),當然我們基本接觸不到。
IO密集型,可以考慮多設置一些線程,主要目的是可以增加IO的并發(fā)度,CPU密集型不宜設置過多線程,因為是會造成線程切換,反而損耗性能。
接下來我們以一個實際的場景來說明如何設置線程數(shù)量。
一個4C8G的機器上部署了一個MQ消費者,在RocketMQ的實現(xiàn)中,消費端也是用一個線程池來消費線程的,那這個線程數(shù)要怎么設置呢?
如果按照 2n + 1 的公式,線程數(shù)設置為 9個,但在我們實踐過程中發(fā)現(xiàn)如果增大線程數(shù)量,會顯著提高消息的處理能力,說明 2n + 1 對于業(yè)務場景來說,并不太合適。
如果套用 線程數(shù) = CPU核心數(shù)/(1-阻塞系數(shù)) 阻塞系數(shù)取 0.8 ,線程數(shù)為 20 。阻塞系數(shù)取 0.9,大概線程數(shù)40,20個線程數(shù)我覺得可以。
如果我們發(fā)現(xiàn)數(shù)據(jù)庫的操作耗時比較多,此時可以繼續(xù)提高阻塞系數(shù),從而增大線程數(shù)量。
那我們怎么判斷需要增加更多線程呢?其實可以用jstack命令查看一下進程的線程棧,如果發(fā)現(xiàn)線程池中大部分線程都處于等待獲取任務,則說明線程夠用,如下圖所示:
如果大部分線程都處于運行狀態(tài),可以繼續(xù)適當調(diào)高線程數(shù)量。