多線程一定能優(yōu)化程序性能嗎?
?大家好,我是小風(fēng)哥。問:如果一個(gè)和尚挑水喝,兩個(gè)和尚抬水喝,三個(gè)和尚沒水喝,那么眾人拾柴一定火焰高嗎?
多線程一定能提高程序性能嗎?在計(jì)算機(jī)科學(xué)中,這個(gè)問題的標(biāo)準(zhǔn)答案是“it depends”,看情況。
計(jì)算機(jī)中的一切設(shè)計(jì)都是為了更加高效的利用硬件資源,包括:CPU、內(nèi)存、IO等,我們一樣一樣來了解一下。
多線程與CPU
多線程與CPU是程序員了解的最多的,我們知道多線的目的之一在于充分利用多核,但這里有個(gè)前提就是你要處理的任務(wù)真的能拆分成獨(dú)立的子任務(wù)。
舉個(gè)例子,如果你想對(duì)一個(gè)數(shù)組所有元素的和,那么這個(gè)任務(wù)就可以拆分成為兩個(gè)獨(dú)立的子任務(wù):任務(wù)A計(jì)算前一半數(shù)組元素的和,任務(wù)B計(jì)算后一半數(shù)組元素的和,然后任務(wù)A和任務(wù)B分別交給兩個(gè)線程來執(zhí)行。
如果是在多核系統(tǒng)下這類多線程并行處理將顯著提高程序性能,但這種使用多線程充分利用多核帶來的性能提升是有上限的。
道理很簡(jiǎn)單,這就好比蓋房子,蓋房子算是個(gè)不大不小的工程,讓一個(gè)人來完成也不是不可以,但再來六七個(gè)人顯然能加快工程速度,但是再來成百上千工人來蓋一棟房子可能速度反而會(huì)變慢,畢竟資源是有限的(可用的工具等),人一多需要用在協(xié)調(diào)上的時(shí)間就會(huì)變多,多線程也是同樣的道理,當(dāng)線程數(shù)量超過某個(gè)臨界點(diǎn)時(shí)操作系統(tǒng)就開始忙不過來了(頻繁調(diào)度切換),我稱之為三個(gè)和尚沒水喝現(xiàn)象。
但如果系統(tǒng)是單核的,那么這種任務(wù)拆分則不會(huì)有什么效果,因?yàn)椴还苣銊?chuàng)建多少線程真正工作的CPU只有一個(gè)。
當(dāng)然也有可能我們根本就不能對(duì)任務(wù)進(jìn)行拆分,像計(jì)算斐波那契數(shù)列這類問題,如果你不能計(jì)算出f(n-1)與f(n-2)的解,那么你根本就沒有辦法計(jì)算出當(dāng)前問題f(n)的解,被拆分的兩個(gè)任務(wù)A和B有前后依賴關(guān)系,這時(shí)多線程就沒有用武之地了。
還有一種可能,就是你的問題規(guī)模非常小,如果這個(gè)數(shù)組是有幾百幾千個(gè)元素,那么這時(shí)你使用多線程意義不大,這時(shí)使用多線程帶來的收益不足以抵消掉多線程帶來的性能開銷。
多線程與IO
多線程一定能提升程序的IO性能嗎?答案顯然不是的。
最簡(jiǎn)單的場(chǎng)景是這樣的,你的程序需要從一個(gè)速度極慢的網(wǎng)絡(luò)鏈接上讀寫數(shù)據(jù),在這種情況下一個(gè)線程很可能就足以應(yīng)付的過來,創(chuàng)建多個(gè)線程反而可能對(duì)程序性能有損。
相同的情況也會(huì)出現(xiàn)在磁盤上,一個(gè)線程可能就已經(jīng)將磁盤打滿,這時(shí)創(chuàng)建多個(gè)線程去讀寫文件顯然不能加快程序的處理速度。
而在服務(wù)器端,程序員也使用多線程加快程序處理速度,在這里,一個(gè)典型的問題是阻塞式網(wǎng)絡(luò)IO會(huì)導(dǎo)致調(diào)用線程被掛起而暫停運(yùn)行,此時(shí)最簡(jiǎn)單的方法就是創(chuàng)建多個(gè)線程,每個(gè)線程處理一個(gè)請(qǐng)求,但隨著請(qǐng)求的增多創(chuàng)建的線程也會(huì)越來越多,此時(shí)三個(gè)和尚沒水喝現(xiàn)象開始出現(xiàn),IO多路復(fù)用技術(shù)可以很好的解決這一問題。
當(dāng)然,如果你的場(chǎng)景是IO會(huì)阻塞住處理線程,那么此時(shí)創(chuàng)建兩個(gè)線程,一個(gè)負(fù)責(zé)處理數(shù)據(jù),一個(gè)負(fù)責(zé)等待IO,那么這顯然會(huì)提高程序性能。
多線程與內(nèi)存
內(nèi)存其實(shí)和磁盤一樣,也是有讀寫帶寬上限的,但我們的程序一般都不會(huì)達(dá)到內(nèi)存讀寫帶寬上限,這并不是瓶頸。
瓶頸在于多線程共享的內(nèi)存資源(數(shù)據(jù))以及多核系統(tǒng)的cache一致性問題。
一般來說,對(duì)于多線程共享資源通常需要互斥訪問,然而為加快內(nèi)存讀寫速度,現(xiàn)代處理器中都有cache系統(tǒng)(L1、L2、L3),每個(gè)核心都有自己的cache,這些cache會(huì)緩存內(nèi)存數(shù)據(jù),也就是說一份數(shù)據(jù)可能會(huì)同時(shí)存在于內(nèi)存以及各個(gè)核心的cache中,這就會(huì)帶來經(jīng)典的數(shù)據(jù)一致性問題:某個(gè)核心修改了cache中的數(shù)據(jù)后需要將其同步給其它核心,這就要求cache系統(tǒng)中必須有能確保一致性的協(xié)議,否則程序可能會(huì)讀取到錯(cuò)誤的(過期的)數(shù)據(jù)。
然而這種同步是有性能損耗的,多個(gè)線程頻繁操作同一個(gè)變量可能導(dǎo)致處理器cache系統(tǒng)需要頻繁在各個(gè)核心之間進(jìn)行同步,極端情況下多線程程序性能甚至比單線程要差。
因此多線程之間能不共享數(shù)據(jù)就不要共享,如果一定要共享,那么就盡量將其控制在最小范圍,讀寫頻次控制到最少。?