計算機(jī)中的流水線技術(shù)到底是個啥?
作者個人研發(fā)的在高并發(fā)場景下,提供的簡單、穩(wěn)定、可擴(kuò)展的延遲消息隊列框架,具有精準(zhǔn)的定時任務(wù)和延遲隊列處理功能。自開源半年多以來,已成功為十幾家中小型企業(yè)提供了精準(zhǔn)定時調(diào)度方案,經(jīng)受住了生產(chǎn)環(huán)境的考驗。為使更多童鞋受益,現(xiàn)給出開源框架地址:https://github.com/sunshinelyz/mykit-delay
寫在前面
流水線技術(shù)是計算機(jī)中的一種相當(dāng)重要的技術(shù)。簡單的說,流水線技術(shù)的出現(xiàn)使得計算機(jī)能夠支持并行計算,能夠并行執(zhí)行任務(wù)。盡管流水線技術(shù)非常重要,但是很多小伙伴對流水線技術(shù)還是一知半解,甚至很多小伙伴根本不知道什么是流水線技術(shù),今天,我們就一起來說說什么是流水線技術(shù)。
文章已收錄到:
https://github.com/sunshinelyz/technology-binghe
https://gitee.com/binghe001/technology-binghe
流水線概念
流水線是指在程序執(zhí)行時,多條指令重疊進(jìn)行操作的一種準(zhǔn)并行處理的實現(xiàn)技術(shù)。各種部件同時處理是針對不同指令而言的,它們同時為多條指令的不同部分進(jìn)行工作,以提高各部件的利用率和指令的平均執(zhí)行速度。
流水線的相關(guān)參數(shù)計算包括:流水線執(zhí)行時間計算、流水線吞吐率、流水線加速比、流水線效率。
在計算機(jī)中,對于指令的操作主要分為三個部分:取指、分析和執(zhí)行。如下所示。
如果執(zhí)行取值、分析和執(zhí)行各需要1ms的話,則串行執(zhí)行三條指令的時間總共需要9ms。這是因為一條執(zhí)行的操作需要經(jīng)過取指、分析和執(zhí)行三個步驟,每個步驟需要1ms,執(zhí)行一條指令的時間為3ms,則串行執(zhí)行三條指令的時間為9ms。我們可以用下圖來表示這個過程。
在上圖的表示中,貌似執(zhí)行三條指令使用9ms是沒啥問題的。但是,如果我們把圖形改造一下,我們就會發(fā)現(xiàn)相應(yīng)的問題。我們使用下面的圖形來表示執(zhí)行三條指令的情況。
此時,我們發(fā)現(xiàn),在上圖執(zhí)行指令操作的過程中,有很多空白的格子,而空白的格子表示在執(zhí)行執(zhí)行的過程中有空余的時間片資源沒有利用起來。很顯然,沒有必要等待指令1完全執(zhí)行完畢后再執(zhí)行指令2,同樣的,沒有必要等待指令2完全執(zhí)行完畢后再執(zhí)行指令3。而且,我們發(fā)現(xiàn)按照上圖執(zhí)行完三條指令需要9ms時間。
此時,如果將空余的時間片利用起來,則可以使用下圖來表示。
此時,在執(zhí)行三條指令的過程中,取指操作對指令1執(zhí)行完取指后,馬上對指令2進(jìn)行取指,然后又馬上對指令3進(jìn)行取指;分析操作同樣是對指令1執(zhí)行完分析后,馬上對指令2進(jìn)行分析,然后又馬上對指令3進(jìn)行分析;執(zhí)行操作也是對指令1執(zhí)行完畢后,馬上對指令2進(jìn)行執(zhí)行操作,然后又馬上對指令3進(jìn)行執(zhí)行操作。期間,將空余的時間片資源充分的利用起來了。而且,我們發(fā)現(xiàn),充分利用空余的時間片后,執(zhí)行三條指令的時間由原來的9ms變?yōu)楝F(xiàn)在的5ms。
從另一個角度,我們發(fā)現(xiàn)執(zhí)行完第一條指令時,需要3ms,執(zhí)行完第二條指令時,只需要在執(zhí)行完第一條指令的基礎(chǔ)上增加1ms。同樣的,執(zhí)行完第三條指令時,只需要在執(zhí)行完第二條指令的基礎(chǔ)上增加1ms。以后每增加一條指令,只需要增加1ms的時間便可以執(zhí)行完此條指令。
這就是計算機(jī)中的流水線技術(shù)。接下來,我們就說說流水線技術(shù)的相關(guān)計算問題。
流水線計算
關(guān)于流水線計算,我們先來看一個圖。
在上圖中,我們可以看出,執(zhí)行完第一條指令時,需要3ms時間,執(zhí)行完第二條指令時,只需要在執(zhí)行完第一條指令的基礎(chǔ)上增加1ms;執(zhí)行完第三條指令時,只需要在執(zhí)行完第二條指令的基礎(chǔ)上增加1ms。以此類推,執(zhí)行完第n條指令時,只需要在執(zhí)行第n-1條指令的基礎(chǔ)上增加1ms。說到這里,不知道小伙伴們有沒有思考這樣一個問題,流水線技術(shù)的這種規(guī)律就涉及到一個非常重要的概念,叫作 流水線周期。
流水線周期為執(zhí)行時間最長的一段,上圖中的流水線周期為1ms
流水線的計算公式為:
- 1條指令執(zhí)行時間 + (指令條數(shù) -1)* 流水線周期
流水線的理論公式如下所示。
- (t1 + t2 + ... + tk) + (n-1) * △t
其中t1,t2...tk表示執(zhí)行一條指令的每個步驟分別需要的時間,n為指令的條數(shù),△t為流水線周期。
流水線的實踐公式如下所示。
- k*△t + (n-1) * △t
其中,k為執(zhí)行一條指令的步驟數(shù),n為指令的條數(shù),△t為流水線周期。
這里,給小伙伴們舉一個例子。
例如,一條執(zhí)行的執(zhí)行過程可以分解為取指,分析和執(zhí)行三步,在取指時間t取指=3△t,分析時間分析=2△t,執(zhí)行時間t執(zhí)行=4△t的情況下,若按照串行方式執(zhí)行,則10條指令全部執(zhí)行完需要多少△t?若按照流水線方式執(zhí)行,流水線周期為多少△t?使用流水線方式時,執(zhí)行完10條指令需要多少△t?
(1)串行方式比較簡單,就是將每條指令的執(zhí)行時間進(jìn)行累加。
(3△t + 2△t + 4△t) * 10 = 90△t。
(2)在執(zhí)行一條指令的過程中,取指為3△t,分析為2△t,執(zhí)行為4△t。根據(jù)流水線中對于流水線周期的定義:流水線周期為執(zhí)行時間最長的一段,所以,流水線周期為4△t。
(3)使用流水線方式時,執(zhí)行完10條指令需要的時間可以使用如下方式進(jìn)行計算。
這里,我們分別計算下理論時間和實踐時間。
- 理論時間
(3△t + 2△t + 4△t) + (10-1) * 4△t = 45△t。
- 實踐時間
3 * 4△t + (10-1) * 4△t = 48△t。
超標(biāo)量流水線
關(guān)于超標(biāo)量流水線,我們可以使用下圖來表示。
在超標(biāo)量流水線中,有一個概念叫作度。度表示在超標(biāo)量流水線中,由幾條流水線組成。例如上面的圖中,超標(biāo)量流水線由兩條流水線組成,所以,度為2。此時的超標(biāo)量流水線可以同時進(jìn)行2個操作。也就是說,可以同時執(zhí)行兩個取指操作,可以同時執(zhí)行兩個分析操作,也可以同時執(zhí)行兩個執(zhí)行操作。
如果此時有10條指令需要執(zhí)行,使用以上超標(biāo)量流水線的話,只需要10 / 2 = 5 條指令的時間。
流水線吞吐率計算
流水線的吞吐率(TP)是指在單位時間內(nèi)流水線所完成的任務(wù)數(shù)量或輸出的結(jié)果數(shù)量。計算流水線吞吐流程的最基本的公式如下所示。
流水線最大吞吐率計算公式如下所示。
流水線的吞吐率計算問題相對來說還是比較簡單的。
本文轉(zhuǎn)載自微信公眾號「冰河技術(shù)」,可以通過以下二維碼關(guān)注。轉(zhuǎn)載本文請聯(lián)系冰河技術(shù)公眾號。