系統(tǒng) CPU 效率高,DMA 技術(shù)功不可沒!
?大家好,我是樹哥。
相信大家在學(xué)習(xí) Kafka 的時(shí)候,都會(huì)被問到:為啥 Kafka 這么快?許多朋友都會(huì)回答是因?yàn)?zero-copy 技術(shù)。而一說到 Zero-copy 就會(huì)說到 DMA 技術(shù)。
但 DMA 技術(shù)到底是啥?它誕生的背景是什么?它解決了什么問題?估計(jì)很多人就不知道了。今天就讓我?guī)Т蠹冶P一盤 DMA 技術(shù)!
什么是 DMA?
DMA,全稱 Direct Memory Access,即直接存儲(chǔ)器訪問。
DMA 傳輸將數(shù)據(jù)從一個(gè)地址空間復(fù)制到另一個(gè)地址空間,提供在外設(shè)和存儲(chǔ)器之間或者存儲(chǔ)器和存儲(chǔ)器之間的高速數(shù)據(jù)傳輸。
從 DMA 的定義我們可以知道,其主要是用來傳輸數(shù)據(jù),并且是在外設(shè)和存儲(chǔ)器或者存儲(chǔ)器與存儲(chǔ)器之間傳輸數(shù)據(jù)。
那為啥要通過 DMA 來進(jìn)行傳輸數(shù)據(jù)呢?
原因是:之前傳輸數(shù)據(jù)需要 CPU 參與,在大量數(shù)據(jù)傳輸時(shí)會(huì)消耗 CPU 資源。
因此為了提升 CPU 利用率,出現(xiàn)了 DMA 技術(shù),即直接讓內(nèi)存與磁盤進(jìn)行數(shù)據(jù)傳輸。
在 DMA 技術(shù)出現(xiàn)之前,Linux 通過 I/O 中斷的方式來傳輸數(shù)據(jù),其流程如下圖所示:
IO 中斷方式的數(shù)據(jù)傳輸流程
- 用戶進(jìn)程向 CPU 發(fā)起 read 系統(tǒng)調(diào)用讀取數(shù)據(jù),由用戶態(tài)切換為內(nèi)核態(tài),然后一直阻塞等待數(shù)據(jù)的返回。
- CPU 在接收到指令以后對(duì)磁盤發(fā)起 I/O 請(qǐng)求,將磁盤數(shù)據(jù)先放入磁盤控制器緩沖區(qū)。
- 數(shù)據(jù)準(zhǔn)備完成以后,磁盤向 CPU 發(fā)起 I/O 中斷。
- CPU 收到 I/O 中斷以后將磁盤緩沖區(qū)中的數(shù)據(jù)拷貝到內(nèi)核緩沖區(qū),然后再從內(nèi)核緩沖區(qū)拷貝到用戶緩沖區(qū)。
用戶進(jìn)程由內(nèi)核態(tài)切換回用戶態(tài),解除阻塞狀態(tài),然后等待 CPU 的下一個(gè)執(zhí)行時(shí)間鐘。
從上述流程可以看到,CPU 需要參與到「磁盤緩沖區(qū)拷貝到內(nèi)核緩沖區(qū)」、「內(nèi)核緩沖區(qū)拷貝到用戶緩存區(qū)」這兩個(gè)過程,極大地消耗了 CPU 資源。但有了 DMA 技術(shù)之后,其過程變成了這樣:
DMA 方式的數(shù)據(jù)傳輸流程
- 用戶進(jìn)程向 CPU 發(fā)起 read 系統(tǒng)調(diào)用讀取數(shù)據(jù),由用戶態(tài)切換為內(nèi)核態(tài),然后一直阻塞等待數(shù)據(jù)的返回。
- CPU 在接收到指令以后對(duì) DMA 磁盤控制器發(fā)起調(diào)度指令。
- DMA 磁盤控制器對(duì)磁盤發(fā)起 I/O 請(qǐng)求,將磁盤數(shù)據(jù)先放入磁盤控制器緩沖區(qū),CPU 全程不參與此過程。
- 數(shù)據(jù)讀取完成后,DMA 磁盤控制器會(huì)接受到磁盤的通知,將數(shù)據(jù)從磁盤控制器緩沖區(qū)拷貝到內(nèi)核緩沖區(qū)。
- DMA 磁盤控制器向 CPU 發(fā)出數(shù)據(jù)讀完的信號(hào),由 CPU 負(fù)責(zé)將數(shù)據(jù)從內(nèi)核緩沖區(qū)拷貝到用戶緩沖區(qū)。
- 用戶進(jìn)程由內(nèi)核態(tài)切換回用戶態(tài),解除阻塞狀態(tài),然后等待 CPU 的下一個(gè)執(zhí)行時(shí)間鐘。
仔細(xì)對(duì)比加入 DMA 技術(shù)之后的數(shù)據(jù)傳輸流程,我們可以發(fā)現(xiàn) DMA 技術(shù)優(yōu)化了數(shù)據(jù)從磁盤緩沖區(qū)拷貝到內(nèi)核緩沖區(qū)這個(gè)過程,減少了這個(gè)過程里 CPU 的參與。
實(shí)現(xiàn)原理
我們知道數(shù)據(jù)傳輸本質(zhì)上還是需要 CPU 去處理的,那 DMA 技術(shù)怎么實(shí)現(xiàn)不需要 CPU 參與就能實(shí)現(xiàn)數(shù)據(jù)傳輸呢?
雖然我并沒有仔細(xì)地看過 DMA 的實(shí)現(xiàn)原理,但可以大膽預(yù)測(cè)的是:其實(shí) DMA 技術(shù)還是有用 CPU,只不過其沒有用服務(wù)器的 CPU,而是自己配了一個(gè)計(jì)算單元,專門用于做數(shù)據(jù)傳輸。這就有點(diǎn)像 CPU 既可以做普通計(jì)算又可以做圖形計(jì)算一樣,但因?yàn)閳D形渲染太復(fù)雜,于是搞出來了個(gè) GPU 專門做圖形渲染一樣。
DMA 本質(zhì)是就是一個(gè)硬件技術(shù),其實(shí)際樣子是主板上的一個(gè)芯片,即 DMAC (DMA Controller DMA 控制器)以及 I/O 設(shè)備上的 DMAC 芯片。
通過在各個(gè) I/O 設(shè)備上都加了 DMAC 芯片,以網(wǎng)卡為例,用戶發(fā)送數(shù)據(jù),當(dāng)數(shù)據(jù)被映射到內(nèi)核后,CPU 只需要告訴 DMAC 這個(gè)芯片,「我」要發(fā) xxx 數(shù)據(jù),打算發(fā)到哪里去,你幫我去做吧,然后 CPU 就可以走了,繼續(xù)做其它事情。
DMA 最有價(jià)值的地方體現(xiàn)在當(dāng)要傳輸?shù)臄?shù)據(jù)特別大、還要求速度特別快的時(shí)候,可以有效減少 CPU 的阻塞時(shí)間。
目前大多數(shù)的硬件設(shè)備,包括磁盤控制器、網(wǎng)卡、顯卡以及聲卡等都支持 DMA 技術(shù)。通過 DMA 和虛擬內(nèi)存技術(shù),我們實(shí)現(xiàn)了 Zero Copy 的目標(biāo),IO 設(shè)備跟用戶程序空間傳輸數(shù)據(jù)的過程中,減少數(shù)據(jù)拷貝次數(shù),減少系統(tǒng)調(diào)用,實(shí)現(xiàn) CPU 的零參與,徹底消除 CPU 在這方面的負(fù)載。
總結(jié)
所謂的 DMA(Direct Memory Access,即直接存儲(chǔ)器訪問)其實(shí)是一個(gè)硬件技術(shù),其主要目的是減少大數(shù)據(jù)量傳輸時(shí)的 CPU 消耗,從而提高 CPU 利用效率。其本質(zhì)上是一個(gè)主板和 IO 設(shè)備上的 DMAC 芯片。CPU 通過調(diào)度 DMAC 可以不參與磁盤緩沖區(qū)到內(nèi)核緩沖區(qū)的數(shù)據(jù)傳輸消耗,從而提高效率。
參考資料
- 前面部分講的還可以!【STM32】 DMA 原理,步驟超細(xì)詳解,一文看懂 DMA_Z 小旋的博客 - CSDN 博客_dma stm32
- VIP!不錯(cuò)!“零拷貝” 的硬件基石 ——DMA 到底是個(gè)什么東西,它是如何工作的?- 墨天輪
- 圖畫得不錯(cuò)!VIP!DMA 技術(shù)是什么,在哪里用?看完絕對(duì)有收獲 - 簡(jiǎn)書
- 關(guān)于 DMA(Direct memory access)比較通俗淺白的理解 - 騰訊云開發(fā)者社區(qū) - 騰訊云?