從邊緣到核心,PCIe Switch需要貴人相助!
閃存市場(chǎng)上,NVMe發(fā)展速度可以用出乎意料來形容,總之普及速度超快。在我看來,原因也很簡(jiǎn)單,當(dāng)SSD解決了磁盤低I/O 性能的問題,這個(gè)瓶頸消失后,iSCSI存儲(chǔ)傳輸協(xié)議的瓶頸,特別是時(shí)延的問題就會(huì)凸顯出來。從技術(shù)上,NVMe專門針對(duì)SSD的特點(diǎn)而設(shè)計(jì),解決了存儲(chǔ)傳輸協(xié)議,NVMe SSD成為服務(wù)器標(biāo)準(zhǔn)配置,這是時(shí)代的選擇。
NVMe SSD也會(huì)帶來新的問題,例如PCIe插槽的擴(kuò)展問題,對(duì)此PCIe Switch會(huì)是順理成章的事情。但讓人完全預(yù)料不到的是:PCIe Switch的價(jià)值不限于此,它還有更核心更重要的定位。這也是“大話存儲(chǔ)系列圖書及同名公眾號(hào)作者冬瓜哥在2017中國閃存峰會(huì)主題演講所傳遞的信息。
采用傳統(tǒng)的架構(gòu)設(shè)計(jì)方式,CPU是核心,內(nèi)存、SSD、 網(wǎng)卡以及GPU等通過CPU進(jìn)行控制和調(diào)度,在這種模式下,數(shù)據(jù)首先要傳遞給CPU內(nèi)存,GPU相關(guān)應(yīng)用中,GPU要到CPU 內(nèi)存來讀取數(shù)據(jù),在這個(gè)過程中 ,內(nèi)存和網(wǎng)絡(luò)訪問就會(huì)成為瓶頸。冬瓜哥指出,CPU擅長(zhǎng)邏輯控制,類似比特幣挖礦這類的應(yīng)用,主要依靠GPU的計(jì)算能力,數(shù)據(jù)經(jīng)過CPU,有些多此一舉。
有沒有更加理想的模式呢?對(duì)此,冬瓜哥給出了如下架構(gòu)模型。
新的模型以PCIe Switch為核心進(jìn)行鏈接。CPU仍然擔(dān)任邏輯控制和調(diào)度,但是數(shù)據(jù)傳輸透過PCIe Switch直接連接,其效率更高。
新設(shè)計(jì)模型的思想和網(wǎng)卡協(xié)議卸載、RDMA的思想有些類似,核心都是針對(duì)特殊的應(yīng)用需求(例如存儲(chǔ)),Bypass掉CPU、或者OS,縮短路徑,提升效率。傳統(tǒng)模型主要針對(duì)通用場(chǎng)景設(shè)計(jì),針對(duì)特殊的場(chǎng)景,其應(yīng)用效率不高。與之相比,新的模型顯然更加具有競(jìng)爭(zhēng)力。
從PCIe Switch擔(dān)任核心效果看,成效顯著。以GPU家督圖像搜索應(yīng)用為例,采用傳統(tǒng)方式,數(shù)據(jù)讀取速度為1.90GB/S,主機(jī)內(nèi)存(CPU)相對(duì)使用率為5230;對(duì)比新的方式,速度為2.50GB/S,主機(jī)資源占用率僅為1。圖像處理速度方面,傳統(tǒng)方式為312.5像素點(diǎn)/秒,其主要瓶頸在主機(jī)內(nèi)存;與之相比,新的模式為534.2像素點(diǎn)/秒,圖像處理的速度完全取決于GPU的能力。
無獨(dú)有偶。同樣在2017中國閃存峰會(huì)上,啟示錄技術(shù)服務(wù)公司創(chuàng)始人張廣彬在演講中披露,Intel下一代處理器(skylake)會(huì)集成NVMe RAID 控制器(RSTE),未來IO路徑更短,計(jì)算能力更強(qiáng)。因此,CPU會(huì)集成更多的功能,但與此同時(shí),設(shè)備廠商也希望更多Bypass掉CPU。這是一場(chǎng)有關(guān)控制力的爭(zhēng)奪。PCIe Switch要從邊緣到核心,CPU將是其強(qiáng)大對(duì)手和阻力。
毫無疑問,但PCIe Switch的角色從邊緣演變?yōu)楹诵?,效果顯而易見。PCIe Switch已經(jīng)散發(fā)出王者氣息,但要想成為真正的王者,PCIe Switch顯然還有一段艱難旅程,誰會(huì)成為PCIe Switch真正的貴人呢?!還是靜觀其變吧!