自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

CPU、GPU的互連從1米飆至100米,英特爾:你相信光嗎?

人工智能 新聞
那么英特爾為什么要用到“光”?具體又是如何實現(xiàn)的?

英特爾用“光”,突破了大模型時代棘手的算力難題——

推出業(yè)界首款全集成OCI(光學(xué)計算互連)芯片。

圖片

△圖源:英特爾

要知道,在AI大模型遵循Scaling Law發(fā)展的當(dāng)下,為了取得更好的效果,要么模型規(guī)模、要么數(shù)據(jù)規(guī)模,都在往更大的趨勢發(fā)展。

這就會導(dǎo)致AI大模型在算力層面上,對整個計算、存儲,包括中間I/O通信等提出更高的要求。

而英特爾此次的突破口,正是I/O通信

在CPU和GPU中,用光學(xué)I/O取代電氣I/O進(jìn)行數(shù)據(jù)傳輸。

有什么用?

一言蔽之,數(shù)據(jù)傳輸距離遠(yuǎn)多了量大了,功耗低了——更適合AI大模型的“體質(zhì)”了。

圖片

△圖源:英特爾

那么英特爾為什么要用到“光”?具體又是如何實現(xiàn)的?

用上了“光”,從馬車變卡車

傳統(tǒng)采用電氣I/O的方式(銅線連接)固然有它的優(yōu)勢,例如支持高帶寬密度和低功耗,但致命的問題就是傳輸距離比較短(不到1米)。

這要放在一個機(jī)架里倒也是沒有問題,但AI大模型在算力上往往標(biāo)配都是服務(wù)器集群這個量級。

不僅占地面積大,還跨N多個機(jī)架,線都是需要幾十米甚至上百米的長度,功耗那是相當(dāng)?shù)母撸凰鼤缘羲泄┙o機(jī)架的電源,以至于沒有足夠的電去做計算和存儲芯片的讀寫操作。

除此之外,存算比方面,也正是因為大模型“大”的特點,由原來讀取一次做上百次計算的比例,到現(xiàn)在直接變成了接近1:1。

圖片

△圖源:英特爾

這就需要一種新的辦法,可以在提高算力和存儲密度的同時降低功耗、縮小體積,從而在一個有限的空間里,放進(jìn)更多的計算和存儲。

而用上了光學(xué)I/O,問題便迎刃而解了:

可在最長100米的光纖上,單向支持64個32Gbps通道。

一個形象的比喻就是,就好比從使用馬車(容量和距離有限)到使用小汽車和卡車來配送貨物(數(shù)量更大、距離更遠(yuǎn))

不僅如此,即使是在相對較近的距離去完成一些更高密度、更靈活的數(shù)據(jù)傳輸工作,OCI這種方式則可以類比成摩托車,速度更快且更靈活。

值得一提的是,這種OCI的方法不是停留在理論的那種。

據(jù)英特爾介紹,他們已經(jīng)利用了實際驗證的硅光子技術(shù),集成了包含片上激光器的硅光子集成電路(PIC)、光放大器和電子集成電路。

并且在此前也展示了與自家CPU封裝在一起的OCI芯粒,還能與下一代CPU、GPU、IPU等SOC(系統(tǒng)級芯片)集成。

還沒完,英特爾也已經(jīng)出貨了超過800萬個硅光子集成電路,其中超過3200萬個現(xiàn)已投入使用的激光器。

圖片

△圖源:英特爾

那么接下來的一個問題是:

英特爾的OCI是如何“煉”成的?

英特爾研究院副總裁、英特爾中國研究院院長宋繼強(qiáng)的交流過程中,他對這個問題做了深入的剖析和解讀。

圖片

△英特爾研究院副總裁、英特爾中國研究院院長,宋繼強(qiáng)

硅光子技術(shù)集合了20世紀(jì)兩項最重要的發(fā)明:硅集成電路和半導(dǎo)體激光。

與傳統(tǒng)電子產(chǎn)品相比,它支持在較遠(yuǎn)的距離內(nèi)更快的數(shù)據(jù)傳輸速度,同時利用英特爾高容量硅產(chǎn)品制造的效率。

圖片

英特爾這一次發(fā)布的硅光集成技術(shù),OCI芯粒達(dá)到了光電共封裝的層面。

這個光電共封裝是把一個硅光子集成電路(PIC),和一個電子集成電路(EIC),放在一個基板上組成了一個OCI芯粒,作為一個集成性連接的部件。

這就意味著xPU,包括CPU,未來的GPU都可以和OCI芯片封裝在一起。

OCI芯粒就是把數(shù)據(jù)中心CPU出來的所有的電氣I/O信號轉(zhuǎn)成了光,通過光纖,在兩個數(shù)據(jù)中心的節(jié)點或者是系統(tǒng)里面去互相傳輸。

目前的雙向數(shù)據(jù)傳輸速度達(dá)到了4Tbps,它在上層的傳輸協(xié)議兼容到PCIe 5.0,單向支持64個32Gbps通道,這在目前的數(shù)據(jù)中心當(dāng)中是足夠用的:

它采用8對光纖,功耗僅為每比特5皮焦耳(pJ),即10-12焦耳,這個數(shù)據(jù)比可插拔光收發(fā)器模塊的功耗降了3倍(后者是每比特15皮焦耳)。

圖片

△圖源:英特爾

在一個光傳輸?shù)耐ǖ览?,它實際上有8個不同的波段,每個波段的頻率間隔是200GHz,一共占用了1.6THz光譜的間距用來傳輸。

光從可見光到不可見光,實際上它的頻譜寬度是很寬的,從THz開始就算是接近光通訊了。

圖片

那么OCI芯粒未來會用在哪些領(lǐng)域呢?

對此,宋繼強(qiáng)表示:

一個是可以用它來實現(xiàn)通信,還可以把它跟CPU、GPU這些計算芯片封裝在一起,計算加通信非常緊密地封裝在一起。

我們通過硅光集成和先進(jìn)封裝技術(shù),先進(jìn)封裝英特爾也有非常多不同的技術(shù),就可以實現(xiàn)更高密度的I/O芯粒,然后再和其它的xPU結(jié)合,未來基于芯粒,形成很多不同種類的計算加互連的芯片種類,會有非常好的應(yīng)用前景。

就OCI I/O接口芯粒的性能演進(jìn)路線圖來看,它目前可以達(dá)到32Tbps傳輸速度的技術(shù)方案,主要靠迭代式的穩(wěn)步提升三個方面的指標(biāo),分別是:

  • 一根光纖里有8段穩(wěn)定的波段
  • 每一個波段的光數(shù)據(jù)傳輸率為32Gbps
  • 可同時拉8對光纖且互不影響

這三個指標(biāo)乘起來,就是目前單向上有2Tbps的數(shù)據(jù)傳輸速度,雙向即是4Tbps。未來可以繼續(xù)向上演進(jìn),逐步提升帶寬能力。

圖片

△圖源:英特爾

最后,英特爾在硅光集成技術(shù)的差異化方面,宋繼強(qiáng)也做出了解釋:

主要是我們把高頻率的激光發(fā)射器做在了晶圓上,又把硅的光放大器也集成上去,這是兩個比較核心的技術(shù),都是在晶圓級去制造出來的。

接下來,我們可以量產(chǎn)這樣的高集成度激光器,因為這種在片上的激光器的好處是用普通的光纖就可以去傳輸了。

并且在穩(wěn)定性方面,幾乎是100億小時才有可能發(fā)生一次錯誤。

責(zé)任編輯:張燕妮 來源: 量子位
相關(guān)推薦

2012-09-19 10:28:47

英特爾服務(wù)器CPU開發(fā)

2023-11-20 13:06:52

2009-07-16 18:45:37

2011-08-05 09:09:59

英特爾云計算

2010-10-26 10:32:06

ARM英特爾CPU

2017-01-20 13:58:31

英特爾GPUCPU

2013-03-15 17:37:33

Hadoop英特爾CPU

2009-12-10 16:20:52

英特爾變革

2009-03-02 10:59:46

英特爾NvidiaGPU

2014-08-04 11:32:19

Android* Bu英特爾

2013-12-19 10:06:18

英特爾Hadoop

2012-02-03 10:21:21

惠普英特爾安騰

2015-04-08 20:29:52

英特爾IDF

2009-02-20 08:44:45

裁員英特爾愛爾蘭

2009-09-15 09:26:31

英特爾副總裁跳槽EMC

2011-03-09 14:19:42

2011-09-30 10:39:01

英特爾CPU市場份額

2013-12-25 10:31:13

多核英特爾18核心
點贊
收藏

51CTO技術(shù)棧公眾號