IBM 推出 AI 芯片 NorthPole:內(nèi)置存儲器,號稱可“模擬人腦運行”
▲ 圖源 IBM
10 月 24 日消息,IBM Research 日前推出 AI 芯片 NorthPole,該芯片靈感號稱“來自人類大腦的運作”,推論性能據(jù)稱超越 4nm GPU,適用于邊緣計算等范疇。
IT之家經(jīng)過查詢得知,NorthPole 芯片是 IBM 曾在 2014 年“模擬人腦運作”的 TrueNorth 芯片的后繼者,芯片開發(fā)同樣由 TrueNorth 芯片負(fù)責(zé)人 Dharmendra Modha 所主導(dǎo)。
據(jù)悉,在傳統(tǒng)的半導(dǎo)體產(chǎn)業(yè)中,芯片主要遵循相同的基本架構(gòu),處理單元與儲存信息是相互分開的,這種架構(gòu)雖然簡化了芯片設(shè)計模式,卻也因傳輸速度趕不上處理速度而出現(xiàn)了“馮?諾伊曼瓶頸(von Neumann Bottleneck)”,而 Dharmendra Modha 則認(rèn)為,人腦是目前所知最節(jié)能的處理器,因而持續(xù)尋找以數(shù)字方式復(fù)制人腦的方法。
IBM 目前推出的 NorthPole 芯片,相對于傳統(tǒng)芯片最大的不同點在于“芯片內(nèi)置存儲器”,在沒有“馮?諾伊曼瓶頸”的情況下,NorthPole 芯片的 AI 推論能力優(yōu)于市面上競品。
雖然 NorthPole 采用 12nm 工藝,于 800 平方毫米上安置了 220 億個晶體管,擁有 256 個核心,于 8-bit 精度下每核心每個周期可執(zhí)行 2048 次操作,若是在 4-bit 或 2-bit 精度下,操作次數(shù)則可翻倍。
▲ 搭載 NorthPole 的 PCIe 卡,圖源 IBM
在具體架構(gòu)上,NorthPole 號稱模糊了運算與存儲間的界線,這讓 NorthPole 容易整合至系統(tǒng),且明顯減少了搭載芯片的設(shè)備負(fù)載。
IBM Research 在 ResNet-50 模型上測試 NorthPole,相較于同樣基于 12nm 工藝的 GPU 競品,NorthPole 每秒辨識幀數(shù)的能效是競品的 25 倍,而且不管是在延遲或運算空間的要求上,表現(xiàn)都優(yōu)于市面上所有主流架構(gòu),甚至凌駕基于 4nm 工藝的 GPU。
不過,NorthPole 的優(yōu)勢同時也是它的弱點所在,NorthPole 只能輕松讀取集成在芯片中的本地數(shù)據(jù)信息,讀取外界數(shù)據(jù)時,便沒有計算速度優(yōu)勢。
Dharmendra Modha 聲稱,雖然 NorthPole 無法用來承載 GPT-4,但應(yīng)該可滿足許多企業(yè)所需的模型推論要求。
目前 IBM Research 仍在研究 NorthPole 的適用領(lǐng)域,研究人員許多需要即時處理大量資料的邊緣計算可能非常適合 NorthPole,例如自動駕駛、遙感通信等領(lǐng)域,NorthPole 均有用武之地。