IBM研究院公布計算內(nèi)存和模擬AI架構(gòu)重大突破
本周在IEEE國際電子元件會議上,IBM研究院(IBM Research)公布了在“計算內(nèi)存架構(gòu)”方面所取得的一項突破性成果,該架構(gòu)可以為混合云平臺中的人工智能計算工作負(fù)載實(shí)現(xiàn)卓越的性能水平。
研究人員開發(fā)出了號稱第一個嵌入式磁阻隨機(jī)存取存儲器(Magnetoresistive Random-Access Memory)技術(shù),采用14納米架構(gòu),并稱其是Spin Transfer Torque MRAM(STT-MRAM),這一新架構(gòu)有助于解決數(shù)據(jù)密集型混合云和AI工作負(fù)載中的關(guān)鍵內(nèi)存瓶頸。
IBM在博客文章中表示,隨著企業(yè)將那些要求最苛刻的工作負(fù)載遷移到混合云平臺,他們將面臨“計算內(nèi)存瓶頸”的問題,這是由于系統(tǒng)中處理器比現(xiàn)有內(nèi)存系統(tǒng)速度快得多而導(dǎo)致內(nèi)存短缺的問題。
IBM表示,這種新型STT-MRAM架構(gòu)可以解決內(nèi)存和處理器之間的瓶頸,實(shí)現(xiàn)更高的內(nèi)存性能。
STT-MRAM利用電子自旋將數(shù)據(jù)存儲在磁疇中,并將靜態(tài)RAM的高速度與傳統(tǒng)DRAM的更高密度結(jié)合在一起,從而提供了一種更可靠的內(nèi)存架構(gòu)。IBM表示,最后一級CPU緩存中部署STT-MRAM,將可以減少數(shù)據(jù)密集型工作負(fù)載所需的內(nèi)存讀寫操作,從而降低系統(tǒng)延遲和功耗,同時增加帶寬。
IBM在今日發(fā)表的白皮書中稱,這項14納米嵌入式STT-MRAM CMOS技術(shù)是有史以來最先進(jìn)的MRAM系統(tǒng),將為混合云中的AI工作負(fù)載提供一個“效率更高、性能更高的系統(tǒng)”。
IBM在另外一份白皮書詳細(xì)介紹了這個新型架構(gòu)所使用的高級磁性材料,這種材料讓STT-MRAM系統(tǒng)具有更高的密度,存儲量是原來的兩倍,從而大大提高了數(shù)據(jù)恢復(fù)性能。
IBM還透露了有關(guān)“模擬內(nèi)存計算”研究的最新信息,這種技術(shù)將計算和內(nèi)存結(jié)合到單一設(shè)備中,用于處理要求更為苛刻的AI工作負(fù)載。IBM說,這種專有硬件可以用于訓(xùn)練越來越復(fù)雜的AI模型,能效大幅提升。
打造用于AI的專用模擬內(nèi)存計算硬件,面對的挑戰(zhàn)之一,就是“突觸權(quán)重映射問題”。突觸權(quán)重用于指示神經(jīng)網(wǎng)絡(luò)中兩個節(jié)點(diǎn)之間的連接強(qiáng)度,需要將其精確地映射到模擬非易失性內(nèi)存設(shè)備上,以實(shí)現(xiàn)深度學(xué)習(xí)推理,但做到這一點(diǎn)面臨巨大挑戰(zhàn),IBM說.
IBM在第一份題為《相變內(nèi)存設(shè)備中進(jìn)行深度學(xué)習(xí)推理編程的突觸權(quán)重精確度》白皮書中討論了依賴于脈沖編碼調(diào)制的、基于模擬電阻的存儲設(shè)備如何用于解決這一映射難題,并描述了一種通過分析和通過陣列級實(shí)驗(yàn)準(zhǔn)確映射突觸權(quán)重的方法。
在另外一份題為《“無輔助的真實(shí)模擬神經(jīng)網(wǎng)絡(luò)訓(xùn)練芯片》的白皮書描述了IBM模擬神經(jīng)網(wǎng)絡(luò)芯片的概念,其本質(zhì)上是一種“電阻處理單元”(RPU),具有出色的實(shí)時性能,堪比同類的數(shù)字系統(tǒng),從而在運(yùn)行AI推理時可實(shí)現(xiàn)承諾的“模擬優(yōu)勢”。