元宇宙鑄“芯”:道阻且長
在元宇宙中,要實現(xiàn)一滴水珠映射景物的逼真倒影、雪茄燃燒時煙霧彌漫的意境特效,都需要芯片的計算能力千萬倍地提升和圖像處理能力千萬級的擴展。作為人們對數(shù)字世界的終極想象,元宇宙這個舞臺足夠大、技術(shù)挑戰(zhàn)也無限高。在通往元宇宙的道路上,芯片是堅實路基和強大底座。為此,《中國電子報》記者采訪了英特爾、英偉達、高通等芯片廠商,看它們在構(gòu)筑元宇宙之“芯”時如何八仙過海、各顯神通。
元宇宙芯片的算力提升將是千倍級
在2021年4月的GTC線上峰會,英偉達CEO黃仁勛在招牌式的“廚房演講”中,使用了約14秒的“虛擬廚房”和“數(shù)字替身”,引發(fā)全球媒體熱議。這個以假亂真的“小魔術(shù)”,是通過3D掃描、語音驅(qū)動人物口型和動作、衣料等物理材質(zhì)的還原、廚房建模、可視化預(yù)覽等一系列圖像處理技術(shù)來完成的。而完成這些動作的基礎(chǔ)是GPU。
“元宇宙首先要有可視化的因素,可視化需要一個具有基于物理正確的光照和材質(zhì)的仿真環(huán)境,也就是圖形技術(shù)?;赗TX(英偉達的設(shè)計與可視化技術(shù))實時光線追蹤技術(shù),我們把以前需要大量集群離線渲染才能實現(xiàn)的影視級別渲染畫面做到了實時化,RTX技術(shù)和其對應(yīng)的硬件加速單元RT Core正是為此應(yīng)運而生?!庇ミ_專業(yè)可視化亞太區(qū)業(yè)務(wù)主管沈威在接受《中國電子報》專訪時表示。
要實現(xiàn)《雪崩》中所描述的元宇宙中“每一滴水珠都反射出辦公室窗子縮小了的倒影”的逼真感,對于GPU的光線追蹤和特性還原能力,提出了前所未有的要求?!霸钪嫘枰獙φ鎸嵨锢硎澜邕M行映射,這其中就存在大量的物理計算,比如空氣流體煙霧粒子爆炸等特效,這背后都是CUDA(英偉達推出的并行計算平臺和編程模型)通用計算模型的應(yīng)用?!鄙蛲f。
實際上,在《雪崩》所構(gòu)想的元宇宙中,模擬雪茄煙霧所需的算力和“模擬整個地球的天氣系統(tǒng)”不相上下。日本作家鈴木光司的科幻小說《環(huán)界》中,允許用戶通過VR頭盔和數(shù)據(jù)手套接入并以指定人物的視角體驗其人生的虛擬世界“環(huán)”,以包含128萬臺巨型計算機的超算集群作為算力底座。
英特爾公司高級副總裁兼加速計算系統(tǒng)和圖形事業(yè)部總經(jīng)理Raja Koduri相信,要如實復(fù)現(xiàn)《雪崩》中的元宇宙體驗,現(xiàn)有芯片的計算性能要實現(xiàn)1000倍的增長?!拔覀儽仨氃谙嗤踔粮偷哪芎南聦崿F(xiàn)1000倍的算力增長。按照摩爾定律的增長曲線,未來5年我們能實現(xiàn)大約8~10倍的增長。因此算法、架構(gòu)、神經(jīng)網(wǎng)絡(luò)算法等,都要在提高計算效率方面發(fā)揮作用?!盧aja Koduri表示。
對于Raja Koduri提出的目標,英特爾相關(guān)負責(zé)人向《中國電子報》記者表示,這是一個從E級計算走向Z級計算的過程。
“從2022年的ExaFLOPS(每秒1018次浮點運算)到2028年之前實現(xiàn)ZettaFLOPS(每秒1021次浮點運算)——即讓現(xiàn)有性能提升約1000倍。這條發(fā)展路徑將實現(xiàn)架構(gòu)、功率和散熱、數(shù)據(jù)傳輸及制程工藝等領(lǐng)域全面提升。”該負責(zé)人指出。
具體來看,英特爾在算力提升和算力基礎(chǔ)打造方面有三個重點。一是提供更多晶體管的核心微縮技術(shù),二是在功率器件和內(nèi)存增益領(lǐng)域提升半導(dǎo)體性能,三是探索物理學(xué)新概念,以重新定義計算。“我們概述了未來技術(shù)發(fā)展方向,即通過混合鍵合將封裝中的互連密度提升10倍以上,晶體管微縮面積提升30%至50%,在全新的功率器件和內(nèi)存技術(shù)上取得重大突破,基于物理學(xué)新概念所衍生的新技術(shù),在未來可能會重新定義計算。”英特爾相關(guān)負責(zé)人表示。
Meta英偉達將造全球最快AI超級計算機
2021年12月,百度在元宇宙平臺“希壤”召開百度AI開發(fā)者大會?;跀?shù)據(jù)傳輸算法調(diào)優(yōu)、本地渲染引擎調(diào)優(yōu)和聲學(xué)特性建模,百度打造了容納10萬人的元宇宙超級會場,實現(xiàn)了10萬人級的同屏互動、相互可見,用戶還能聽到實時背景音和空間音效。
今年1月,Meta宣布設(shè)計并打造了當今運行速度最快的AI超級計算機(以下簡稱RSC)之一,到2022年中期建成后,它將成為世界上運行速度最快的AI超級計算機。
RSC將幫助Meta的AI研究人員構(gòu)建從數(shù)萬億個示例中學(xué)習(xí)的AI模型,跨數(shù)百種語言工作,無縫分析文本、圖像和視頻,開發(fā)新的AR工具等。Meta希望RSC能助力構(gòu)建全新的AI系統(tǒng)。例如,為一大群使用不同語言的人員提供實時語音翻譯,讓他們可以無縫協(xié)作或一起玩AR游戲,最終為構(gòu)建元宇宙鋪平技術(shù)道路。
目前,這款A(yù)I超級計算機已經(jīng)部署了760個英偉達DGX A100系統(tǒng)作為計算節(jié)點,共有6080個英偉達A100 GPU。在今年晚些時候的第二階段,RSC將擴展至1.6萬個GPU,提供高達500億億次級混合精度AI計算性能。
據(jù)了解,Meta與英偉達聯(lián)合打造的大型AI研究超級計算機是迄今為止最大的英偉達DGX A100系統(tǒng)。該系統(tǒng)實現(xiàn)了數(shù)千個GPU集群的系統(tǒng)優(yōu)化,可以訓(xùn)練包含超過1萬億個參數(shù)的AI模型,承擔實時識別不法內(nèi)容等工作。
要實現(xiàn)元宇宙級別的高度模擬和模型創(chuàng)建,AI是必不可少的基礎(chǔ)設(shè)施。AI模型的識別和處理能力,能夠進行精細復(fù)雜的圖像處理,讓創(chuàng)作者更有效率地生產(chǎn)內(nèi)容。AI的算法調(diào)優(yōu)能力,能提升視覺、聽覺和交互體驗。同時,具有自監(jiān)督學(xué)習(xí)能力的AI,能夠通過大量文本訓(xùn)練識別有害信息,守護元宇宙的安全。
“無論是無人駕駛中對物體的視覺識別,還是自然語言處理,或者是Omniverse(英偉達的3D仿真模擬和協(xié)作平臺)中通過AI來驅(qū)動面部表情,其背后都利用了AI技術(shù),AI技術(shù)使創(chuàng)作者能脫離大量重復(fù)性工作,更好地參與虛擬世界以及元宇宙的構(gòu)建?!鄙蛲蛴浾弑硎尽?/p>
平臺級芯片將是元宇宙的終極戰(zhàn)場?
無論要進入《雪崩》的元宇宙、科幻電影《頭號玩家》的虛擬游戲世界“綠洲”、《環(huán)界》的人工生命計劃“環(huán)”、《三體》中模擬地外文明的游戲“三體”,一副以“頭套型屏幕”“電腦目鏡”“顯示頭盔”等各種名目出現(xiàn)的VR頭盔都是不可或缺的“入場券”。
高通技術(shù)公司XR業(yè)務(wù)中國區(qū)負責(zé)人郭鵬在接受《中國電子報》專訪時表示,不論元宇宙會發(fā)展成何種形態(tài),人們都會需要終端來把物理空間和數(shù)字空間連接在一起,并把大家?guī)氲教摂M現(xiàn)實中。
“元宇宙是一個永遠存在的‘空間互聯(lián)網(wǎng)’,能夠連接真實世界和虛擬世界并打造個性化的數(shù)字體驗,讓人和萬物都能夠在其中無縫地溝通和交互。人們將通過智能手機、PC、AR/VR終端等計算終端,進入全方位反映現(xiàn)實生活的元宇宙。在元宇宙中,大量用戶和企業(yè)能夠以2D和3D形式探索、創(chuàng)建并參與各種各樣的日常體驗和社區(qū)及經(jīng)濟活動。”郭鵬指出。
在很長一段時間里,XR(VR/AR/MR)終端都使用手機SoC作為主力處理器。隨著XR設(shè)備的規(guī)格持續(xù)優(yōu)化,對于視野、分辨率、刷新率、用戶感知、環(huán)境感知、定位技術(shù)的需求也不斷提升,更符合XR性能和功耗需求的專用處理器被提上日程。
2018年5月,高通推出驍龍XR1平臺,該平臺是全球首款XR專用平臺。2019年12月,高通公司推出全球首個5G XR平臺——驍龍XR2平臺。驍龍XR2支持5G連接、每只眼睛90fps 3K×3K的分辨率以及七路并行攝像頭,且具備計算機視覺專用處理器。目前,已有超過50款搭載驍龍平臺的VR和AR終端發(fā)布。2020年5月,海思發(fā)布XR芯片平臺,推出首款可支持8K解碼能力、集成GPU、NPU的XR芯片,支持單眼42.7PDD(每度像素數(shù))。
在芯片平臺的基礎(chǔ)上,構(gòu)建元宇宙體驗還需要渲染引擎、內(nèi)容生態(tài)提供商、互聯(lián)網(wǎng)公司、社交和娛樂企業(yè)等產(chǎn)業(yè)鏈各個環(huán)節(jié)的協(xié)同作戰(zhàn)。郭鵬表示,高通是整個產(chǎn)業(yè)鏈中底層技術(shù)的提供商,主要從四個層面支撐元宇宙的構(gòu)建和發(fā)展。首先,是為廠商提供能夠解決XR設(shè)備技術(shù)難題的專用芯片平臺;其次,打造基于XR專用平臺的參考設(shè)計,助力合作伙伴加快終端的規(guī)?;逃?再次,針對XR領(lǐng)域的技術(shù)挑戰(zhàn),提供軟件、空間計算算法和架構(gòu);最后,發(fā)起一系列硬件和軟件生態(tài)系統(tǒng)計劃,減輕合作伙伴在產(chǎn)品商用化過程中的負擔。
構(gòu)建芯片性能之后,如何有效交付,以“黑盒”的方式讓軟件開發(fā)者、程序員和創(chuàng)作者便捷使用,是不遜于芯片制造本身的頭等大事。為此,英特爾、英偉達、高通都面向元宇宙打造了豐富的芯片平臺,讓開發(fā)者更高效地調(diào)用芯片性能。
在英特爾的技術(shù)構(gòu)想中,賦能元宇宙的技術(shù)基石可概括為三個層次。一是元智能層,旨在提供統(tǒng)一的編程模型以及開放的軟件開發(fā)工具和軟件開發(fā)庫,以便開發(fā)者能夠更輕松地部署復(fù)雜的應(yīng)用程序。二是元操作層,聚焦于向用戶交付超越本地的可用算力。三是元計算層,為實現(xiàn)元宇宙體驗提供其所需的原始動力。
目前,英特爾已經(jīng)在計算層面形成了XPU異構(gòu)計算戰(zhàn)略,包括CPU、GPU、FPGA、AI芯片和其他加速器,將工作負載與適合的架構(gòu)匹配,以滿足日益增長的算力需求。在異構(gòu)平臺上,硬件性能需要軟件來釋放,英特爾基于oneAPI提供了開放、基于標準的編程環(huán)境,打破了封閉式編程模型的限制,并支持多種平臺和架構(gòu)的編程需要。
Omniverse平臺被英偉達定義為“工程師的元宇宙”,將實時光線追蹤等圖形能力、AI和計算(CUDA)三大要素打包交付。沈威表示,Omniverse 已成為構(gòu)建元宇宙或虛擬世界的技術(shù)解決方案,將助力形成一套以O(shè)mniverse為平臺,并擁有強勁算力支撐和先進硬件基礎(chǔ)的元宇宙體系?!霸诮柚鶲mniverse構(gòu)建的未來世界中,所有部分都將由AI計算系統(tǒng)驅(qū)動并進行處理,該系統(tǒng)能夠處理它所需要的信息,例如視覺信息、傳感器信息、物理信息和自動化智能?!鄙蛲f。
而高通也在為元宇宙所需的空間計算提供兩個層面的芯片和軟件算法,第一個層面是“我在哪里,我在干什么”,也就是用戶頭部自由度定位、手柄定位以及手勢、眼球、表情和腿的定位等身體感知的基礎(chǔ)技術(shù)。第二個層面是空間定位,即對環(huán)境的感知?;谏鲜黾夹g(shù)支撐,高通能更高效地支持開發(fā)者把虛擬物體放在現(xiàn)實世界中,與現(xiàn)實世界融合。2021年11月,高通還推出了頭戴式AR開發(fā)套件驍龍Spaces XR開發(fā)者平臺,為開發(fā)者提供實現(xiàn)創(chuàng)意的工具,使頭戴式AR實現(xiàn)更多可能。