關于人工智能根技術的解析,深度
人工智能芯片與人工智能框架代表企業(yè)
作為算力算法的關鍵基礎,人工智能芯片、人工智能框架的性能決定著人工智能產(chǎn)業(yè)的發(fā)展。
隨著人工智能成為大國競爭的新焦點。與美國相比,我國目前人工智能的短板就是關鍵根技術的缺失。
“十四五”時期人工智能規(guī)劃需要關注的重點就是如何通過明確我國人工智能技術發(fā)展路線,發(fā)揮我國制度優(yōu)勢,促進人工智能根技術突破和創(chuàng)新。
AlphaGo再次進化。
2020年12月,據(jù)《自然》雜志報道,DeepMind公司的一項研究提出了MuZero算法,可以在不知道規(guī)則的情況下,通過自己試驗,掌握圍棋、國際象棋等游戲,被認為在尋求通用人工智能算法方面邁出重要一步。
許多人還記得,2016年,這個人工智能程序的“前輩”AlphaGo第一次戰(zhàn)勝人類世界頂級圍棋選手。一年后,繼任者AlphaGoZero通過規(guī)則輸入和自我博弈進行學習,在僅40天的訓練后成功擊敗上一代產(chǎn)品。不久之后,9小時掌握國際象棋、12小時掌握日本將棋、13天掌握圍棋的AlphaZero出世……
是什么讓人工智能飛速進化?
如果把人工智能比作一棵“技術樹”,擊敗人類棋手的人工智能程序只是“樹冠”,為整棵樹提供滋養(yǎng)、使其不斷升級的,則是圍繞基礎軟硬件的人工智能根技術。
中國科學技術信息研究所黨委書記趙志耘告訴《t望》新聞周刊記者,人工智能根技術,是指那些能夠支撐人工智能技術發(fā)展和支撐人工智能產(chǎn)業(yè)衍生的基礎研究和關鍵技術,比如人工智能芯片、系統(tǒng)框架等。
根深葉茂。某種程度上,根技術,決定著產(chǎn)業(yè)發(fā)展的興衰。
根技術左右人工智能生態(tài)
人工智能對計算能力的需求有多強?
據(jù)硅谷非營利組織OpenAI測算,2012年開始,全球人工智能訓練所用的計算量呈現(xiàn)指數(shù)增長,平均每3.43個月便會翻一倍,目前計算量已擴大30萬倍,遠超算力增長速度。傳統(tǒng)的CPU架構早已無法滿足深度學習對算力的需求,AlphaGo的硬件基礎就是專注神經(jīng)網(wǎng)絡算法、大幅加快運算速度的TPU芯片。
可以說,作為算力的關鍵基礎,人工智能芯片的性能決定著人工智能產(chǎn)業(yè)的發(fā)展。
清華大學微納電子系教授魏少軍指出,現(xiàn)有CPU、GPU、FPGA等芯片的基本架構早在這次人工智能突破之前就已經(jīng)存在了,并不是為人工智能而專門設計的,因此不能完美地承擔實現(xiàn)人工智能的任務。人工智能對芯片的要求,除了足夠的算力和極高的能效比,還需要一個高能效、通用的計算引擎。
魏少軍認為人工智能芯片至少應有以下幾個特質:第一,可編程性,要適應算法的演進和應對多樣性,因為算法不穩(wěn)定,在不斷變化;第二,架構動態(tài)可變性,要適應不同算法;第三,高效的架構變換能力,因為不同的運算要求變換不同的架構。
除此之外,AlphaGo之所以能在極短時間內(nèi)快速“進化”,算法的提升同樣功不可沒,背后是人工智能算法框架使然。
賽迪智庫信息化與軟件產(chǎn)業(yè)研究所信息技術研究室負責人許亞倩說,算法框架能夠極大地提高人工智能學習效率。一方面,算法框架降低了深度學習的難度,提供進行深度學習的底層架構、接口,以及大量訓練好的神經(jīng)網(wǎng)絡模型,減少用戶的編程耗時。另一方面,大部分深度學習框架具有良好的可擴展性,支持將復雜的計算任務優(yōu)化后在多個服務器的CPU、GPU或TPU中并行運行,縮短模型的訓練時間。
此外,許亞倩認為,算法框架還是人工智能核心生態(tài)圈建立的關鍵環(huán)節(jié)。算法框架是決定人工智能技術、產(chǎn)業(yè)、應用的核心環(huán)節(jié),是人工智能核心生態(tài)圈建立的基礎和關鍵。算法框架的研發(fā)能夠促進生態(tài)圈關聯(lián)及外圍的芯片、系統(tǒng)、軟硬件平臺等產(chǎn)業(yè)發(fā)展,從而促進人工智能核心生態(tài)圈的建設。
歐美發(fā)達國家已經(jīng)在人工智能算法框架方面進行了大量的研究和開發(fā)應用。Google、亞馬遜、微軟、IBM等國際科技巨頭紛紛布局算法框架,搶占技術和市場先機,開發(fā)開源了TensorFlow、PyTorch等一批主流人工智能算法框架。
根技術是關鍵短板
“隨著中美競爭態(tài)勢加劇,人工智能成為大國競爭的新焦點。與美國相比,我國目前人工智能的短板就是關鍵根技術的缺失。”趙志耘說。
受訪專家指出,近年來,我國人工智能在技術與應用方面取得了巨大進展,在國際上具備了一定的競爭力,但基礎層整體實力較弱,缺乏人工智能框架、人工智能芯片等根技術的支撐――芯片大多依賴進口,計算力方面的基礎薄弱,且開源框架受制于國外巨頭。
據(jù)了解,我國芯片進口額已經(jīng)連續(xù)多年超過石油,2019年超過3000億美元;操作系統(tǒng)、高端光刻機仍被國外公司壟斷,90%以上傳感器來自國外。
賽迪智庫人工智能產(chǎn)業(yè)形勢分析課題組研究指出,在人工智能的算力支持方面,IBM、HPE、戴爾等國際巨頭穩(wěn)居全球服務器市場前三位,浪潮、聯(lián)想、新華三等國內(nèi)企業(yè)市場份額有限;國內(nèi)人工智能芯片廠商需要大量依靠高通、英偉達、AMD、賽靈思、美滿電子、EMC、安華高、聯(lián)發(fā)科等國際巨頭供貨,中科寒武紀等國內(nèi)企業(yè)發(fā)展剛剛起步。
用清華大學電子工程系教授汪玉的話概括,大致上國內(nèi)人工智能芯片在需要聰明智慧的環(huán)節(jié)做得不錯,但在需要積累沉淀的環(huán)節(jié)做得卻不夠好。專家指出,我國人工智能芯片在通用化、產(chǎn)業(yè)鏈完整度、高速接口和專用的集成電路IP核等方面都存在短板。
“對于人工智能芯片產(chǎn)業(yè)來說,僅有好的硬基礎是不夠的,在硬基礎上再做出好的軟件,才能做得更好。”中國信息通信研究院云計算與大數(shù)據(jù)研究所總工程師王蘊韜強調說。
目前,我國在基礎軟件方面仍面臨外國廠商獨大的局面。數(shù)據(jù)顯示,中國服務器發(fā)貨量占全球28%,中國的操作系統(tǒng)銷售額則占全球不足6%。從全球市場份額來看,中國應用軟件基本達成了“三分天下有其一”的格局。但從技術底座來看,只有約10%的政府類應用軟件運行在中國的技術底座上,其余九成的應用還是以國外技術底座為主。
t望智庫聯(lián)合莫干山研究院發(fā)布的《賦能數(shù)字經(jīng)濟擁抱算力時代》報告則指出,我國新計算產(chǎn)業(yè)底層技術架構和標準由國外企業(yè)主導,存在較高產(chǎn)業(yè)安全風險。自第一代電子管計算機ENIAC面世以來,CPU外圍所有的接口總線標準制定權,都掌握在國外企業(yè)手中,我國企業(yè)只能在既定框架內(nèi)謀求發(fā)展。
以人工智能框架這樣的基礎軟件為例,深度學習主流框架TensorFlow、Caffe等均為美國企業(yè)或機構掌握,國內(nèi)還缺少自主可控的全場景計算框架,且目前計算框架存在開發(fā)門檻高、運行成本高、部署難度大等亟待解決的問題。
《賦能數(shù)字經(jīng)濟擁抱算力時代》報告指出,目前西方國家以超30%的投入主導全球關鍵開源社區(qū)和開源項目。GitHub(一個面向開源及私有軟件項目的托管平臺)2019年年度報告顯示,在其4000萬的用戶(開發(fā)人員)中,美國開發(fā)人員占30%,其他國家的開發(fā)人員占到70%;年度最受歡迎的Top10開源軟件和項目,均由谷歌、微軟、Facebook等美國公司主導。雖然2020年,來自美國的開源貢獻者下降到22.7%,越來越多的開發(fā)者來自中國(9.76%)和印度(5.2%),但總體來看,我國在開源社區(qū)和項目的貢獻度仍然不高,影響力有待進一步提高。
超前布局突破根技術制約
趙志耘認為,“十四五”時期人工智能規(guī)劃需要關注的重點是如何通過明確我國人工智能技術發(fā)展路線,發(fā)揮我國制度優(yōu)勢,促進人工智能根技術突破和創(chuàng)新。
人工智能芯片方面,專家表示,首先需要全面布局,在政府層面加強對通用芯片支持力度。在技術路徑上,遵循全面布局,分步突破原則,近期重點突破以NPU為代表的ASIC芯片,遠期突破GPU、FPGA等通用芯片;在應用環(huán)節(jié)上逐步拓展,從邊緣端逐步擴展到云端,從推理芯片拓展到訓練芯片;同時探索多種芯片高效協(xié)同運行的芯片解決方案。由于ASIC芯片專用性強,不同廠商往往需根據(jù)應用場景需求自主研發(fā);而GPU、FPGA等通用芯片由于有標準化產(chǎn)品,國內(nèi)終端應用廠商自主研發(fā)或國產(chǎn)化替代意愿不強。因此,政府層面應在GPU和FPGA等通用芯片領域加強布局推廣力度。
此外,加強類腦芯片等前沿性領域布局。充分發(fā)揮國內(nèi)高校以及科研院所力量,布局類腦芯片等前沿性領域。該領域國際巨頭尚未形成技術及知識產(chǎn)權壁壘,提前布局將使我國在人工智能芯片領域存在換道超車的可能性。
賽迪顧問股份有限公司的研究認為,人工智能芯片未來將呈現(xiàn)新發(fā)展趨勢。如芯片開發(fā)將從技術難點轉向場景痛點。目前,人工智能芯片設計更多地是從技術角度出發(fā),以滿足特定性能需求。未來,芯片設計需要從應用場景出發(fā),借助場景落地實現(xiàn)規(guī)模發(fā)展。又如,技術路線將從專用芯片轉向通用芯片。目前應用于人工智能領域的芯片多為特定場景設計,不能靈活適應多場景需求,未來需要專門為人工智能設計靈活、通用的芯片。另外,現(xiàn)階段人工智能芯片產(chǎn)業(yè)的發(fā)展方式大多以企業(yè)為主體,產(chǎn)品上下游企業(yè)的運營和管理相對獨立,但同環(huán)節(jié)的企業(yè)卻高度競爭,未來產(chǎn)業(yè)發(fā)展應以合作為主線,形成產(chǎn)業(yè)生態(tài)。
北京大學經(jīng)濟學院教授、深圳市灣區(qū)數(shù)字經(jīng)濟與科技研究院院長曹和平表示,發(fā)展人工智能芯片要有產(chǎn)業(yè)思維。“要做產(chǎn)業(yè),而不僅僅是做產(chǎn)品。要在促進芯片產(chǎn)業(yè)發(fā)展的前提下做芯片,在全景產(chǎn)業(yè)鏈條下做芯片的外部性成本更低。”
中國工程院院士高文認為,開源是軟件時代非常關鍵的一條技術路線,人工智能領域也應該采用。
中國工程院院士倪光南表示,芯片設計門檻極高,只有極少數(shù)企業(yè)能夠承受中高端芯片研發(fā)成本,這也制約了芯片領域創(chuàng)新。我國可以借鑒開源軟件成功經(jīng)驗,降低創(chuàng)新門檻,提高企業(yè)自主能力,發(fā)展國產(chǎn)開源芯片。
人工智能框架方面,專家指出,新一代人工智能開源計算框架,首先要讓人工智能專家、工程師、數(shù)據(jù)科學家們可以更好地使用;其次,計算框架需要滿足人工智能全場景的應用需求,更好地保護數(shù)據(jù)隱私;并且可開源,通過開源形成廣泛的應用生態(tài),廣泛支持不同類型的人工智能芯片、硬件設備、應用等。目前,深度學習框架開源已成趨勢。曠視深度學習框架天元、華為深度學習框架MindSpore皆已正式開源。
趙志耘還建議,應通過集約化建設人工智能基礎設施和計算中心等,進一步利用長板,加快人工智能與行業(yè)深度融合,培養(yǎng)多層次人才,確保我國人工智能產(chǎn)業(yè)在中長期國際競爭中持續(xù)保持領先。
目前,新基建正帶動一批人工智能基礎設施落地。2020年以來,河南、安徽、廣州等地均有數(shù)據(jù)中心項目啟動。去年,總投資超150億元的騰訊長三角人工智能超算中心及產(chǎn)業(yè)基地落戶上海松江區(qū),武漢人工智能計算中心也啟動建設。趙志耘認為,人工智能計算中心是人工智能產(chǎn)業(yè)的基礎算力供給平臺,能極大發(fā)揮集聚效應,承擔人工智能領域的國家重大戰(zhàn)略需求、基礎共性技術攻關、前瞻性基礎與算法研究,并能帶動當?shù)貎?yōu)勢產(chǎn)業(yè)領域的人工智能核心技術研發(fā)及應用,促進高端人才培養(yǎng)。