張亞勤:對于產(chǎn)業(yè)來講,深度學(xué)習(xí)的黃金時代剛剛開始
今天,張亞勤教授在CNCC 2020上帶來以“智能技術(shù)趨勢”為主題的演講,隨著數(shù)字化3.0的到來,張教授重置技術(shù)與工業(yè)的角度討論數(shù)字化的新浪潮,并分享了他在人工智能、新計算體系和通訊架構(gòu)等方面的見解。
以下內(nèi)容在張亞勤教授的演講基礎(chǔ)上略有改動。
數(shù)字化新浪潮帶來了歷史性的變革:一切都在數(shù)字化
張亞勤表示,隨著數(shù)字化3.0的到來,未來十年許多行業(yè)都將經(jīng)歷構(gòu)造轉(zhuǎn)變。這場數(shù)字化的新浪潮提供了歷史性的機會,可以通過先進(jìn)的機器學(xué)習(xí)算法,增強的計算能力,5G的新基礎(chǔ)設(shè)施,神經(jīng)形態(tài)計算來改變現(xiàn)有的工業(yè)格局。
過去我們做計算機最大的現(xiàn)象是數(shù)字化,數(shù)字化1.0在80年代中期就開始了,那個時候更多的是把內(nèi)容數(shù)字化,有語音、音樂、視頻、圖像,包括后面的HDTV和Video,整個發(fā)展相當(dāng)快。
數(shù)字化2.0在90年代中期開始,由于內(nèi)容數(shù)字化,產(chǎn)生了消費者互聯(lián)網(wǎng),掀起了好幾輪浪潮。同時企業(yè)也在數(shù)字化,包括ERP、CRM、工作流以及商業(yè)智能,到了后面有各種數(shù)字倉庫、云,各種各樣。但在軟件領(lǐng)域,消費軟件產(chǎn)品市場在中國一直沒有真正到一個主流。
現(xiàn)在進(jìn)入全新的數(shù)字化3.0,包括互聯(lián)網(wǎng)物理化。首先是物理世界數(shù)字化,我們的車、船,飛行器件數(shù)字化,路、交通等,城市在數(shù)字化,家庭在數(shù)字化,工業(yè)、車間、電網(wǎng)、機器,乃至貨幣都在數(shù)字化,可以看到物理世界和數(shù)字世界形成一對一的影射。過去我們講數(shù)字高速公路,現(xiàn)在真的高速公路也變成數(shù)字。
可以看到,由于物理世界數(shù)字化,產(chǎn)生的信息量和數(shù)據(jù)達(dá)到了天文級,比如無人車,每個人每天可以產(chǎn)生10個T的數(shù)據(jù)。另外一個特點就是,現(xiàn)在數(shù)據(jù)大部分不是給人看,而是讓機器做決策,比如無人駕駛。
不像第一代和第二代,我們的生物世界也在進(jìn)行數(shù)字化,大腦、身體,每個器官,甚至包括DNA還有蛋白質(zhì),通過腦和世界的接口,這個數(shù)據(jù)量更大,比我們物理世界更大。這個容量級很難用正常的方式去處理計算。
現(xiàn)在這個世界是信息物理和生物世界的融合,先是數(shù)字化,然后連到一起,最后才是智能化。
AI變革帶來產(chǎn)業(yè)新機遇
5G出現(xiàn)之后,的確帶來很多新的可能。5G是第一次把三網(wǎng)真正在應(yīng)用層統(tǒng)一了,這是一件大事,5G讓傳輸?shù)乃俣雀?、延遲更低。
任何新的技術(shù)需要時間,大家要有一些耐心,5G剛剛發(fā)展速度就已經(jīng)很快了,張教授表示相信在未來三到五年5G能夠帶來巨大的變革,不僅是對用戶,更多的是對于工業(yè)和產(chǎn)業(yè)。
張教授還用兩張圖舉了兩個例子,一是百度昆侖芯片路線圖,第一代昆侖AI芯片已經(jīng)達(dá)到14nm工藝、2.5D封裝、512G的帶寬。明年會出來第二代,7nm,耗能減少很多,性能將提高3倍左右。
另外一個例子是地平線自動駕駛芯片的路線圖??梢钥吹?,隨著Level的提升,規(guī)劃越來越困難,需要很強的功能,很好的穩(wěn)定性。地平線在這方面做了很多的工作,芯片不管是從質(zhì)量、性能、耗能上都和現(xiàn)在的國際芯片(像特斯拉的SSD)達(dá)到同樣的性能,甚至更好。
我們可以看到,技術(shù)的發(fā)展確實給IT產(chǎn)業(yè)以及很多行業(yè)帶來了新的機遇。首先IT產(chǎn)業(yè)本身是最大的受益者。不管是芯片技術(shù)、操作系統(tǒng)、云平臺還是應(yīng)用,都在不斷的快速迭代。更重要的是,它改變甚至顛覆了目前的產(chǎn)業(yè),教育、醫(yī)療、金融、制造,每個行業(yè)都會有AI的成分。
如今的AI就像20年前的互聯(lián)網(wǎng),能夠融入到每個行業(yè)。
再有就是創(chuàng)造新的行業(yè)。張亞勤教授認(rèn)為自動駕駛、工業(yè)物聯(lián)網(wǎng)、AI醫(yī)療生物計算,這三個領(lǐng)域很有潛力,他自己也比較有興趣。
最后,張亞勤提到,希望他成立的智能產(chǎn)業(yè)研究院能夠成為國際化、智能化、產(chǎn)業(yè)化的應(yīng)用研究機構(gòu),能夠吸引與培養(yǎng)出有國際視野的CTO和頂級的架構(gòu)師,并利用核心技術(shù)突破孵化出一些新企業(yè)。
尋找下一輪AI的突破口;對于產(chǎn)業(yè)來講,深度學(xué)習(xí)的黃金時代剛剛開始
下面這張圖涵蓋了人工智能60年上下。可以看到,在左半部分講到人工智能發(fā)展的不同流派,未來最大的可能是借各種流派之長,創(chuàng)造新的一些算法,有邏輯符號也有數(shù)據(jù)和知識,要借鑒人類的進(jìn)化,大腦的特點。
現(xiàn)在,不管是做研究的也好,做產(chǎn)業(yè)的也好,都在思考下一輪人工智能突破在什么地方,特別是現(xiàn)在深度學(xué)習(xí),經(jīng)過十幾年的研究和應(yīng)用,已經(jīng)到了一個穩(wěn)定期?,F(xiàn)在主要的發(fā)展不僅是靠算法,更多的靠計算的算力。
張亞勤教授認(rèn)為,在研究方面、算法方面,還有一些可挖掘之處,但是已經(jīng)到了相對平臺期。不過對于產(chǎn)業(yè)來講,深度學(xué)習(xí)的黃金時代才剛剛開始,還有至少十年的時間可以深入到每個不同的行業(yè)里。
他還在演講中提到,人工智能當(dāng)下遇到的挑戰(zhàn)主要是隱私、數(shù)據(jù)保護和倫理工作。前段時間,張教授在美國碰到一個小團隊在做通用人工智能。他們的主要的任務(wù)是創(chuàng)造一個有自主意識的AI。他自己表示堅決反對。
我們再看看最基本的東西,計算和通訊基本的范式。
第一是香農(nóng)定律,包含三個方面,熵、信道容量和速率編碼。定義了三個極限,無損壓縮極限,信道傳輸極限,有損壓縮極限?,F(xiàn)在這幾部分基本上都快接近極限了。
第二個是馮諾伊曼架構(gòu),做計算機60年來都采用這個架構(gòu)。馮諾伊曼架構(gòu)相當(dāng)簡單和漂亮,就是一個程序儲存的原理。但在這幾年,特別是在深度學(xué)習(xí)上已經(jīng)有了很大的限制。
第三個是摩爾定律,想必這個大家都比較熟悉,原來摩爾定律中提到的每18個月、24個月的發(fā)展速度也降下來了。
我們需要突破這三個瓶頸。
要讓新的計算體系和通訊架構(gòu)突破體系架構(gòu)的限制。深度學(xué)習(xí)需要新的架構(gòu),架構(gòu)包括數(shù)據(jù)流、計算模式。深度學(xué)習(xí)領(lǐng)域需要很多優(yōu)化,還有高速的儲存。這些東西和傳統(tǒng)的架構(gòu)不一樣。