浙大吳飛“舌戰(zhàn)”阿里賈揚(yáng)清:AI內(nèi)卷與年薪百萬,哪個(gè)才是真實(shí)?
毫無疑問,人工智能又火了。
十四五規(guī)劃提出,把科技自立自強(qiáng)作為國(guó)家發(fā)展的戰(zhàn)略支撐,瞄準(zhǔn)人工智能、量子信息、生物醫(yī)藥等前沿領(lǐng)域,實(shí)施一批具有前瞻性、戰(zhàn)略性的國(guó)家重大科技項(xiàng)目。人工智能將引領(lǐng)新一輪的技術(shù)變革與數(shù)智化浪潮,與此同時(shí),外界對(duì)于人工智能的隱憂與質(zhì)疑也從未中斷。
哪一面,才是人工智能的真實(shí)?
為了推動(dòng)AI技術(shù)的應(yīng)用創(chuàng)新,促進(jìn)人工智能領(lǐng)域的學(xué)術(shù)交流、人才培養(yǎng),中國(guó)人工智能學(xué)會(huì)聯(lián)合杭州市余杭區(qū)政府發(fā)起首屆全球人工智能技術(shù)創(chuàng)新大賽,阿里云天池平臺(tái)為本次大賽提供平臺(tái)和算力支撐。
作為大賽的預(yù)熱節(jié)目,“AI青年說”近期邀請(qǐng)到浙江大學(xué)求是特聘教授、人工智能研究所所長(zhǎng)吳飛與阿里云計(jì)算平臺(tái)負(fù)責(zé)人賈揚(yáng)清,交流人工智能技術(shù)與應(yīng)用的發(fā)展趨勢(shì),更重要的是,聊聊“AI內(nèi)卷與年薪百萬,哪個(gè)才是真實(shí)?”
(以下為對(duì)話節(jié)選)
如何與人工智能結(jié)緣?
吳飛:我是2009年的時(shí)候開始對(duì)人工智能產(chǎn)生興趣,當(dāng)時(shí)我對(duì)自己的研究方向產(chǎn)生了深深的焦慮,覺得自己當(dāng)時(shí)研究所寫的東西“面目可憎,言語無味”。這個(gè)時(shí)候,我得到去美國(guó)加州大學(xué)伯克利分校統(tǒng)計(jì)系郁彬教授課題組做訪問學(xué)者的機(jī)會(huì),深入學(xué)習(xí)很多有關(guān)機(jī)器學(xué)習(xí)模型理論和算法的知識(shí)。
原來在冰冷的機(jī)器后面,有這么多深?yuàn)W的模型、算法和這么新鮮的理論來支持。一年之后,我回到浙大,從此走上了人工智能的學(xué)術(shù)道路。
賈揚(yáng)清:我最開始是學(xué)習(xí)自動(dòng)化的。以前,我們開玩笑說,自動(dòng)化主要做兩件事情,一個(gè)是燒鍋爐的,一個(gè)是開電梯的。
后來在研究生期間,我就對(duì)于人工智能和統(tǒng)計(jì)機(jī)器學(xué)習(xí)產(chǎn)生了更多的興趣,當(dāng)時(shí)人工智能并沒有那么熱,有一句流行的話,“人工智能是在80%的時(shí)間里,以80%的正確率,解決80%的問題。”但是我們也不知道,那80%的時(shí)間解決了哪些80%的問題,大家一直處于相對(duì)低谷的狀態(tài)。
2006年的時(shí)候, Geoffrey Hinton在《Science》發(fā)表了一篇講受限玻爾茲曼機(jī)(restricted Boltzmann machine)的文章,我開始對(duì)人工神經(jīng)網(wǎng)絡(luò)等基礎(chǔ)理論以及大規(guī)模訓(xùn)練產(chǎn)生興趣。我是2009年去了加州大學(xué)伯克利分校,也有幸跟吳老師在伯克利相處了一年多的時(shí)間。
攻讀博士期間,我們發(fā)現(xiàn)神經(jīng)網(wǎng)絡(luò)、深度學(xué)習(xí)的方法變得越來越重要,我們最開始從稀疏編碼(Sparse Coding)等方面入手,構(gòu)建一系列的軟件棧以及相應(yīng)的科學(xué)研究,來把基于深度學(xué)習(xí)的算法做得越來越好。
2012年,AlexNet的出現(xiàn)讓全世界都突然意識(shí)到深度學(xué)習(xí)的重要,在此之前,2010年左右,在語音領(lǐng)域RNN等方法已經(jīng)開始被應(yīng)用起來。當(dāng)時(shí)我發(fā)現(xiàn)大家都在紛紛涌向深度學(xué)習(xí)算法,相應(yīng)的軟件工具平臺(tái)卻比較匱乏的,所以我們?cè)诓死烷_始做Caffe以及后來一系列的深度學(xué)習(xí)框架。
在接下來的幾年,我們見證了深度學(xué)習(xí)算法的大規(guī)模應(yīng)用,無論是算法創(chuàng)新方面,還是方法的落地方面,都開始有了非常大的市場(chǎng)。
無論是阿里的城市大腦算法,還是達(dá)摩院的很多新型算法模型,很榮幸我的研究能夠成為一個(gè)底座,支持大家在AI技術(shù)及應(yīng)用上有進(jìn)一步的創(chuàng)新和發(fā)展。
十四五規(guī)劃把人工智能列為前沿科技領(lǐng)域的“最高優(yōu)先級(jí)”。這對(duì)人工智能專業(yè)而言,意味著什么?
吳飛:2017年,國(guó)務(wù)院公布了中國(guó)新一代人工智能發(fā)展規(guī)劃,規(guī)劃明確指出:人工智能是引領(lǐng)未來的戰(zhàn)略性技術(shù),必將推動(dòng)人類社會(huì)和生活模式以及學(xué)習(xí)方式的巨大改變。
我想對(duì)年輕人而言,人工智能就意味著未來,因?yàn)樗旧硎且粋€(gè)使能技術(shù),不斷推動(dòng)著社會(huì)的快速前進(jìn)。規(guī)劃還指出,高校要設(shè)置人工智能本科專業(yè)。2018年,教育部批準(zhǔn)了35所高校設(shè)置人工智能本科專業(yè)。到現(xiàn)在為止,全國(guó)一共有345所高校設(shè)置了人工智能本科專業(yè)。
圖靈在1949年談及圖靈機(jī)時(shí)表示,“(圖靈機(jī)模型的提出)這不過是將來之事的前奏,也是將來之事的影子。”
因此,對(duì)年輕人而言,無論是基礎(chǔ)研究、關(guān)鍵核心技術(shù)的突破,還是賦能場(chǎng)景的實(shí)現(xiàn),人工智能已經(jīng)悄然地走進(jìn)社會(huì),像水和電一樣的不斷賦能社會(huì)的發(fā)展。
未來AI有哪些值得關(guān)注的趨勢(shì)?
賈揚(yáng)清:在2012年以前,要做一個(gè)計(jì)算機(jī)視覺的識(shí)別系統(tǒng),基本上就要去讀一個(gè)博士,才能做出來,而且效果還不一定好。今天我們發(fā)現(xiàn),從0到1的積累差不多已經(jīng)完成了,或者說已經(jīng)比較成熟。算法的標(biāo)準(zhǔn)化和應(yīng)用化會(huì)變成趨勢(shì)。
今天如果我想做一個(gè)無人駕駛的demo,就并不需要去學(xué)計(jì)算機(jī)視覺的博士。因?yàn)榻裉煊蟹浅6嚅_源的模型,讓我們能夠非常迅速地把算法能力給補(bǔ)齊。算法的標(biāo)準(zhǔn)化、工程化,以及怎樣迅速地把標(biāo)準(zhǔn)算法和特定的業(yè)務(wù)場(chǎng)景結(jié)合起來,是我們今天在計(jì)算機(jī)視覺、語音、自然語言理解等領(lǐng)域的大趨勢(shì)。
當(dāng)然科研還在繼續(xù)往前走,我們?cè)趯ふ倚碌母呔夥较?。但同時(shí)我認(rèn)為,怎樣把現(xiàn)有結(jié)果大規(guī)模應(yīng)用到不同場(chǎng)景中去,是一個(gè)非常大的趨勢(shì)。
另外,我們會(huì)發(fā)現(xiàn),以前單純的垂直場(chǎng)景,比如像計(jì)算機(jī)視覺、語音、自然語言處理等已經(jīng)開始逐漸融合,變得共通,這就需要用到大規(guī)模、多模態(tài)模型。如我們所見,谷歌、OpenAI、DeepMind等公司都在這方面做出非常多的探索。
前段時(shí)間OpenAI推出GPT-3模型,這帶來的啟發(fā)是:我們需要有一個(gè)通用、多模態(tài)的模型,來統(tǒng)一理解各種形態(tài)的數(shù)據(jù)和各種形態(tài)的輸入。
我覺得這代表了另外一個(gè)趨勢(shì)。一方面是現(xiàn)有結(jié)果的工程化和規(guī)?;硪环矫媸歉髯宇I(lǐng)域之間的相互貫通,以及做到更加深入、更加本質(zhì)的理解。
吳飛:我補(bǔ)充一下,有兩個(gè)方向的趨勢(shì)值得關(guān)注。
第一個(gè)是從0到1,按照朱松純教授的說法,現(xiàn)在的機(jī)器智能是“大數(shù)據(jù)小任務(wù)”,比如GPT-3有1750億的參數(shù),并且使用上千GB的訓(xùn)練數(shù)據(jù)把它訓(xùn)練出來。但如何讓人工智能或機(jī)器智能具有人腦小樣本學(xué)習(xí)的能力、動(dòng)物的直覺能力以及舉一反三的能力,這是我們面臨的巨大挑戰(zhàn)。
第二個(gè)我覺得是從1到N,人工智能已經(jīng)是一門使能技術(shù)。就像我們徐匡迪院士所言,“人工智能需要數(shù)學(xué)家參與進(jìn)來。”
人工智能取得突破性的領(lǐng)域方向,一定是從腦科學(xué)、材料學(xué)等領(lǐng)域得到了啟發(fā),所以AI接下來的突破,一定是基于大數(shù)據(jù)、多學(xué)科交叉下的領(lǐng)域突破。
賈揚(yáng)清:我也補(bǔ)充一點(diǎn)。今天的人工智能系統(tǒng),特別是在感知領(lǐng)域,無論是計(jì)算機(jī)視覺還是語音,都存在一種“一攬子買賣”的狀態(tài)。例如有一個(gè)輸入和一個(gè)輸出,標(biāo)注是人或者車,這就是一個(gè)所謂的“one shot”過程,目標(biāo)集有時(shí)是手工指定的。
怎樣從單點(diǎn)的目標(biāo)或者單點(diǎn)的預(yù)測(cè)(prediction)到更加完整的知識(shí)體系,即所謂的大知識(shí)。正如吳老師剛提到的“大數(shù)據(jù)小任務(wù)”,“大數(shù)據(jù)大知識(shí)”是我們今天需要打通的一件事情:在簡(jiǎn)單標(biāo)簽的基礎(chǔ)上再構(gòu)建一個(gè)知識(shí)體系,無論是邏輯關(guān)系還是其他關(guān)系。
傳統(tǒng)的專家系統(tǒng),更多的是通過人工手寫的方式來做的,很難規(guī)?;?。傳統(tǒng)的機(jī)器學(xué)習(xí)方法還是小任務(wù)單點(diǎn)預(yù)測(cè)的狀態(tài)。怎樣能夠讓機(jī)器學(xué)習(xí)系統(tǒng)更加自動(dòng)、規(guī)?;厣山Y(jié)構(gòu)化的知識(shí)和結(jié)構(gòu)化的體系,我覺得,在接下來幾年,這方面可能產(chǎn)生最大的突破,或者至少是需求最大的方面。
同時(shí)它也引出了另外一點(diǎn),就是吳老師剛才提到的:人工智能怎樣賦能行業(yè),例如制藥業(yè)的數(shù)據(jù)是非常少的,對(duì)于邏輯推理和知識(shí)抽象的要求非常高。因?yàn)樗鼪]有辦法像圖像識(shí)別一樣能使用幾百萬張圖片作為數(shù)據(jù)。
簡(jiǎn)而言之,未來有兩個(gè)趨勢(shì):一個(gè)是從大數(shù)據(jù)到大知識(shí),另一個(gè)是怎樣通過抽象出來的知識(shí)體系,來賦能其他領(lǐng)域,以更好地使用AI技術(shù)。
人工智能目前存在的障礙與問題
吳飛:發(fā)展人工智能一定要有豐沃的土壤,也就是人工智能發(fā)展的生態(tài)。今天要支撐起中國(guó)人工智能的發(fā)展,一定要依靠底層的算力、底層的軟硬件以及中間算法和上層的應(yīng)用軟件。從底到高支撐起中國(guó)人工智能的發(fā)展,就是它的技術(shù)生態(tài)。
可能是之前我們忙于搞模型、搞算法、搞應(yīng)用。而現(xiàn)在已經(jīng)到了一個(gè)關(guān)口,需要阿里巴巴等企業(yè)的投入,需要浙江大學(xué)、清華大學(xué)、北京大學(xué)等高校的投入,需要政府的關(guān)切以及各行各業(yè)人才的投入,同頻共振、相向而行,建設(shè)一個(gè)良好的生態(tài)。
賈揚(yáng)清:今天談?wù)摰梅浅2蛔愕囊稽c(diǎn)是,怎樣讓所有人都能用到人工智能的技術(shù)。
此前我們更關(guān)注的是怎樣發(fā)展高精尖的技術(shù)??v觀歷史,我們說人工智能是通用化的技術(shù),或者我們相信未來它將是技術(shù)發(fā)展的核心點(diǎn),這就需要讓所有人都能更容易地接觸到人工智能。
幾十年前,英語專業(yè)有一個(gè)專門的職業(yè)叫翻譯,而在國(guó)際化的影響下,如今很多人自身就能掌握中英雙語。我們以前說:“計(jì)算機(jī)要從娃娃抓起。”而今天我們幾乎每個(gè)人都有使用計(jì)算機(jī)或操作計(jì)算機(jī)的能力,無論是電腦還是手機(jī)。只有達(dá)到這種普惠程度的時(shí)候,我們才能夠把一個(gè)技術(shù)稱為通用的、普惠的技術(shù)。
今天人們要觸達(dá)AI技術(shù)還是相對(duì)困難的。無論是在硬件上(搭一個(gè)帶有GPU的機(jī)器),還是在軟件上(安裝一套人工智能框架以及底層數(shù)據(jù)的軟件等),都還比較困難。
設(shè)想一下,如果任何一個(gè)懂電腦的人都可以在5秒鐘之內(nèi)開始嘗試寫AI算法的代碼,并且很快能識(shí)別一張圖像的內(nèi)容。他也許并不懂底層的技術(shù)是怎樣實(shí)現(xiàn)的,但創(chuàng)造性的火花很容易就此迸發(fā)。
高精尖的技術(shù)往往是比較抓眼球,容易被大家接受。而從長(zhǎng)遠(yuǎn)角度看,這種潛移默化的普惠化、潤(rùn)物細(xì)無聲的過程會(huì)收獲更好的效果。
讀博對(duì)于人工智能意味著什么?
賈揚(yáng)清:學(xué)習(xí)人工智能與是否讀博的關(guān)系并不是很大,每一個(gè)行業(yè)都會(huì)對(duì)博士有特別定義。在AI領(lǐng)域有非常多優(yōu)秀的本科生和碩士生,他們并不比博士的能力差。
從個(gè)人經(jīng)歷來看,我的博士生涯教會(huì)我的最重要一點(diǎn)不是“怎樣做一件事情”,而是讓我更多地思考“我們應(yīng)該解決什么樣的問題”。
博士更多的是要定義問題,需要從特別復(fù)雜的場(chǎng)景中抽象出要解決的問題的定義。然后第二位的才是「怎樣解決這個(gè)問題」,這是博士生涯對(duì)我?guī)椭畲蟮囊稽c(diǎn)。
從培養(yǎng)的角度講,如果大家希望培養(yǎng)一下自己定義問題的能力,我覺得博士還是很值得讀的。5年的時(shí)間不長(zhǎng)也不短,但能力的提升是終身獲益的事。
吳飛:我完全同意揚(yáng)清的觀點(diǎn)。讀博的問題要辯證看待。如果同學(xué)們渴望充電,有渴望學(xué)習(xí)的饑餓感,通過職業(yè)培訓(xùn)或者通過工作環(huán)境中的積累無法解決,那就去讀博士。并且讀博期間一定要注意,學(xué)習(xí)目的不只是獲得文憑,也不只是發(fā)表文章,而是為了培養(yǎng)能力。
剛才揚(yáng)清也講了,這是一個(gè)終身的事情,人們常說讀完博士之后,他能不能發(fā)展好要再看5年,5年之后如果繼續(xù)往前發(fā)展,就說明他已經(jīng)走上了人生不斷向前發(fā)展的軌道。
排除疫情的因素,出國(guó)深造還有沒有必要?
賈揚(yáng)清:這個(gè)問題沒有非黑即白的答案。首先,現(xiàn)在國(guó)際交流越來越多,線上會(huì)議只有時(shí)差問題,就像看世界杯一樣,出國(guó)可能沒有10年前或20年前那么必要了。
另一方面,我一直相信不同文化、不同思想的融會(huì)貫通是創(chuàng)造新的思想和方法的豐沃土壤。如果有機(jī)會(huì)的話,我也建議大家出國(guó)去看一看,無論是參加一個(gè)學(xué)術(shù)會(huì)議,還是訪學(xué)計(jì)劃,或者投資更長(zhǎng)的時(shí)間去讀博。更加重要的是,從自己出發(fā),打開心扉,去了解不同的文化與技術(shù)氛圍。
吳飛:我是2009年10月份從北京首都機(jī)場(chǎng)出發(fā),飛往美國(guó)舊金山。當(dāng)時(shí)我已經(jīng)36歲了,那是我第一次出國(guó)。在伯克利的時(shí)光,我基本是兩點(diǎn)一線,從宿舍到伯克利的實(shí)驗(yàn)室。一年到頭,我只有春節(jié)期間休息了幾天,記得除夕約了揚(yáng)清吃了頓餃子,那也是我沒去實(shí)驗(yàn)室的僅有的一兩天。
很多人都有出國(guó)的經(jīng)歷,但并不是所有出國(guó)的人都抓住了機(jī)會(huì),也并不是每個(gè)人都能完成自己的志向。在美國(guó)高水平的大學(xué)里,如果能夠把自己全部的精力都用于學(xué)習(xí),是非常好的人生體驗(yàn)。
從伯克利回來之后,我的大腦里面會(huì)經(jīng)常浮想起美國(guó)西海岸蔚藍(lán)的天空以及宿舍夜里火車經(jīng)過的鳴笛聲。這不是在回憶美國(guó)的生活,而是在回憶當(dāng)時(shí)的奮斗。
AI內(nèi)卷與年薪百萬,哪個(gè)才是真實(shí)?
賈揚(yáng)清:內(nèi)卷是一個(gè)很有意思的概念,包括大家逛知乎??吹揭粋€(gè)詞語,叫調(diào)參俠。
在AI領(lǐng)域,有很多創(chuàng)新的事情可以做。內(nèi)卷與否,是我們自己內(nèi)心的表現(xiàn)。如果覺得自己做不出新的東西,只能調(diào)調(diào)參數(shù),做一些增量工作,這肯定是內(nèi)卷的。
容易的地方就會(huì)內(nèi)卷的,難的領(lǐng)域往往會(huì)有突破。
應(yīng)該給自己更多的信心與勇氣。AI已經(jīng)是個(gè)日新月異的領(lǐng)域了,廣泛應(yīng)用到互聯(lián)網(wǎng)、交通、電力、航空等領(lǐng)域,每年都有新的突破,何不去做創(chuàng)新呢。
吳飛:揚(yáng)清有意避開了“年薪百萬不是夢(mèng)”,但對(duì)高校老師而言“年薪百萬就是夢(mèng)”。教師的工資明顯沒有學(xué)生高,這是人工智能領(lǐng)域的實(shí)際情況。我們培養(yǎng)了很多的學(xué)生,現(xiàn)在已是年薪百萬。這說明人工智能專業(yè)的職業(yè)發(fā)展前景非常好。
未來的發(fā)展趨勢(shì)不會(huì)改變,整個(gè)國(guó)家把人工智能作為一種戰(zhàn)略性技術(shù)進(jìn)行發(fā)展的大方針不變,各行各業(yè)都會(huì)對(duì)人工智能有極大熱情。
為什么會(huì)內(nèi)卷,是因?yàn)榇蠹叶寂艿揭粭l賽道上去了,比如都擠到“大數(shù)據(jù)小任務(wù)”的賽道,變成了所謂的“調(diào)參俠”。于是沒人做農(nóng)業(yè)、司法、環(huán)境等更具開創(chuàng)性的場(chǎng)景應(yīng)用,就發(fā)生了內(nèi)卷。
想象一下,你讀完人工智能的博士或者研究生,如果進(jìn)入一個(gè)稀缺人工智能的行業(yè),那么你就是這個(gè)行業(yè)的AI之王,哪里會(huì)有內(nèi)卷。
賈揚(yáng)清:我也順便談下“年薪百萬”這個(gè)事。像我今天早餐是自己做的,午飯是在食堂解決的,平時(shí)真的花不了多少。其實(shí)真讓自己開心的事并不是年薪百萬,而是我們做的東西有人用,大家都喜歡。我特別崇敬吳老師這些學(xué)校里面的老師。第一,他們?cè)谔剿髑把匮芯?;第二,他們?cè)谂囵B(yǎng)AI以及各個(gè)技術(shù)領(lǐng)域的人才。
全球人工智能技術(shù)創(chuàng)新大賽,對(duì)學(xué)界與業(yè)界的意義
吳飛:中國(guó)人工智能學(xué)會(huì)從為國(guó)家培養(yǎng)人才的角度來舉辦大賽,賽題也來自于產(chǎn)業(yè)界的需求,這非常好。人工智能最貴重的一點(diǎn)就是貴其能用,賦能社會(huì),每個(gè)賽題都來自產(chǎn)業(yè)的需求。
同學(xué)們用在高校學(xué)習(xí)得到的知識(shí)和技術(shù),來解決產(chǎn)業(yè)的問題,就打破了學(xué)科的壁壘,達(dá)到產(chǎn)教融合的效果。同學(xué)借此了解到業(yè)界解決問題的一些方法與思路,相信以后回到高校,可以更高屋建瓴地看待學(xué)習(xí)的內(nèi)容。
所以全球人工智能技術(shù)創(chuàng)新大賽是高等學(xué)校和產(chǎn)業(yè)界攜手,面向人工智能應(yīng)用進(jìn)行人才培養(yǎng)的好方式。
賈揚(yáng)清:競(jìng)賽一直是推動(dòng)創(chuàng)新的好機(jī)制,以前在讀書的時(shí)候有挑戰(zhàn)杯這樣的比賽,這對(duì)我們?cè)谡n程之外嘗試一些新的東西是非常有用的。比如Facebook等公司也有黑客馬拉松的機(jī)制,某程度上可以讓大家跳出本職工作,嘗試新的點(diǎn)子,產(chǎn)出新的技術(shù)或者產(chǎn)品。
借著吳老師剛才說的“隨心所欲,隨遇而安”,我覺得這個(gè)比賽大家可以“生死看淡,不服就干”。相信大家都能夠從比賽中體會(huì)到快樂,收獲到知識(shí)。