李飛飛巴黎峰會開幕演講:AI正自我覺醒!馬克龍AI換臉現(xiàn)場「整活」
本周一,人工智能行動峰會正在巴黎舉行。
為了給這次的AI行動峰會造勢,法國總統(tǒng)馬克龍用上了人工智能生成的偽造視頻。
在社交媒體上發(fā)布的一段視頻中,馬克龍在他的偽造視頻下面回應(yīng)道:「做得好」。這些視頻在幾個月前就已經(jīng)開始在法國社交媒體上流傳。
馬克龍承認他的偽造視頻在一些社交媒體圈子中變得流行了起來。
「更是重要的是,借助人工智能,我們可以做一些非常重大的事情:改變醫(yī)療保健、能源及我們社會的生活」,這位47歲的總統(tǒng)說。
他補充道:「法國和歐洲必須處于這場革命的中心,以抓住每一個機會,并推廣我們的原則。」
馬克龍這次為了AI峰會真的是拼了!足以看出法國對AI的重視。
在這次峰會的開幕式上,斯坦福教授,人稱「AI教母」的李飛飛博士受邀發(fā)表開幕演講。
李飛飛從五億年前生命感知能力的進化講起,一路講到圖靈時代,為人們展現(xiàn)了AI發(fā)展的宏大歷史脈絡(luò)。
接著,李飛飛講到了今年非常熱門的「智能體」,與她目前的主要研究領(lǐng)域「空間智能」與「具身智能」。
同時,李飛飛也再次強調(diào)了她在多年探索中一以貫之的主張:「AI以人為本」(Human-Centered AI),展現(xiàn)了她在科學(xué)探索中濃郁的人文關(guān)懷。
從5億年前說起
李飛飛從五億年前那個連視覺的概念都還不存在的遙遠時代開始講起。
隨著時間的推移,簡單生物開始能夠感知周圍的世界,并做出反應(yīng)。最初,感知是被動的,只是讓光線進入,而這一過程很快變得更加豐富和主動。
神經(jīng)系統(tǒng)開始進化,視覺從「看」變成了「理解」,理解進而導(dǎo)致行動,而所有這一切最終催生了智慧,并永遠改變了地球上生命的本質(zhì)。
到了20世紀中葉,艾倫·圖靈,這位偉大的英國數(shù)學(xué)家,在計算機尚未真正誕生之前,就已經(jīng)在思考如何賦予機器可與人類比肩的認知能力。
「對我來說,他的寫作總是鼓勵人類大膽地想象思維機器」,李飛飛說,「正是這種好奇心和雄心,驅(qū)使了美國早期的計算機科學(xué)家們,他們不僅組織了第一個研究項目,探討思維機器的可能性,還創(chuàng)造了人工智能這一術(shù)語。」
在1956年那個炎熱的夏天,這群早期的計算機科學(xué)家們,在達特茅斯的人工智能夏季研討會上討論了這一問題,甚至提出兩個月內(nèi)就能解決大部分問題,從而揭開智慧的神秘面紗。
不得不說,現(xiàn)在看來他們可能有些過于樂觀,但不得不佩服他們的膽略。今天,距離這個「兩個月」的項目已經(jīng)過去了幾十年。
「但我們確實取得了一些實質(zhì)性的進展?!?/span>
算法、數(shù)據(jù)與算力
李飛飛表示,工智能一直以來都是一個跨學(xué)科、充滿活力的領(lǐng)域。
「我們今天所處的現(xiàn)代人工智能時代,正是三項極其重要但各具特色的技術(shù)和科學(xué)進展交匯的結(jié)果?!?,她說。
首先是感知算法的研究,研究生物如何感知世界,并逐漸形成數(shù)學(xué)模型,這些模型使我們能夠創(chuàng)造出更強大的機器。
繼艾倫·圖靈的假設(shè)之后,神經(jīng)生理學(xué)家們?yōu)槲覀兘沂玖艘曈X皮層的神經(jīng)處理結(jié)構(gòu),獲得了諾貝爾獎,并徹底改變了我們對視覺處理的理解。
與此同時,認知科學(xué)家們深入研究地我們的大腦,揭示了我們感知周圍世界的深度與復(fù)雜性。
科學(xué)的結(jié)論是,大腦與我們所處的環(huán)境是密不可分的,它是不斷在從環(huán)境中學(xué)習(xí)的。
「對我個人而言,作為在21世紀初成長起來的科學(xué)家,當(dāng)時感知算法幾乎是我所在領(lǐng)域的唯一關(guān)注點」,李飛飛表示。
而認知科學(xué)帶給她的啟示在于「規(guī)?!埂Q莼c發(fā)育能如此有效地塑造人類智慧,是因為它們能利用大量數(shù)據(jù)來驅(qū)動我們的學(xué)習(xí)。
李飛飛和她的合作者、學(xué)生們推測,同樣的規(guī)律也適用于機器,只不過這一次,數(shù)據(jù)來自現(xiàn)代數(shù)字設(shè)備和互聯(lián)網(wǎng),而不再是依靠生物感官。
由此李飛飛所在的實驗室發(fā)起了ImageNet項目——它是第一個針對人工智能的大規(guī)?;ヂ?lián)網(wǎng)訓(xùn)練與評測數(shù)據(jù)集。
他們提出了一個關(guān)鍵假設(shè):數(shù)據(jù)是讓神經(jīng)網(wǎng)絡(luò)等高容量算法真正「活起來」的關(guān)鍵。
這個理念讓神經(jīng)網(wǎng)絡(luò)煥發(fā)新生,開啟了利用海量數(shù)據(jù)來推動AI進步的全球趨勢,也成為如今所說的AI「規(guī)模定律」(scaling law)的一部分。
然而,所有這些成就都離不開強大的計算能力。
最初的里程碑包括馮·諾依曼(Von Neumann)在上世紀40年代提出的計算機體系結(jié)構(gòu)理論,它一直沿用至今,并在70年代初催生了第一批微處理器。
而令人感到有趣的是,正是電子游戲推動了硅芯片處理速度的突破。1990年代初,隨著游戲圖形需求的增加,圖形處理單元(GPU)在短短幾十年內(nèi)爆發(fā)式增長,這最終成了人工智能網(wǎng)絡(luò)算法能夠利用互聯(lián)網(wǎng)大數(shù)據(jù)的最后拼圖。
「如果你是游戲愛好者,那我們要感謝你?!?,李飛飛現(xiàn)場表示。
AI的飛躍
「接下來的發(fā)展就不僅僅是歷史,它是構(gòu)建未來的配方。」
2012年,李飛飛的實驗室在ImageNet挑戰(zhàn)賽上首次實現(xiàn)了這三種技術(shù)的結(jié)合——算法、數(shù)據(jù)和計算,規(guī)模足夠大到幾乎一夜之間改變了AI領(lǐng)域。
如今,十多年過去了,探索仍在繼續(xù),依然看不到盡頭。
毫無疑問,歷史學(xué)家今后一定會把這段時間稱作「真正的第一個AI時代」,李飛飛表示。
「從任何一個你能想到的指標(biāo)來看——無論是計算機專業(yè)中人工智能方向的學(xué)生人數(shù)、投資金額、新創(chuàng)企業(yè)數(shù)量,還是其他方面——AI都是一場在深度和廣度上不斷擴大的革命。」她說。
現(xiàn)在,大型語言模型把AI所依賴的三大要素——算法、數(shù)據(jù)和計算力——都推向了更極致的規(guī)模。它們采用了一種名為「Transformer」的新型模型架構(gòu),訓(xùn)練數(shù)據(jù)幾乎覆蓋了整個互聯(lián)網(wǎng),并在數(shù)量驚人的最新、最強大芯片上運行。
結(jié)果是,機器的能力比過去十年來的任何一次突破都更為迅猛。
現(xiàn)在我們幾乎將「AI可以用自然語言流暢地跟我們對話」視為理所當(dāng)然,AI能回答我們提出的幾乎任何領(lǐng)域的問題,甚至能夠生成各種復(fù)雜形式的內(nèi)容——從圖像、聲音、音樂到視頻,無所不包。
不僅如此,在一些難度極高、對人類來說具有挑戰(zhàn)性的任務(wù)上,AI的成績也像坐火箭一樣往上躥,幾乎呈現(xiàn)出垂直上升的趨勢。
從「被動感知」到「主動行動」
不僅能夠流暢使用語言,大型語言模型現(xiàn)在朝著更具「主動性」的方向發(fā)展——它們學(xué)會了將復(fù)雜任務(wù)分解成若干步驟,并逐步規(guī)劃如何實現(xiàn)目標(biāo)。
人們目前將具備這種能力的AI稱作「智能體」。
我們目前所討論的還大多停留在「語言智能」層面,但人類之所以為人,是因為我們擁有更全面、更完整的智能。
李飛飛表示,從「被動感知」到「主動行動」的新階段正在到來。
在李飛飛自己的研究領(lǐng)域——涉及攝像頭和機器人,她看到AI正逐漸具備「創(chuàng)造、理解、推理和交互」這些維度,進而在數(shù)字或物理的三維空間里與人和環(huán)境相互作用。
李飛飛稱其為「空間智能(spatial intelligence)」和「具身智能(embodied intelligence)」。
在現(xiàn)場,李飛飛舉了一個例子,假設(shè)你看到下面這樣一張圖片,視覺智能很容易讓我們識別出里面的所有物品:那只貓、那盆植物、那張桌子,以及那杯牛奶。
但是,這就代表我們感知系統(tǒng)的全部功能了嗎?
顯然會有不少人不僅僅「看懂了」那張圖,還會產(chǎn)生「哎呀,快伸手把那杯牛奶抓住,別讓它掉到地上打碎了!」這樣的沖動。這個小例子清楚展示了「從觀察到行動」之間有多么巨大的差別。
「這也說明了我認為我們?nèi)缃袼幍墓拯c:AI正從觀察者變成與我們并肩行動的執(zhí)行者。」李飛飛說。
如果AI真的不再只是「會思考的機器」,而是同時成為「會行動的機器」,那么我們整個社會在引導(dǎo)這項技術(shù)發(fā)展方向時,就承擔(dān)著更加緊迫而重大的責(zé)任。
「我認為毫不夸張地說,這一切正將我們帶到一個對整個人類文明至關(guān)重要的歷史關(guān)頭?!估铒w飛強調(diào),「我們要如何應(yīng)對?」
AI以人為本
李飛飛表示,有一個主線在她的多年探索中始終貫穿,那就是「以人為本的AI(Human-Centered AI)」,并且它包含三個核心價值:尊嚴(dignity)、能動性(agency)和社區(qū)(community)。
首先是尊嚴。當(dāng)面對越來越強大的技術(shù)時,我們?nèi)祟惓3此迹旱降资鞘裁丛诙x「我們是誰」?
如果把我們能做的所有事情都一一剝離,剩下的、那份能夠自主決策并親自行動的尊嚴感,依然是我們作為人的本質(zhì)之一。
李飛飛在現(xiàn)場舉了一個例子:如何讓機器人和AI技術(shù)幫助那些嚴重癱瘓患者重新獲得自主行動的可能。
在這項斯坦福大學(xué)的研究中,李飛飛的學(xué)生利用完全「非侵入式」腦電圖(EEG)記錄獲取使用者的思維信號,通過AI算法對這些信號進行解碼并發(fā)送指令給機械手臂。最終,機械手臂在患者「意念」的控制下做出包括烹制日式壽喜燒在內(nèi)的一整套烹飪動作。
這便是AI幫助人們重新贏得自主與尊嚴的一個示例。
其次是能動性(agency)。李飛飛表示,她所在實驗室多年來的核心理念就是探索如何讓AI「增強(augment)」人類的能力,而不是取代人類。
李飛飛相信AI可以幫助我們從創(chuàng)造力到醫(yī)療保健、從科研到制造業(yè),在方方面面獲得新的能力。
「因為在許多方面,AI的技能與人類的技能其實是互補關(guān)系。我們完全可以利用這個合作者來強化自身的能力?!?,她說
最后是社區(qū)(community)。過去十年里,科技也常常被詬病「把人們越拉越遠」,催生了各種「信息繭房」和「狂熱話題誘餌」等。
如今,AI又一次走到了十字路口:一條路是讓AI主導(dǎo)社交體驗,甚至為每個人定制內(nèi)容并強化他們的偏見;另一條路則幫助我們構(gòu)建更健康、更強大、更具有包容性的社區(qū),比如借助AI教育助手,讓更多人(包括孩子和成人)獲得學(xué)習(xí)的機會。
這里,李飛飛舉了兩個簡單案例:一個是利用AI和虛擬現(xiàn)實技術(shù),為有閱讀障礙的大學(xué)生提供個性化輔助工具;另一個是美國水牛城大學(xué)開發(fā)的一個AI專家系統(tǒng),用來緩解語言治療師(speech-language pathologist)短缺的問題,幫助對3至10歲兒童進行早期語言干預(yù)。
理性、務(wù)實與多方協(xié)作
最后,李飛飛談了一下對于AI治理問題的看法。
首先,她認為務(wù)必要基于科學(xué)而不是科幻來進行治理?!肝覀儜?yīng)該用更科學(xué)的方法來評估和測量AI的實際能力與局限,從而制定更加精準(zhǔn)、可落實的政策,并且基于現(xiàn)實而非幻想?!顾f。
其次,我們需要采取務(wù)實的態(tài)度來看待AI治理。
李飛飛認為,不應(yīng)該只顧在上游阻礙對這項仍然非常年輕的技術(shù)的進一步探索與研究;相反,應(yīng)該更多關(guān)注它的具體應(yīng)用場景,確保它能被善加利用,并對可能產(chǎn)生的不良后果加以防范。
最后,她說我們必須投入更多資源,構(gòu)建更健康、更蓬勃的AI生態(tài)系統(tǒng),讓學(xué)術(shù)界、創(chuàng)業(yè)者、開源社群以及公共部門都能與大企業(yè)一道參與進來、發(fā)揮關(guān)鍵作用。
如上面李飛飛所說,現(xiàn)代AI之所以興起,主要歸功于算法、數(shù)據(jù)和計算力這三大要素的結(jié)合,李飛飛擔(dān)憂地表示若這三種關(guān)鍵資源僅僅掌握在少數(shù)幾家公司手中,AI生態(tài)系統(tǒng)就會面臨好奇心驅(qū)動的研究乏力、頂尖教育人才受限、開源項目缺少資源、多學(xué)科交叉探索不足等諸多問題。
最后,李飛飛提出一種新的挑戰(zhàn):與其再問「我們能否創(chuàng)造AI」,不如問「我們能否創(chuàng)造一股向善的AI力量」。
「今天我想向各位發(fā)出邀請:讓我們共同努力,去構(gòu)建以人為本的AI?!顾詈笳f。