李飛飛:語(yǔ)言之外,另一半的智能還有待實(shí)現(xiàn)
「語(yǔ)言是人類的語(yǔ)言,而 3D 是自然的語(yǔ)言。」
「除了語(yǔ)言,我們還有另外一半智能,這部分非常深刻,就是我們做事的能力。」
「在 AI 之間加一個(gè) G 以強(qiáng)調(diào)其通用性,我是尊重這個(gè)想法的。從制造能夠思考和幫助人們做出決策的機(jī)器的角度來(lái)看,AI 或 AGI 對(duì)我來(lái)說(shuō)是同樣的事情?!?/span>
「《龍貓》是我最喜歡的電影之一,這部電影雖然簡(jiǎn)單卻又如此深刻。」
最近,斯坦福大學(xué)教授李飛飛接受了硅谷著名投資人 Reid Hoffman 和 Aria Finger 的聯(lián)合播客專訪。
視頻鏈接:https://www.youtube.com/watch?v=0jMgskLxw3s
在這場(chǎng)對(duì)話中,李飛飛主要探討了以下主題:
ImageNet 的靈感源于難以避開(kāi)模型的過(guò)擬合問(wèn)題,李飛飛意識(shí)到與其苦心改進(jìn)模型,不如用數(shù)據(jù)驅(qū)動(dòng)。
探究智能的本質(zhì),李飛飛認(rèn)為智能分為說(shuō)話的能力和做事能力,與之對(duì)應(yīng)的是語(yǔ)言智能和空間智能,語(yǔ)言是人類的語(yǔ)言,而 3D 是自然的語(yǔ)言。而擁有空間智能的 AI,將做到人類從未做到的事:真正地打破物理世界和數(shù)字世界的界限。
在 AI 發(fā)展中,需要尊重一些源自「舊石器時(shí)代」的核心原則:首先是人類的主體能動(dòng)性,像「AI 將治愈癌癥」這類把 AI 置于主語(yǔ)的表述,容易忽視人是使用技術(shù)的主體;二是重視人類的基本需求,包括對(duì)健康、生產(chǎn)力和社會(huì)認(rèn)同的普遍追求。
對(duì)于人類和 AI 技術(shù)安全的關(guān)系,李飛飛認(rèn)為首先要考慮的是,我們應(yīng)該基于科學(xué),而不是科幻。對(duì)于 AI 治理,精力應(yīng)集中在應(yīng)用層面設(shè)置護(hù)欄上,也就是人類受到影響的地方,而不是阻止上游開(kāi)發(fā)。
李飛飛認(rèn)為只有當(dāng)擁有正面的生態(tài)系統(tǒng)時(shí),才會(huì)有正面的 AI 未來(lái),這需要服務(wù)于公眾福祉的公共部門參與。其分為兩種形式:一是推動(dòng)基礎(chǔ)研究和創(chuàng)新,從醫(yī)療到教育;二是人才,需要教育越來(lái)越多的年輕人和公眾了解這項(xiàng)技術(shù)。
以下為訪談內(nèi)容的文字記錄:
ImageNet 的起源:人們都只關(guān)注模型,而不關(guān)注數(shù)據(jù)
主持人:是什么給了你 ImageNet 的想法?
李飛飛:很難確定具體的某一刻,但這個(gè)想法主要形成于 2006 年左右。當(dāng)時(shí)我正在深入研究使用機(jī)器學(xué)習(xí)算法來(lái)理解圖像中的物體。無(wú)論我怎么研究,都無(wú)法避開(kāi)機(jī)器學(xué)習(xí)模型中過(guò)擬合這個(gè)數(shù)學(xué)概念。這種情況發(fā)生在模型復(fù)雜度與使用的數(shù)據(jù)不太匹配時(shí),特別是當(dāng)數(shù)據(jù)的復(fù)雜性和數(shù)量無(wú)法有效驅(qū)動(dòng)模型時(shí)。
當(dāng)然,并不是所有模型都是一樣的。我們現(xiàn)在知道神經(jīng)網(wǎng)絡(luò)模型具有更高的容量和表示能力。撇開(kāi)這些專業(yè)術(shù)語(yǔ)不談,數(shù)據(jù)和模型之間確實(shí)存在相互作用。但我發(fā)現(xiàn),人們都只關(guān)注模型,而不關(guān)注數(shù)據(jù)。這就是我產(chǎn)生洞見(jiàn)的時(shí)刻我們不能只關(guān)注模型,或者用錯(cuò)誤的方式看待問(wèn)題,我們需要關(guān)注數(shù)據(jù),用數(shù)據(jù)來(lái)驅(qū)動(dòng)模型。
當(dāng)時(shí)我剛到普林斯頓擔(dān)任教職,接觸到了一個(gè)叫 WordNet 的項(xiàng)目。雖然 WordNet 與計(jì)算機(jī)視覺(jué)無(wú)關(guān),但它提供了一種很好的組織世界概念的方式。我很喜歡這個(gè)名字,一件事接著一件事,ImageNet 就這樣誕生了。因?yàn)槲疑钚判枰髷?shù)據(jù)和視覺(jué)世界的多樣化表示,所以開(kāi)始了這個(gè)項(xiàng)目。
解鎖智能最重要的另一半:空間智能
主持人:從你 AI 職業(yè)生涯中期的 ImageNet 到現(xiàn)在的 World Labs,你能談?wù)?World Labs 的理念是什么?你們正在構(gòu)建什么?你正在建設(shè)的東西是我們要去哪里以及如何理解這一點(diǎn)的關(guān)鍵部分,無(wú)論是 World Labs 本身還是 AI 的趨勢(shì)。
李飛飛:是的,這是我們喜歡討論的話題技術(shù)將何去何從。在 ImageNet 之后,我一直在執(zhí)著地思考一個(gè)問(wèn)題:什么是智能?我們?nèi)绾巫寵C(jī)器產(chǎn)生智能?對(duì)我來(lái)說(shuō),這實(shí)際上可以歸結(jié)為兩個(gè)簡(jiǎn)單的方面。如果我們觀察人類智能:
第一個(gè)方面是我們說(shuō)話的能力 —— 我們使用語(yǔ)言交流作為工具來(lái)交談、組織知識(shí)和溝通。但還有另外一半智能,這部分非常深刻,就是我們做事的能力。比如煎蛋卷、去遠(yuǎn)足、與朋友相處并享受彼此的陪伴這些都遠(yuǎn)遠(yuǎn)超出了我們所說(shuō)的語(yǔ)言范疇。就像我們能夠舒適地坐在對(duì)方面前,拿著啤酒罐聊天,這些都是智能的一部分。
這部分智能實(shí)際上植根于我們理解我們所生活的 3D 世界的能力感知它,并將其轉(zhuǎn)化為一系列理解、推理和預(yù)測(cè),使我們能夠在其中行動(dòng)。在我看來(lái),這種能力被稱為空間智能,這是像人類這樣的智能生物所具有的基本能力,也就是處理 3D 空間的能力。
ImageNet 之所以誕生,是因?yàn)槲以趯で鬄?2D 圖像中的像素添加標(biāo)簽。對(duì)人類來(lái)說(shuō),2D 圖像是 3D 世界的投影。所以你可以看到,這只是理解我們所生活的更完整的視覺(jué)世界的一小步,但這一小步很關(guān)鍵。因?yàn)闊o(wú)論是對(duì)人類、動(dòng)物還是機(jī)器來(lái)說(shuō),理解和標(biāo)記這些圖像中的物體都是重要的第一步。
現(xiàn)在,過(guò)去了 15 年,我認(rèn)為我們已經(jīng)準(zhǔn)備好迎接一個(gè)更大的挑戰(zhàn)。這幾乎是一個(gè)本壘打式的追求 —— 解鎖智能最重要的另一半,也就是空間智能的問(wèn)題。讓空間智能特別有趣的是,它實(shí)際上有兩個(gè)方面:一個(gè)是物理的 3D 世界,另一個(gè)是數(shù)字的 3D 世界。我們以前從未真正能夠在兩者之間生活,但現(xiàn)在空間智能可以成為一種統(tǒng)一的技術(shù),既可以理解 3D 實(shí)體世界,也可以理解數(shù)字 3D 世界。
空間智能將如何改變物理世界和數(shù)字世界?
主持人:回想一下,如果回到 1880 年,馬車和未鋪砌的道路,那是一個(gè)完全不同的世界。但如果回到 1980 年,好吧,人們開(kāi)的車不同了,但他們住在相同的建筑里,仍然在開(kāi)車,現(xiàn)實(shí)世界的機(jī)制基本上是一樣的。你認(rèn)為這「另一半智能」會(huì)在未來(lái)幾十年改變這一點(diǎn)嗎?我們會(huì)看到實(shí)體世界發(fā)生像過(guò)去幾年數(shù)字世界那樣的巨大轉(zhuǎn)變嗎?
李飛飛:我認(rèn)為會(huì)的。我認(rèn)為現(xiàn)實(shí)和數(shù)字之間的界限將開(kāi)始模糊。舉個(gè)例子,我想象自己在高速公路上開(kāi)車,如果爆胎了,盡管我是個(gè)技術(shù)專家,我可能還是會(huì)遇到困難。但如果我能戴上眼鏡,或者只需要用手機(jī)對(duì)著爆胎的車,與潛在的應(yīng)用程序協(xié)作,通過(guò)視覺(jué)引導(dǎo)或?qū)υ捇騼烧叩慕Y(jié)合來(lái)指導(dǎo)我更換輪胎,這就是一個(gè)非常平凡的日常生活例子,真正打破了物理 3D 世界和數(shù)字 3D 世界的界限。這種技術(shù)賦能人類的景象,無(wú)論是更換輪胎還是進(jìn)行心臟手術(shù),對(duì)我來(lái)說(shuō)都非常令人興奮。
大語(yǔ)言模型和大世界模型有什么區(qū)別?
主持人:你說(shuō)你經(jīng)常使用大語(yǔ)言模型來(lái)學(xué)習(xí),我覺(jué)得這很鼓舞人心。我的孩子們總是說(shuō)「哦,我數(shù)學(xué)很好,不需要再學(xué)習(xí)了」,我可以告訴他們「看,李飛飛也在使用大語(yǔ)言模型學(xué)習(xí)」。我想你還有一些要說(shuō)的。在談到大世界模型與大語(yǔ)言模型時(shí),你如何向人們解釋這種區(qū)別?你認(rèn)為這在未來(lái)會(huì)如何發(fā)展?
李飛飛:從根本上說(shuō),就像我說(shuō)的,一個(gè)是關(guān)于說(shuō)話,另一個(gè)是關(guān)于看和做事。所以它們是非常不同的模態(tài)。大語(yǔ)言模型的基本單位是字母或詞,而在我們的世界模型中,基本單位是像素或體素。它們是非常不同的語(yǔ)言。我?guī)缀跤X(jué)得語(yǔ)言是人類的語(yǔ)言,而 3D 是自然的語(yǔ)言。我們真的想要達(dá)到這樣一個(gè)點(diǎn):AI 算法能讓人們與像素世界互動(dòng),無(wú)論是虛擬的還是物理的。
舊石器時(shí)代的情感、中世紀(jì)的制度以及技術(shù)的作用
主持人:你的回答讓我想起你引用過(guò)的社會(huì)生物學(xué)家愛(ài)德華?威爾遜的話:「我們有舊石器時(shí)代的情感,中世紀(jì)的制度,和神一樣的技術(shù),這非常危險(xiǎn)?!箍紤]到你剛才談到的關(guān)于推理、自然語(yǔ)言、人們的教育,你如何扭轉(zhuǎn)這種局面?在 AI 時(shí)代,人類面臨什么機(jī)遇?
李飛飛:我仍然相信這句話,正因如此,你和我還有我們的朋友才創(chuàng)立了以人為中心的 AI 研究所。如果要我反轉(zhuǎn)這個(gè)局面,我會(huì)反過(guò)來(lái)說(shuō)這句話:人類有能力創(chuàng)造上帝一樣的技術(shù),這樣我們就能改善我們的中世紀(jì)制度,超越我們舊石器時(shí)代的情感,或者將這些情感引導(dǎo)到創(chuàng)造力、生產(chǎn)力和善意上來(lái)。
在 AI 的發(fā)展中,尊重人的主體能動(dòng)性
主持人:在構(gòu)建技術(shù)以幫助我們實(shí)現(xiàn)抱負(fù)方面,你認(rèn)為關(guān)鍵是什么?是關(guān)注同理心?是以人為中心和互動(dòng)的共生關(guān)系?在讓技術(shù)和 AI 幫助我們實(shí)現(xiàn)更好的自我方面,你會(huì)把什么作為下一步?
李飛飛:我能理解為什么你同時(shí)主修人文科學(xué),你身上體現(xiàn)了哲學(xué)和技術(shù)的結(jié)合。我同意,而且你知道,我們之前幾乎把「舊石器時(shí)代」當(dāng)作負(fù)面詞使用,但它實(shí)際上不是負(fù)面詞,它是一個(gè)很中性的詞。人類的情感或者我們對(duì)自我的認(rèn)識(shí)深深植根于進(jìn)化,植根于我們的 DNA 中,我們無(wú)法改變這一點(diǎn)。世界之所以同時(shí)美麗又混亂,正是因?yàn)檫@個(gè)原因。
在思考技術(shù)與人類關(guān)系的未來(lái)時(shí),我認(rèn)為我們需要尊重這一點(diǎn)。我們需要尊重一些最基本的、真正的舊石器時(shí)代根源。技術(shù)發(fā)展需要尊重幾個(gè)方面,我們?cè)阶鹬剡@些,就會(huì)做得越好:
首先是尊重人類的主體能動(dòng)性。我認(rèn)為 AI 公共傳播中的一個(gè)問(wèn)題是,我們經(jīng)常把 AI 作為句子的主語(yǔ),好像我們?cè)趧儕Z人類的主體能動(dòng)性。比如說(shuō)「AI 將治愈癌癥」,我有時(shí)也會(huì)犯這個(gè)錯(cuò)誤,但事實(shí)是人類將使用 AI 來(lái)治愈癌癥,不是 AI 在治愈癌癥,也不是 AI 將解決核聚變問(wèn)題。事實(shí)是人類科學(xué)家和工程師將使用 AI 作為工具來(lái)解決核聚變。更危險(xiǎn)的說(shuō)法是「AI 將奪走你的工作」。我認(rèn)為我們真的需要認(rèn)識(shí)到,這項(xiàng)技術(shù)有更多機(jī)會(huì)創(chuàng)造機(jī)會(huì)和工作,賦能人類主體能動(dòng)性,這是我關(guān)心的一個(gè)非常重要的第一性原理。
第二個(gè)重要的第一性原理是尊重每個(gè)人:每個(gè)人都想健康,都想有生產(chǎn)力,都想成為受人尊重的社會(huì)成員。無(wú)論我們?nèi)绾伟l(fā)展或使用 AI,我們都不能忽視這一點(diǎn)。忽視這一點(diǎn)是危險(xiǎn)的,是適得其反的。我認(rèn)為僅這兩點(diǎn)就對(duì)指導(dǎo)我們開(kāi)發(fā)這項(xiàng)技術(shù)至關(guān)重要。
談?wù)撨@些深深植根于這樣一個(gè)信念:任何技術(shù)、任何創(chuàng)新的意義都在于對(duì)人類有益。這就是人類文明的軌跡每次我們創(chuàng)造一個(gè)工具,我們都想用這個(gè)工具來(lái)做好事。當(dāng)然,這是一把雙刃劍,我們可能會(huì)誤用工具,會(huì)有壞人使用工具。所以即使看到技術(shù)和工具的陰暗面,它也推動(dòng)我們更加努力地讓它變得更好,讓它更以人為本。這確實(shí)是以人為本 AI 研究所的基本原則。在斯坦福,你和我還有我們的朋友都將 AI 視為如此強(qiáng)大的工具,它是一個(gè)文明性的工具,我們最好盡早圍繞它建立一個(gè)框架,將人類和人類利益置于其中心。以人為中心的 AI 最關(guān)鍵的方面之一,也是我認(rèn)為應(yīng)該指導(dǎo)每個(gè)公司、每個(gè)開(kāi)發(fā)者的,就是賦能人們的理念。
AI 治理應(yīng)該集中在應(yīng)用層面,而不是阻止上游開(kāi)發(fā)
主持人:你在 AI 領(lǐng)域工作了這么長(zhǎng)時(shí)間,擔(dān)任過(guò)許多不同的職務(wù)。我感覺(jué)有些人現(xiàn)在才開(kāi)始了解 AI。你如何看待當(dāng)前的 AI 創(chuàng)新時(shí)刻,無(wú)論是就我們所處的位置,還是開(kāi)發(fā)者面臨的挑戰(zhàn)來(lái)說(shuō)?你認(rèn)為要達(dá)到解決這些問(wèn)題的下一個(gè)層次,我們需要做什么?
李飛飛:這確實(shí)是一個(gè)非凡的時(shí)刻。我認(rèn)為這絕對(duì)是一場(chǎng)革命的轉(zhuǎn)折點(diǎn),原因在于應(yīng)用 ——AI 現(xiàn)在可以被人們和企業(yè)日常使用,而且早期 AI 先驅(qū)在職業(yè)生涯早期階段設(shè)想的許多夢(mèng)想已經(jīng)實(shí)現(xiàn)或即將實(shí)現(xiàn)。比如,公眾熟知的圖靈測(cè)試基本上是一個(gè)已解決的問(wèn)題。圖靈測(cè)試本身我不會(huì)說(shuō)是智能的終極測(cè)試,但它曾是一個(gè)如此困難的標(biāo)準(zhǔn),是一個(gè)合理的衡量標(biāo)準(zhǔn),現(xiàn)在已經(jīng)解決了。再比如自動(dòng)駕駛汽車,雖然還沒(méi)有完全解決,但比 2006 年時(shí)已經(jīng)解決得多得多。
所以我認(rèn)為,因?yàn)檫@些模型的力量已經(jīng)產(chǎn)品化到人們和企業(yè)手中,這是 AI 革命的一個(gè)非凡階段。但我也清楚地意識(shí)到,我們生活在硅谷泡沫中,因?yàn)槲艺J(rèn)為整個(gè)全球人口仍在逐步了解 AI 的現(xiàn)狀,但我們確實(shí)看到了未來(lái)和未來(lái)的發(fā)展方向。
主持人:是的,AI 可能是一個(gè)巨型的人類能力放大器,可能帶來(lái)巨大的積極影響,但我們也確實(shí)需要擔(dān)心負(fù)面后果。我們需要引導(dǎo)它朝著正確的方向發(fā)展。從發(fā)展的視角來(lái)看,你認(rèn)為我們需要做什么來(lái)確保 AI 的發(fā)展是積極的?
李飛飛:說(shuō)實(shí)話,我認(rèn)為我們可以做很多事,我認(rèn)為我們應(yīng)該昨天就開(kāi)始做,現(xiàn)在還不晚,我們應(yīng)該真正致力于此。
第一件事是我認(rèn)為我們應(yīng)該基于科學(xué),而不是科幻。關(guān)于 AI 導(dǎo)致人類滅絕或 AI 帶來(lái)世界和平的說(shuō)法,都有太多炒作和言論,這兩種觀點(diǎn)都更像是科幻而不是科學(xué)。所以當(dāng)我們思考如何處理 AI 政策、AI 治理時(shí),基于數(shù)據(jù)、基于科學(xué)事實(shí)、基于科學(xué)方法是非常重要的。
其次,我真的相信,就像許多其他技術(shù)和工具一樣,我們應(yīng)該將治理精力集中在應(yīng)用層面設(shè)置護(hù)欄上,也就是人類受到影響的地方,而不是阻止上游開(kāi)發(fā)。想想汽車早期,它并不是很安全,沒(méi)有安全帶,一開(kāi)始甚至沒(méi)有車門,沒(méi)有速度限制等等。然后我們確實(shí)有了教訓(xùn),付出了人命的代價(jià),但發(fā)生的事情不是讓福特和通用汽車關(guān)閉工廠,而是為安全帶、速度限制等創(chuàng)建了監(jiān)管框架。
今天的 AI 類似,它是一個(gè)深具賦能性的技術(shù),但也帶來(lái)危害。所以我們應(yīng)該關(guān)注的是,當(dāng) AI 應(yīng)用于醫(yī)療時(shí),我們?nèi)绾胃?FDA 監(jiān)管措施;當(dāng) AI 應(yīng)用于金融時(shí),我們?nèi)绾卧O(shè)置監(jiān)管護(hù)欄。應(yīng)用是我們應(yīng)該集中治理精力的地方。
最后但同樣重要的是,我們需要理解,只有當(dāng)擁有正面的生態(tài)系統(tǒng)時(shí),才會(huì)有正面的 AI 未來(lái)。而這個(gè)生態(tài)系統(tǒng)需要私營(yíng)部門。我認(rèn)為私營(yíng)部門(無(wú)論是大公司還是創(chuàng)業(yè)企業(yè))很重要,但我們也需要公共部門。因?yàn)楣膊块T服務(wù)于公眾福祉(public goods)。
在我看來(lái),公共福祉有兩種形式:一種是那些由好奇心驅(qū)動(dòng)的創(chuàng)新和新知識(shí) —— 無(wú)論是使用 AI 研究核聚變,還是使用 AI 治愈疾病,使用 AI 賦能我們的教師。所有這些不同的想法,很多都來(lái)自公共部門。ImageNet 就來(lái)自公共部門。
另一種形式的公共福祉是人才,我們需要教育越來(lái)越多的年輕人和公眾了解這項(xiàng)技術(shù),公共部門在 K12 到高等教育方面承擔(dān)了社會(huì)教育責(zé)任的主要部分。這些是我非常關(guān)心的 AI 治理和政策的不同方面。
一些鼓舞人心的消息:有人在用 AI 評(píng)估農(nóng)村社區(qū)的水質(zhì)
主持人:我認(rèn)為你也應(yīng)該強(qiáng)調(diào)一下 AI for All,也就是要確保 AI 不是學(xué)術(shù)大佬們的專利,而是可以造福所有人。請(qǐng)談?wù)?AI for All 以及它的使命和貢獻(xiàn)是什么。
李飛飛:AI for All 是一個(gè)非營(yíng)利組織,我與我的前學(xué)生和同事共同創(chuàng)立,其使命是為來(lái)自不同背景的 K12 學(xué)生提供機(jī)會(huì),通過(guò)大學(xué)暑期項(xiàng)目和實(shí)習(xí)接觸 AI。這個(gè)想法是試圖實(shí)現(xiàn) AI 的公共教育福祉 —— 我們知道 AI 將改變世界,但誰(shuí)將改變 AI?我們希望更多樣化的群體能來(lái)受到啟發(fā),使用這項(xiàng)技術(shù),為各種偉大的事業(yè)開(kāi)發(fā)這項(xiàng)技術(shù)。
我們一直專注于女性和來(lái)自農(nóng)村、城市內(nèi)或其他歷史上代表性不足的社區(qū)和背景的學(xué)生,讓他們參與這些暑期項(xiàng)目??吹竭@些年輕人使用 AI 或?qū)W習(xí) AI,改進(jìn)救護(hù)車調(diào)度算法、使用 AI 評(píng)估農(nóng)村社區(qū)的水質(zhì),真是太鼓舞人心了!這個(gè)事情的規(guī)模依然很小,但我希望它能繼續(xù)發(fā)展,因?yàn)樽尭鄻踊娜藚⑴c到 AI 中來(lái)這個(gè)目標(biāo)非常重要。
AI 在革新醫(yī)療保健服務(wù)方面的潛力
主持人:你在醫(yī)療保健領(lǐng)域也做了研究。我覺(jué)得人們應(yīng)該更多關(guān)注 AI 如何提升醫(yī)療水平。能談?wù)勀阍谶@方面的工作和對(duì)未來(lái)的展望嗎?
李飛飛:是的,正如我在書(shū)中所寫(xiě),我對(duì) AI 在醫(yī)療領(lǐng)域的應(yīng)用充滿熱情。醫(yī)療保健是一個(gè)以人為本的領(lǐng)域,涵蓋從基礎(chǔ)生物科學(xué)、藥物研發(fā)、臨床診斷到公共衛(wèi)生等多個(gè)方面。令人振奮的是,AI 在這個(gè)體系的每個(gè)環(huán)節(jié)都能發(fā)揮重要作用。
我特別關(guān)注醫(yī)療服務(wù)這個(gè)領(lǐng)域,因?yàn)檫@里最能體現(xiàn)人與人之間的互助。目前我們面臨護(hù)士人力短缺的問(wèn)題,他們工作繁重,流失率高。數(shù)據(jù)顯示,護(hù)士每個(gè)班次要走四英里以上來(lái)取藥和設(shè)備,在一個(gè)班次中,護(hù)士可能要完成多達(dá) 150 至 180 個(gè)不同的任務(wù)。同時(shí),我們有病人從病床上摔下來(lái),因?yàn)樗麄內(nèi)狈ψ銐虻恼疹?。?duì)病情嚴(yán)重患者的分診存在很多問(wèn)題,更不用說(shuō)獨(dú)居老年人,面臨癡呆惡化等諸多風(fēng)險(xiǎn)。
過(guò)去十多年,我一直在研究如何用智能攝像頭技術(shù)幫助醫(yī)護(hù)人員。這種非接觸式的系統(tǒng)可以監(jiān)測(cè)病床上病人的動(dòng)作預(yù)防跌倒,追蹤居家老人的行為和生活狀況,甚至在手術(shù)室?guī)椭o(hù)士清點(diǎn)器械避免遺留體內(nèi)。我們將這種技術(shù)稱為 NBA 智能,目標(biāo)是協(xié)助醫(yī)護(hù)人員提供更優(yōu)質(zhì)的照護(hù)服務(wù)。
AGI 到底是什么意思?
主持人:現(xiàn)在 AGI 這個(gè)詞經(jīng)常被提到,我記得你可能在某處說(shuō)過(guò)你甚至不確定 AGI 是什么意思,因?yàn)轱@然很多人對(duì)它有自己的理解,就像是羅夏測(cè)試。請(qǐng)談?wù)劄槭裁磿?huì)有這樣的 AGI 討論,它應(yīng)該意味著什么,如何讓這個(gè)討論更理性,而不是一堆零散的呼喊 ——「它很棒」、「它很可怕」、「它會(huì)摧毀所有工作」、「它會(huì)幫助全人類」。
李飛飛:我知道,這既是一個(gè)最有趣但也令人沮喪的對(duì)話。我真的不知道 AGI 是什么意思。我想這個(gè)詞來(lái)自大約 10 年前,那時(shí)候 AI 剛開(kāi)始成熟,商業(yè)界對(duì)此開(kāi)始產(chǎn)生興趣。在 AI 之間加一個(gè) G 以強(qiáng)調(diào)其通用性,我是尊重這個(gè)想法的。比如,現(xiàn)在的自動(dòng)駕駛汽車就比僅能檢測(cè)樹(shù)木的相機(jī)要通用得多。這兩者之間的差異是真實(shí)存在的。
如果回溯歷史,回到 AI 的奠基者約翰?麥卡錫和馬文?明斯基,回到他們從 1956 年夏天開(kāi)始的夢(mèng)想和希望,你會(huì)發(fā)現(xiàn)這其實(shí)就是他們的夢(mèng)想 —— 制造能夠思考和幫助人們做出決策的機(jī)器。而我們想的是解決檢測(cè)樹(shù)木這種極其狹窄的 AI 任務(wù)。
AI 這個(gè)領(lǐng)域就是為了創(chuàng)造思考機(jī)器。所以從這個(gè)角度來(lái)看,我們分享著同樣的夢(mèng)想、同樣的科學(xué)好奇心、同樣的追求 —— 讓機(jī)器可以執(zhí)行極其智能的任務(wù)。
所以從這個(gè)角度來(lái)看,AI 或 AGI 對(duì)我來(lái)說(shuō)是同樣的事情。
人際互動(dòng)的價(jià)值:李飛飛與數(shù)學(xué)老師
主持人:我感覺(jué)最近的進(jìn)步正在讓我們更加接近這種 AI。我們可以通過(guò)日常對(duì)話讓 AI 完成各種不同的任務(wù)。也就說(shuō)所謂的智能體(Agent)。你認(rèn)為這個(gè)發(fā)展方向如何?在未來(lái)幾年里,智能體 AI 會(huì)像一些人說(shuō)的那樣改變一切嗎?
李飛飛:自然語(yǔ)言能幫助人們搜索、構(gòu)思、學(xué)習(xí),是非常強(qiáng)大的工具。我自己也會(huì)使用 LLM 來(lái)幫助理解某些概念、閱讀論文、探索我不知道的東西。最讓我興奮的是看到人們和孩子們將其用作提高自己學(xué)習(xí)的工具。
我確實(shí)想保持專注。保持人們的自我主動(dòng)性很重要,這就需要為他們提供學(xué)習(xí)和賦能的好工具。我認(rèn)為隨著工具愈漸強(qiáng)大,我們將看到越來(lái)越多的協(xié)作能力,允許人類使用這些工具更精確地做事。我會(huì)很高興看到這些發(fā)生。
主持人:我認(rèn)為這不僅很重要,而且也是正確的事情。但也有人會(huì)擔(dān)憂這些 AI 會(huì)取代人與人之間的互動(dòng),而我們知道社交很重要 —— 不管是對(duì)于教學(xué),還是對(duì)于社區(qū)和同理心。您在自己的書(shū)《我看到的世界》中講述了一個(gè)關(guān)于數(shù)學(xué)老師的故事,也涉及到了人際互動(dòng)的重要性。你能多分享一些這方面的見(jiàn)解嗎?
李飛飛:作為一個(gè)移民孩子,15 歲來(lái)到新澤西州,在不會(huì)說(shuō)英語(yǔ)的情況下進(jìn)入了一所公立高中。那是我旅程的開(kāi)始。我非常幸運(yùn),很快就遇到了一個(gè)數(shù)學(xué)老師,薩貝拉先生。他以那種真正尊重和無(wú)條件的支持對(duì)待我。他不僅是我的數(shù)學(xué)老師,而且在我作為新移民的艱難青少年時(shí)期成為了我的朋友。我們的友誼一直持續(xù)。
他教育我的方式并不是通過(guò)言語(yǔ)。他從來(lái)沒(méi)告訴我:飛飛,AI 要掌控世界了,聽(tīng)我的,去做以人為本的 AI(human-centered AI)。我想這個(gè)詞從來(lái)沒(méi)出現(xiàn)在我們的對(duì)話中。他是通過(guò)行動(dòng)告訴我:我們社會(huì)和生活的意義在于我們?yōu)楸舜怂龅姆e極的事情,以及我們持有的信仰和我們追求的信標(biāo)。通過(guò)他的行動(dòng),我開(kāi)始認(rèn)識(shí)到尊重和幫助他人是一件美好的事情,即使那是一個(gè)不會(huì)說(shuō)英語(yǔ)、不知道自己在新國(guó)家做什么的迷茫孩子。我認(rèn)為那種慷慨、善良和同情心是人類的核心。對(duì)我來(lái)說(shuō),從他那里學(xué)到的最重要的東西就是「以人為本」。
主持人:真是一個(gè)美好的故事。說(shuō)到這里,有什么電影、歌曲或書(shū)籍能讓你對(duì)未來(lái)充滿希望嗎?
李飛飛:《龍貓》是我最喜歡的電影之一??吹侥愕膭?dòng)作,仿佛已經(jīng)能聽(tīng)到《龍貓》的主題曲了。但是我唱得不好,我就不唱了。這部電影雖然簡(jiǎn)單卻又如此深刻。我還可以用陪孩子作為借口看這部電影,但說(shuō)實(shí)話,我才不是因?yàn)楹⒆酉矚g看呢!我就是喜歡看這部電影。
技術(shù)進(jìn)步帶來(lái)的紅利必須共享
主持人:那么飛飛,你希望人們更經(jīng)常問(wèn)你什么問(wèn)題呢?
李飛飛:我希望人們多問(wèn)我如何用 AI 來(lái)幫助人類。關(guān)于這個(gè)話題我可以聊上幾個(gè)小時(shí),談到這個(gè)我就能想到很多在斯坦福,或者遍布世界各地的優(yōu)秀同事都為這方面做貢獻(xiàn)。他們的具體研究我可能不太了解,但我很樂(lè)意通過(guò)他們的工作,來(lái)指明可供探索的方向。
主持人:沒(méi)錯(cuò)。現(xiàn)在有很多人在做令人驚嘆的事情,我們需要激勵(lì)更多的人同行。在你的行業(yè)之外,有沒(méi)有看到哪些讓人激動(dòng)的進(jìn)展呢?
李飛飛:人文學(xué)科對(duì)能源的關(guān)注讓我感到鼓舞。這好像再次證明,談?wù)撈渌掝},我的思維總會(huì)自然而然地回到 AI。就連 AI 的發(fā)展也面臨著能源這個(gè)非常現(xiàn)實(shí)的問(wèn)題,對(duì)吧?我認(rèn)為環(huán)境的變化,以及為全球關(guān)系實(shí)現(xiàn)能源民主化都非常關(guān)鍵。而且我們不能永遠(yuǎn)依賴化石燃料。因此,許多能源領(lǐng)域的進(jìn)展和全球性運(yùn)動(dòng)都令人興奮。
主持人:最后一個(gè)問(wèn)題,如果一切都對(duì)人類有利,你認(rèn)為未來(lái) 15 年會(huì)朝著怎樣的方式發(fā)展?實(shí)現(xiàn)那個(gè)目標(biāo)的第一步是什么?
李飛飛:我希望未來(lái) 15 年能看到全球知識(shí)、福祉和生產(chǎn)力的整體提升,尤其是實(shí)現(xiàn)共同繁榮。之所以特別強(qiáng)調(diào)「共同」二字,是因?yàn)樽鳛橐粋€(gè)技術(shù)樂(lè)觀主義者,我深信技術(shù)能幫助人類發(fā)現(xiàn)新知識(shí)、推動(dòng)創(chuàng)新、提升福祉。歷史一次又一次教會(huì)我們:技術(shù)進(jìn)步帶來(lái)的紅利必須共享,我們要讓這些技術(shù)福祉真正惠及每一個(gè)人。