NeurIPS神仙打架:李飛飛180頁PPT談視覺智能,Bengio同OpenAI員工吵架,何愷明談AI宿命論
李飛飛最新采訪來了,繼續(xù)延伸她在NeurIPS有關(guān)視覺智能的話題。
她表示,解決空間智能問題是邁向全面智能化的基礎(chǔ)和關(guān)鍵一步。
不過從現(xiàn)場傳出的NeurIPS演講PPT中竟然有寫:AI將取代人類?!
這究竟是怎么一回事?!
有網(wǎng)友表示,當(dāng)她看到這頁時,她的表情be like:
有一說一,今年NeurIPS好不熱鬧,大佬們聚在一起,就是容易制造各種話題(Doge)。
比如,疑似Bengio和OpenAI o1的人吵起來了。
何愷明竟然探討起了AI宿命論???
來來來,來看看一個吃瓜匯總。
李飛飛180頁PPT談視覺智能
今年李飛飛在NeurIPS演講的話題是《從看到到做:攀登視覺智能的階梯》。
她自曝準(zhǔn)備了180頁ppt,從各種路透圖來看,確實是干貨滿滿。
而在最新IEEE Spectrum采訪中,她進(jìn)一步揭示了相關(guān)細(xì)節(jié)。(該采訪是在NeurIPS演講前進(jìn)行)
采訪實錄:
Q:為什么演講題目是“攀登視覺智能的階梯(Ascending the Ladder of Visual Intelligence)”?
李飛飛:我認(rèn)為,直覺告訴我們,智能具有不同的復(fù)雜度和精密度。在演講中,我想傳達(dá)這樣一種感覺:在過去的幾十年里,尤其是過去十多年的深度學(xué)習(xí)革命中,我們在視覺智能方面所取得的成就令人驚嘆。我們越來越擅長使用這項技術(shù)。我還受到了 Judea Pearl 的“因果關(guān)系階梯”的啟發(fā)。(收錄于2020年出版的《the Book of Why》)
(這里插一嘴,Judea Pearl本人還特意糾正了一下,他表示因果關(guān)系階梯所定義的等級是第一定律的數(shù)學(xué)結(jié)果,而不是一種判斷性的建構(gòu)。)
李飛飛:演講還有一個副標(biāo)題,即“從看到到做(From Seeing to Doing)”。這是人們沒有足夠重視的一點:“看 ”都與互動和 “做 ”密切相關(guān),無論是對于動物,還是AI Agents來說都是如此。這與語言是不同的。語言從根本上說是一種交流工具,用來傳遞思想。在我看來,這些都是非?;パa(bǔ)但同樣深刻的智能模式。
Q:你的意思是說,我們會對某些景象做出本能的反應(yīng)?
李飛飛:我說的不僅僅是本能。如果你看一下感知力的進(jìn)化和動物智力的進(jìn)化,就會發(fā)現(xiàn)這兩者之間有著深刻的聯(lián)系。每當(dāng)我們能夠從環(huán)境中獲得更多信息時,進(jìn)化的力量就會推動能力和智力的發(fā)展。如果你不能感知環(huán)境,你與世界的關(guān)系就會非常被動;你是吃還是被吃,都是非常被動的行為。但是,一旦你能夠通過感知從環(huán)境中獲取線索,進(jìn)化的壓力就會真正增強(qiáng),從而推動智力向前發(fā)展。
Q:你認(rèn)為這就是我們創(chuàng)造更深入的機(jī)器智能的方式嗎?讓機(jī)器感知更多的環(huán)境?
李飛飛:我不知道 “深度 ”是不是我想用的形容詞。我認(rèn)為我們正在創(chuàng)造更多的能力。我認(rèn)為它正變得越來越復(fù)雜,越來越有能力。我認(rèn)為,解決空間智能問題是邁向全面智能化的基礎(chǔ)和關(guān)鍵一步,這是絕對正確的。
Q:我看過世界實驗室的演示。你為什么要研究空間智能并構(gòu)建這些三維世界?
李飛飛:我認(rèn)為空間智能是視覺智能的發(fā)展方向。如果我們真的要破解視覺問題,并將其與做事聯(lián)系起來,那么有一個極其簡單、一目了然的事實:世界是三維的。我們生活的世界不是平面的。我們的物理Agent,無論是機(jī)器人還是設(shè)備,都將生活在三維世界中。就連虛擬世界也變得越來越3D化。如果你與藝術(shù)家、游戲開發(fā)者、設(shè)計師、建筑師、醫(yī)生交談,即使他們是在虛擬世界中工作,其中大部分也是三維的。如果你能花點時間認(rèn)識到這個簡單而深刻的事實,那么毫無疑問,解決3D智能問題就是根本所在。
一旦你尊重了世界的三維性,很多事情就自然而然地發(fā)生了。例如,在我們發(fā)布在社交媒體上的一個視頻中,籃球被投放到一個場景中。因為它是三維的,所以你可以擁有這種能力。如果場景只是 2D 生成的像素,籃球?qū)o處可去。
Q:或者,就像Sora中那樣,它可能會去到某個地方,但隨后就消失了。在你嘗試推進(jìn)這項技術(shù)的過程中,最大的技術(shù)挑戰(zhàn)是什么?
李飛飛:沒有人解決過這個問題,對吧?這非常非常難。在世界實驗室的演示視頻中,你可以看到我們將一幅梵高的畫作,以一致的風(fēng)格生成了它周圍的整個場景:藝術(shù)風(fēng)格、燈光,甚至是那個社區(qū)會有什么樣的建筑。如果你轉(zhuǎn)過身去,它就變成了摩天大樓,那就完全沒有說服力了,對嗎?它必須是 3D 的。你必須進(jìn)入其中。所以它不僅僅是像素。
Q:你能說說你用來訓(xùn)練它的數(shù)據(jù)嗎?
李飛飛:很多。
Q:你們在計算負(fù)擔(dān)方面遇到過技術(shù)挑戰(zhàn)嗎?
李飛飛:計算量很大。這是公共部門負(fù)擔(dān)不起的計算量。這也是我很高興能休假,以私營部門的方式來做這件事的部分原因。我的親身經(jīng)歷強(qiáng)調(diào)了在獲得充足資源的情況下進(jìn)行創(chuàng)新的重要性。
知識的發(fā)現(xiàn)需要資源的支持,對吧?在伽利略時代,是最好的望遠(yuǎn)鏡讓天文學(xué)家觀測到了新的天體。是虎克意識到放大鏡可以變成顯微鏡,發(fā)現(xiàn)了細(xì)胞。每一次新技術(shù)工具的出現(xiàn),都有助于知識的探尋。而現(xiàn)在,在人工智能時代,技術(shù)工具涉及計算和數(shù)據(jù)。我們必須認(rèn)識到這一點。
Q:假設(shè)我們能讓人工智能系統(tǒng)真正理解三維世界,這會給我們帶來什么?
李飛飛:它將為人們釋放大量的創(chuàng)造力和生產(chǎn)力。我希望能以更高效的方式設(shè)計我的房子。我知道,許多醫(yī)療用途都涉及到理解一個非常特殊的三維世界,那就是人體。我們總在談?wù)撐磥砣祟悓?chuàng)造機(jī)器人來幫助我們,但機(jī)器人是在三維世界中航行的,它們需要空間智能作為大腦的一部分。我們也在談?wù)撎摂M世界,它能讓人們參觀景點、學(xué)習(xí)概念或娛樂。這些虛擬世界使用三維技術(shù),尤其是混合技術(shù),也就是我們所說的 AR(增強(qiáng)現(xiàn)實技術(shù))。我很想戴著一副眼鏡在國家公園里漫步,它能為我提供有關(guān)樹木、道路和云彩的信息。我還想通過空間智能學(xué)習(xí)不同的技能。
Q:什么樣的技能?
李飛飛:我舉個蹩腳的例子,如果我在高速公路上爆胎了,我該怎么辦?現(xiàn)在,我打開了一個 “如何換輪胎 ”的視頻。但如果我能戴上眼鏡,看到我的車發(fā)生了什么,然后在指導(dǎo)下完成這個過程,那就很酷了。但這只是個蹩腳的例子。你可以考慮烹飪,可以考慮雕刻—有趣的事情。
Q:你認(rèn)為我們在有生之年能在這方面取得多大進(jìn)展?
李飛飛:哦,我認(rèn)為這將在我們有生之年實現(xiàn),因為科技進(jìn)步的步伐真的很快。你已經(jīng)看到了過去 10 年所帶來的變化。這無疑預(yù)示著下一步會發(fā)生什么。
今年NeurIPS好熱鬧
NeurIPS整個會議期間,可以說是好不熱鬧。
比如,Bengio和OpenAI的人吵起來了。
據(jù)在場的人爆料,在今年因果關(guān)系小組討論中,OpenAI o1的主創(chuàng)表示,我們最終應(yīng)該訓(xùn)練Agent來優(yōu)化對世界的理解,來解決科學(xué)問題。
Bengio還有一位谷歌AGI安全研究員Tom Everitt則指出這樣做很可怕!他們表示不應(yīng)該制造這樣強(qiáng)大的Agent,還有其他方法可以增強(qiáng)人類的能力,并進(jìn)行科學(xué)研究,比如讓模型學(xué)習(xí)因果圖。
而就在剛才,Bengio還進(jìn)一步回應(yīng)了,再次強(qiáng)調(diào)了AI Agent潛在的風(fēng)險。
如果我們不解決調(diào)整和控制問題,隨著我們賦予系統(tǒng)越來越多的代理權(quán),人工智能的風(fēng)險將繼續(xù)增長。在此之前,我們需要在科學(xué)和政策兩方面取得重大進(jìn)展。
而何愷明竟然探討起了AI宿命論?!
據(jù)熱心網(wǎng)友們的爆料,他是在被問到AI屬于發(fā)明還是發(fā)現(xiàn)的時候。
他表示這要看你相不相信宿命論了。(Doge)
除此之外,他在演講中探討了AI未來的發(fā)展:Super-human AI?
據(jù)小紅書網(wǎng)友爆料,他提到一個有意思的觀點,他將人類比作大模型的傳感器:
人類感知,理解,壓縮了世界的所有的知識并用文本和語言記錄下來。大語言模型吸取,學(xué)習(xí)這些內(nèi)容并將其建模為一個強(qiáng)大而豐富的空間。但是就像你只用RGB觀測宇宙一樣,總會有紫外,紅外這樣看不到,看不清的東西。
△授權(quán)自博主@時間煮雨我主Q
好了,NeurIPS期間還有沒有發(fā)生什么有意思的事情,歡迎小伙伴們跟我們爆料。