圖靈獎得主LeCun:人類智能不是通用智能,下一代AI可能基于非生成式
在最新一檔播客節(jié)目中,Meta首席AI科學(xué)家&圖靈獎得主LeCun發(fā)表了如上觀點(diǎn)。
他表示,AGI(通用人工智能)一詞非常具有誤導(dǎo)性,但人類智能本質(zhì)是非通用的,它非常專業(yè)。
圖片
更有意思的是,當(dāng)大家都在談?wù)撋墒紸I時,他卻憑借直覺大膽預(yù)測:下一代AI的突破可能基于非生成式。
同時他還再次cue到了DeepSeek,并直言對于這個走紅硅谷的新事物,他們這些長期深耕AI領(lǐng)域的人實(shí)則并不感到意外。
整場節(jié)目中,LeCun與兩位主持人的討論涵蓋了從大語言模型 (LLMs) 的局限性到人工智能研究的下一個范式轉(zhuǎn)變等主題,重點(diǎn)關(guān)注了推理、規(guī)劃和世界建模等概念。
省流版如下:
- LeCun直覺認(rèn)為,下一代AI的突破可能基于非生成式;
- 否認(rèn)AGI會在未來兩年內(nèi)實(shí)現(xiàn),但十年內(nèi)可能取得重大進(jìn)展;
- 人類和動物的智能核心,不是語言,而是對物理世界的建模和行動規(guī)劃;
- 創(chuàng)新可以來自世界任何角落;
- 智能眼鏡代表著AI技術(shù)落地的一個重要方向。
與此同時,量子位在不改變原意的基礎(chǔ)上,對部分問題進(jìn)行了翻譯整理。
“下一代AI可能基于非生成式”
Q:如何看待一邊是收益遞減,一邊是企業(yè)們紛紛押注生成式AI?
LeCun:毫無疑問,生成式AI很有用,尤其是編程助手之類的。近來人們正在討論Agent系統(tǒng),但它還并不完全可靠。
從技術(shù)演示到實(shí)際部署需要巨大跨越,類似10年前自動駕駛的困境——初期演示驚艷,但規(guī)模化落地極難。
過去七十年,人工智能領(lǐng)域一直在重復(fù)這樣的歷史:人們提出一個新范式,然后宣稱這將達(dá)到人類智能水平,但每次都被證明是錯誤的。要么缺乏泛化性,要么被證明只擅長某個子任務(wù)而非通用任務(wù)。
所以,我們應(yīng)該對它們進(jìn)行大量投資,尤其是投向運(yùn)行它們的大量基礎(chǔ)設(shè)施。實(shí)際上,大量資金都涌向了AI基礎(chǔ)設(shè)施,這并非為了訓(xùn)練AI,而是為了讓其運(yùn)行起來服務(wù)潛在數(shù)十億用戶。
如今,如果我們需要達(dá)到人類智能水平,我們需要發(fā)明新技術(shù)。我們還遠(yuǎn)未達(dá)到這一水平。
Q:人工智能下一步何在?應(yīng)該把資源投向哪里?
LeCun:3年前我寫了一篇文章《A Path Towards Autonomous Machine Intelligence》(通往自主機(jī)器智能的道路),闡述了未來十年AI研究的方向。
圖片
我認(rèn)為,未來的AI必須具備幾個關(guān)鍵能力:
- 理解物理世界——不僅僅是處理符號或文本,而是真正“懂”現(xiàn)實(shí)世界的運(yùn)作規(guī)律;
- 具備推理和規(guī)劃能力——能夠像人類一樣思考“如果這樣做,會發(fā)生什么”,并制定策略;
- 擁有持久記憶——不是簡單的數(shù)據(jù)存儲,而是能像人類一樣長期積累和調(diào)用經(jīng)驗(yàn);
- 安全可控——AI必須嚴(yán)格遵循我們設(shè)定的目標(biāo),不能偏離或“自作主張”。
人類和動物的大腦里都有一個“世界模型”——它讓我們能預(yù)測現(xiàn)實(shí)世界的運(yùn)行方式。比如,你扔出一個球,不用計(jì)算拋物線,大腦就能預(yù)測它的落點(diǎn)。這種能力讓我們能規(guī)劃行動,比如:“如果我現(xiàn)在左轉(zhuǎn),會不會撞到那輛車?”
在AI領(lǐng)域,我們希望能讓機(jī)器也學(xué)會這種模型。但問題是:如何讓AI像嬰兒一樣,通過觀察世界來自主學(xué)習(xí)?
LLM的成功證明了自監(jiān)督學(xué)習(xí)的強(qiáng)大——讓AI通過預(yù)測文本的下一個token來學(xué)習(xí)語言規(guī)律。但同樣的方法直接套用到視覺(比如預(yù)測視頻的下一幀)卻行不通,因?yàn)楝F(xiàn)實(shí)世界的可能性太多,無法像文字那樣用概率分布建模。
我們提出的解決方案是 JEPA(聯(lián)合嵌入預(yù)測架構(gòu)),它不直接生成像素級的預(yù)測,而是在一個更抽象的“表征空間”里進(jìn)行推理。這有點(diǎn)像人類的大腦——我們不會在腦子里渲染每一幀畫面,而是用更高效的方式理解世界。
有趣的是,現(xiàn)在大家都在談?wù)撋墒紸I,但我的直覺是,下一代AI的突破可能會來自非生成式模型。
這就是我的思考方向——LLM的爆發(fā)沒有改變它,反而讓我更堅(jiān)信:AI的下一個突破,在于讓機(jī)器真正“理解”世界,而不僅僅是生成內(nèi)容。
“AI的未來是像動物一樣思考”
Q:如何看待AGI?
LeCun:我堅(jiān)信未來必然會出現(xiàn)全面超越人類智能的機(jī)器系統(tǒng)——這不是能否實(shí)現(xiàn)的問題,而是時間問題。
當(dāng)前AI已經(jīng)在特定領(lǐng)域展現(xiàn)出超越人類的能力(比如圍棋、圖像識別),但真正的挑戰(zhàn)在于構(gòu)建能夠像生物一樣適應(yīng)現(xiàn)實(shí)世界的智能體。
我必須指出,“AGI”這個詞具有誤導(dǎo)性。 它暗示人類智能是“通用”的,而實(shí)際上,人類智能極其專業(yè)化。我們的大腦是進(jìn)化的產(chǎn)物,只擅長解決對生存有用的問題,而不是真正“通用”的計(jì)算。
我們覺得自己“通用”,只是因?yàn)槲覀儗o法理解的問題根本意識不到。所以,我更傾向于用“高級機(jī)器智能(AMI)”這個概念,它在Meta內(nèi)部也被稱為“Ami”(法語“朋友”的意思),而不是誤導(dǎo)性的“AGI”。
我不認(rèn)為AGI(或AMI)會在明年或未來兩年內(nèi)實(shí)現(xiàn)。但十年內(nèi),我們可能會取得重大進(jìn)展。當(dāng)然,這取決于我們能否填補(bǔ)當(dāng)前缺失的關(guān)鍵技術(shù)。
圖片
歷史告訴我們,AI的突破總是比預(yù)期更難。比如,深度學(xué)習(xí)在20世紀(jì)80年代就被提出,但直到2010年后才真正爆發(fā)。所以,我保持謹(jǐn)慎樂觀——我相信我們能成功,但絕不會像某些人想象的那么快。
今天的AI(比如大語言模型)在某些任務(wù)上表現(xiàn)驚人,比如通過律師考試(本質(zhì)是信息檢索)、生成代碼(語法嚴(yán)格,相對容易)、總結(jié)和改寫文本。
但它們有一個致命缺陷:無法解決從未見過的新問題。比如,讓最好的大語言模型去做最新的奧數(shù)題,它們幾乎得零分,因?yàn)樗鼈儧]有訓(xùn)練過類似的題目。
更關(guān)鍵的是,它們沒有真正的推理能力。所謂的“思維鏈”(Chain-of-Thought)只是讓模型生成更多文本,而不是像人類那樣進(jìn)行抽象推理。
人類和動物(比如貓、老鼠)的智能核心,不是語言,而是對物理世界的建模和行動規(guī)劃。例如:
- 空間推理:如果我讓你想象一個立方體旋轉(zhuǎn)90度,你能在腦中模擬,而不需要語言描述;
- 分層規(guī)劃:如果我要從紐約去巴黎,我不會一步步計(jì)算“先邁左腳還是右腳”,而是抽象成“打車→機(jī)場→飛機(jī)”;
- 動作學(xué)習(xí):貓能學(xué)會開門、松鼠能記住藏食物的位置,它們沒有語言,但能通過觀察和嘗試掌握復(fù)雜技能。
這才是真正的智能,而今天的AI完全做不到這一點(diǎn)。
要讓AI達(dá)到動物(甚至人類)的智能水平,我們需要:
1、建立世界模型:讓AI能模擬物理規(guī)律(比如重力、物體互動);2、分層行動規(guī)劃:像人類一樣,從高層次目標(biāo)分解到具體動作;3、非語言推理:真正的智能不依賴語言,而是基于抽象表征;4、適應(yīng)不確定性:現(xiàn)實(shí)世界是混亂的、連續(xù)的,不像語言那樣結(jié)構(gòu)化。
如果能讓AI達(dá)到貓的智能水平,就已經(jīng)是巨大突破。 今天的AI能在棋盤上擊敗人類,但一只貓對物理世界的理解,仍然遠(yuǎn)超最先進(jìn)的大語言模型。
我們離真正的人類級AI還有距離,但方向是明確的:不是讓AI更擅長語言,而是讓它像動物一樣理解世界、規(guī)劃行動。這需要全新的架構(gòu),而不僅僅是更大的語言模型。
我相信,未來十年,我們會看到重大進(jìn)展——但絕不會是“突然覺醒”的超級AI,而是逐步接近生物智能的機(jī)器。
“我們對DeepSeek的出現(xiàn)并不意外”
Q:Meta的人工智能策略是怎樣的?
LeCun:作為Meta的AI負(fù)責(zé)人,我想分享一下我們決定開源LLaMA系列模型的戰(zhàn)略思考。
這個決定源于幾個關(guān)鍵考量:首先,從倫理角度來看,開源是正確的事情。LLaMA 2采用開源模式發(fā)布后,直接推動了整個AI生態(tài)系統(tǒng)的爆發(fā)式增長。這不僅惠及企業(yè)和初創(chuàng)公司,更重要的是讓學(xué)術(shù)界能夠真正參與到前沿研究中來。要知道,大學(xué)和研究機(jī)構(gòu)通常根本沒有資源來訓(xùn)練自己的基礎(chǔ)模型。
我們的開源策略實(shí)際上產(chǎn)生了兩個顯著效果:它確實(shí)影響了少數(shù)幾家閉源商業(yè)公司的利益(大家都知道是哪幾家),但它同時為成千上萬的企業(yè)和研究者創(chuàng)造了機(jī)會。
在教育領(lǐng)域,正如Jeff教授提到的,LLaMA讓大學(xué)能夠運(yùn)行、研究和改進(jìn)這些模型。這種開放創(chuàng)新模式正是AI領(lǐng)域最需要的。
有些人可能會問:Meta為什么要免費(fèi)開放這么重要的技術(shù)?
這其實(shí)與我們的商業(yè)模式有關(guān):我們不像某些公司直接靠AI技術(shù)本身盈利,Meta的核心收入來自廣告。而廣告業(yè)務(wù)依賴于基于這些技術(shù)構(gòu)建的高質(zhì)量產(chǎn)品、社交網(wǎng)絡(luò)的網(wǎng)絡(luò)效應(yīng)以及用戶規(guī)模和參與度。
所以,開源不僅不會損害我們的商業(yè)利益,反而能幫助我們建立更強(qiáng)大的生態(tài)系統(tǒng)。當(dāng)更多人使用和改進(jìn)這些技術(shù)時,最終也會反哺我們的產(chǎn)品。
在追求人類級AI的道路上,開源是加速突破的關(guān)鍵。這可能是人類面臨的最重大科技挑戰(zhàn)之一,沒有任何一家公司能壟斷所有創(chuàng)新。最近DeepSeek等開源項(xiàng)目的突破就證明了這一點(diǎn)——它們讓硅谷大吃一驚,但我們這些長期參與開源的人并不感到意外。
圖片
我堅(jiān)信以下幾點(diǎn):
- 創(chuàng)新可以來自世界任何角落
- 沒有人能壟斷好點(diǎn)子(除了那些自我感覺特別良好的人)
- 過去十年AI的快速發(fā)展,很大程度上要?dú)w功于代碼和知識的開放共享
在Meta,我們將繼續(xù)堅(jiān)持開源策略,因?yàn)檫@是推動AI技術(shù)進(jìn)步、實(shí)現(xiàn)真正創(chuàng)新的最佳途徑。我們期待與全球的研究者和開發(fā)者一起,共同邁向更智能的未來。
“智能眼鏡成技術(shù)落地重要方向”
Q:如何看待智能眼鏡等設(shè)備的出現(xiàn)?
LeCun:我認(rèn)為智能眼鏡代表著AI技術(shù)落地的一個重要方向。
在我看來,未來的AI助手應(yīng)該具備以下特點(diǎn):
- 全天候陪伴:像真正的助手一樣隨時待命;
- 多感官交互:能夠”看到”和”聽到”用戶所處的環(huán)境(在獲得許可的前提下);
- 專業(yè)化分工:不是單一助手,而是一組各有所長的虛擬助手團(tuán)隊(duì)。
有趣的是,很多人擔(dān)心AI比人類聰明會帶來威脅,但我認(rèn)為這反而是賦能。就像在科研或企業(yè)管理中,最理想的情況就是能找到比自己更優(yōu)秀的人才一起工作。
最后,關(guān)于開源的重要性,我想強(qiáng)調(diào)就像Linux改變了互聯(lián)網(wǎng)基礎(chǔ)設(shè)施一樣,開源AI將重塑整個行業(yè)格局。
我預(yù)見未來會有成千上萬種不同的AI助手,它們將基于像Meta這樣的大公司提供的開源基礎(chǔ)模型,由全球各地的開發(fā)者進(jìn)行定制開發(fā)。這種模式不僅能避免技術(shù)壟斷,更能促進(jìn)真正的創(chuàng)新。
參考鏈接:
[1]https://www.youtube.com/watch?v=BytuEqzQH1U
[2]https://jasonhowell.substack.com/p/meta-ai-chief-yann-lacun-human-intellig
[3]https://aiinside.show/episode/yann-lecun-human-intelligence-is-not-general-intelligence