自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

語(yǔ)言≠思維,大模型學(xué)不了推理:一篇Nature讓AI社區(qū)炸鍋了

人工智能 新聞
這篇論文聲稱(chēng)「語(yǔ)言主要是用于交流的工具,而不是思考的工具,對(duì)于任何經(jīng)過(guò)測(cè)試的思維形式都不是必需的」,引發(fā)了科技領(lǐng)域社區(qū)的大討論。

大語(yǔ)言模型(LLM)為什么空間智能不足,GPT-4 為什么用語(yǔ)言以外的數(shù)據(jù)訓(xùn)練,就能變得更聰明?現(xiàn)在這些問(wèn)題有 「標(biāo)準(zhǔn)答案」了。

近日,一篇麻省理工學(xué)院(MIT)等機(jī)構(gòu)發(fā)表在頂級(jí)學(xué)術(shù)期刊《自然》雜志的文章觀察到,人類(lèi)大腦生成和解析語(yǔ)言的神經(jīng)網(wǎng)絡(luò)并不負(fù)責(zé)形式化推理,而且提出推理并不需要語(yǔ)言作為媒介。

這篇論文聲稱(chēng)「語(yǔ)言主要是用于交流的工具,而不是思考的工具,對(duì)于任何經(jīng)過(guò)測(cè)試的思維形式都不是必需的」,引發(fā)了科技領(lǐng)域社區(qū)的大討論。

圖片

難道真的如語(yǔ)言學(xué)家喬姆斯基所言,追捧 ChatGPT 是浪費(fèi)資源,大語(yǔ)言模型通向通用人工智能(AGI)的路線(xiàn)完全錯(cuò)了?

讓我們看看這篇論文《Language is primarily a tool for communication rather than thought》是怎么說(shuō)的。

圖片

論文鏈接:https://www.nature.com/articles/s41586-024-07522-w

語(yǔ)言是人類(lèi)智能的一個(gè)決定性特征,但它所起的作用或多或少一直存在爭(zhēng)議。該研究提供了神經(jīng)科學(xué)等相關(guān)學(xué)科角度的最新證據(jù),以論證現(xiàn)代人類(lèi)的語(yǔ)言是一種交流工具,這與我們使用語(yǔ)言進(jìn)行思考的流行觀點(diǎn)相反。

作者首先介紹了支持人類(lèi)語(yǔ)言能力的大腦網(wǎng)絡(luò)。隨后回顧語(yǔ)言和思維雙重分離的證據(jù),并討論語(yǔ)言的幾種特性,這些特性表明語(yǔ)言是為交流而優(yōu)化的。該研究得出結(jié)論認(rèn)為,盡管語(yǔ)言的出現(xiàn)無(wú)疑改變了人類(lèi)文化,但語(yǔ)言似乎并不是復(fù)雜思維(包括符號(hào)思維)的先決條件。相反,語(yǔ)言是傳播文化知識(shí)的有力工具,它可能與我們的思維和推理能力共同進(jìn)化,并且只反映了人類(lèi)認(rèn)知的標(biāo)志性復(fù)雜性,而不是產(chǎn)生這種復(fù)雜性。

圖片

圖 1

研究證據(jù)挑戰(zhàn)了語(yǔ)言對(duì)于思維的重要性。如圖 1 所示,使用 fMRI 等成像工具,我們可以識(shí)別完整、健康的大腦中的語(yǔ)言區(qū)域,然后檢查在完成需要不同思維形式的任務(wù)時(shí),語(yǔ)言區(qū)域的相關(guān)響應(yīng)。

人類(lèi)大腦中的語(yǔ)言網(wǎng)絡(luò)

從人腦的生物學(xué)結(jié)構(gòu)來(lái)看,語(yǔ)言生成和語(yǔ)言理解由左半球一組相互連接的大腦區(qū)域支持,通常稱(chēng)為語(yǔ)言網(wǎng)絡(luò)(圖 1a;Box 2 描述了它與語(yǔ)言神經(jīng)生物學(xué)經(jīng)典模型的關(guān)系)。

圖片

Box 2。許多教科書(shū)仍然使用 Wernicke 提出的語(yǔ)言神經(jīng)基礎(chǔ)模型,并由 Lichteim 和 Geschwind 進(jìn)行了闡述和修訂。該模型包括兩個(gè)皮層區(qū)域:Broca 區(qū)位于下額葉皮層,Wernicke 區(qū)位于后上顳葉皮層。這兩個(gè)區(qū)域分別支持語(yǔ)言產(chǎn)生和理解,并通過(guò)一條背側(cè)纖維束(弓狀束)連接。

語(yǔ)言網(wǎng)絡(luò)有兩個(gè)非常重要的特性:

首先,語(yǔ)言區(qū)域表現(xiàn)出輸入和輸出模態(tài)的獨(dú)立性,這是表征抽象性的關(guān)鍵特征。主要表現(xiàn)為在理解過(guò)程中,這些大腦區(qū)域?qū)缒B(tài)(口頭、書(shū)面或手語(yǔ))的語(yǔ)言輸入做出反應(yīng)。同樣,在語(yǔ)言生成過(guò)程中,無(wú)論我們是通過(guò)口語(yǔ)還是書(shū)面語(yǔ)來(lái)產(chǎn)生信息,這些區(qū)域都是活躍的。這些區(qū)域支持語(yǔ)言理解和生成(圖 1a)這一事實(shí)表明,它們很可能存儲(chǔ)了我們的語(yǔ)言知識(shí),這對(duì)于編碼和解碼語(yǔ)言信息都是必需的。

其次,語(yǔ)言區(qū)還能對(duì)詞義和句法結(jié)構(gòu)進(jìn)行表征和處理。特別是,關(guān)于腦磁圖和顱內(nèi)記錄研究的證據(jù)表明,語(yǔ)言網(wǎng)絡(luò)的所有區(qū)域都對(duì)詞義以及詞間句法和語(yǔ)義依賴(lài)性敏感(圖 1a)??傊?,語(yǔ)言網(wǎng)絡(luò)中語(yǔ)言表征的抽象性以及網(wǎng)絡(luò)對(duì)語(yǔ)言意義和結(jié)構(gòu)的敏感性使其成為評(píng)估語(yǔ)言在思維和認(rèn)知中的作用假設(shè)的明確目標(biāo)((Box 3)。

我們對(duì)人類(lèi)語(yǔ)言和認(rèn)知能力,以及它們之間關(guān)系的理解仍然不完整,還有一些懸而未決的問(wèn)題:

  • 語(yǔ)言表征的本質(zhì)是什么?
  • 思維是否依賴(lài)于符號(hào)表征?
  • 兒童學(xué)習(xí)語(yǔ)言時(shí),語(yǔ)言網(wǎng)絡(luò)是如何成長(zhǎng)的?

語(yǔ)言對(duì)于任何經(jīng)過(guò)檢驗(yàn)的思維形式都不是必需的

經(jīng)典的方法是通過(guò)研究大腦損傷或疾病的個(gè)體來(lái)推斷大腦與行為之間的關(guān)聯(lián)和分離。這種方法依賴(lài)于觀察大腦某部分受損時(shí)個(gè)體行為的變化,從而推測(cè)不同大腦區(qū)域的功能和行為之間的聯(lián)系。

有證據(jù)表明 —— 有許多個(gè)體在語(yǔ)言能力上有嚴(yán)重的障礙,影響到詞匯和句法能力,但他們?nèi)匀槐憩F(xiàn)出在許多思考形式上的完整能力:他們可以解決數(shù)學(xué)問(wèn)題,進(jìn)行執(zhí)行規(guī)劃和遵循非言語(yǔ)指令,參與多種形式的推理,包括形式邏輯推理、關(guān)于世界的因果推理和科學(xué)推理(見(jiàn)圖 1b)。  

研究表明,盡管失去了語(yǔ)言能力,一些患有嚴(yán)重失語(yǔ)癥的人仍然能夠進(jìn)行所有測(cè)試形式的思考和推理,他們?cè)诟鞣N認(rèn)知任務(wù)中的完整表現(xiàn)就是明證。他們根本無(wú)法將這些想法映射到語(yǔ)言表達(dá)上,無(wú)論是在語(yǔ)言生成中(他們無(wú)法通過(guò)語(yǔ)言向他人傳達(dá)自己的想法),還是在理解中(他們無(wú)法從他人的單詞和句子中提取意義)(圖 1b)。當(dāng)然,在某些腦損傷病例中,語(yǔ)言能力和(某些)思維能力都可能受到影響,但考慮到語(yǔ)言系統(tǒng)與其他高級(jí)認(rèn)知系統(tǒng)的接近性,這是可以預(yù)料的。

尤其是一些聾啞兒童,他們長(zhǎng)大后很少或根本沒(méi)有接觸過(guò)語(yǔ)言,因?yàn)樗麄兟?tīng)不見(jiàn)說(shuō)話(huà),而他們的父母或看護(hù)人不懂手語(yǔ)。缺乏語(yǔ)言接觸會(huì)對(duì)認(rèn)知的許多方面產(chǎn)生有害影響,這是可以預(yù)料的,因?yàn)檎Z(yǔ)言是了解世界的重要信息來(lái)源。盡管如此,語(yǔ)言剝奪的個(gè)體無(wú)疑表現(xiàn)出復(fù)雜的認(rèn)知功能能力:他們?nèi)匀豢梢詫W(xué)習(xí)數(shù)學(xué)、進(jìn)行關(guān)系推理、建立因果鏈,并獲得豐富而復(fù)雜的世界知識(shí)。換句話(huà)說(shuō),缺乏語(yǔ)言表征并不會(huì)使人從根本上無(wú)法進(jìn)行復(fù)雜的(包括符號(hào)的)思考,盡管推理的某些方面確實(shí)表現(xiàn)出延遲。因此,在典型的發(fā)展中,語(yǔ)言和推理是平行發(fā)展的。

完整的語(yǔ)言并不意味著完整的思維

以上證據(jù)表明,迄今為止測(cè)試的所有類(lèi)型的思維都可以在沒(méi)有語(yǔ)言的情況下實(shí)現(xiàn)。

接下來(lái),論文討論了語(yǔ)言和思維雙重分離的另一面:與語(yǔ)言介導(dǎo)思維的觀點(diǎn)相反,完整的語(yǔ)言系統(tǒng)似乎并不意味著完整的推理能力。

圖片

圖片

人類(lèi)語(yǔ)言是由交流壓力塑造的。

來(lái)自發(fā)育性和后天性腦部疾病的證據(jù)表明,即使語(yǔ)言能力基本完好,也可能存在智力障礙。

例如,有些遺傳疾病導(dǎo)致智力受損程度不同,但患有這些疾病的人的語(yǔ)言能力似乎接近正常水平;還有一些精神層面有缺陷的人,會(huì)影響思考和推理能力,但同樣不會(huì)影響語(yǔ)言。最后,許多獲得性腦損傷的個(gè)體在推理和解決問(wèn)題方面表現(xiàn)出困難,但他們的語(yǔ)言能力似乎完好無(wú)損。換句話(huà)說(shuō),擁有完整的語(yǔ)言系統(tǒng)并不意味著自動(dòng)具備思考能力:即使語(yǔ)言能力完好無(wú)損,思考能力也可能受損。

總的來(lái)說(shuō),這篇論文回顧了過(guò)去二十年的相關(guān)工作。失語(yǔ)癥研究的證據(jù)表明:所有經(jīng)過(guò)檢驗(yàn)的思維形式在沒(méi)有語(yǔ)言的情況下都是可能的。fMRI 成像證據(jù)表明:參與多種形式的思考和推理并不需要語(yǔ)言網(wǎng)絡(luò)。因此,語(yǔ)言不太可能成為任何形式思維的關(guān)鍵基礎(chǔ)。

MIT 研究得出結(jié)論的同時(shí),頂尖 AI 領(lǐng)域?qū)W者最近也發(fā)表了對(duì)大模型發(fā)展的擔(dān)憂(yōu)。上個(gè)星期四 Claude 3.5 的發(fā)布號(hào)稱(chēng)擁有研究生水平的推理能力,提升了行業(yè)的標(biāo)準(zhǔn)。不過(guò)也有人表示經(jīng)過(guò)實(shí)測(cè)可見(jiàn),它仍然具有 Transformer 架構(gòu)的局限性。

對(duì)此,圖靈獎(jiǎng)獲得者 Yann LeCun 表示,問(wèn)題不在于 Transformer,而是因?yàn)?Claude 3.5 仍然是一個(gè)自回歸大模型。無(wú)論架構(gòu)細(xì)節(jié)如何,使用固定數(shù)量的計(jì)算步驟來(lái)計(jì)算每個(gè) token 的自回歸 LLM 都無(wú)法進(jìn)行推理。

圖片

LeCun 也評(píng)論了這篇 Nature 論文,對(duì)思維不等于語(yǔ)言表示贊同。

圖片

對(duì)此,你怎么看?

責(zé)任編輯:張燕妮 來(lái)源: 機(jī)器之心
相關(guān)推薦

2024-11-11 17:35:11

2023-10-11 12:32:53

AI模型

2024-04-11 11:35:03

大語(yǔ)言模型LLMs

2024-10-22 13:28:53

2024-11-29 18:37:07

2024-09-09 08:31:15

2023-12-05 07:14:27

AIGo

2023-11-18 09:30:42

模型AI

2025-03-17 08:15:00

AI技術(shù)模型

2024-10-29 21:01:44

2024-12-02 12:24:15

2022-03-01 15:15:41

AI樂(lè)譜論文

2023-03-11 13:15:01

AI模型系統(tǒng)

2021-07-10 09:02:42

編程語(yǔ)言 TypeScript

2023-11-06 07:27:38

模型NLP領(lǐng)域

2025-02-28 06:35:47

2021-09-14 07:26:26

組合問(wèn)題循環(huán)

2022-07-12 14:56:30

AI模型研究

2021-08-26 13:22:46

雪花算法隨機(jī)數(shù)

2020-12-10 15:00:10

AI 計(jì)算人工智能
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)