不僅是工程學(xué)!人類認(rèn)知偏差導(dǎo)致的12個(gè)AI研究盲區(qū)
大數(shù)據(jù)文摘出品
編譯:狗小白、張秋玥、Aileen
人類天生存在許多認(rèn)知偏差,而這對(duì)科學(xué)進(jìn)步危害巨大??茖W(xué)研究?jī)A向于偏好既有研究方法,進(jìn)而導(dǎo)致許多研究體系中的內(nèi)在特性被忽略。
因此,研究者很可能不幸花費(fèi)畢生追索錯(cuò)誤無(wú)意義的方向?;仡櫄v史,科學(xué)長(zhǎng)河中充斥著許多后人證明為錯(cuò)誤因而毫無(wú)價(jià)值的研究。
Sabine Hossenfelder在她粒子物理學(xué)領(lǐng)域中寫過這認(rèn)知偏差。她在《迷失在數(shù)學(xué)中(Lost In Math)》一書中探索了一群世上***天賦的科學(xué)家們所具有的認(rèn)知偏差。
她表示,這些科學(xué)家們雖具有優(yōu)秀的認(rèn)知能力,但在不懈追求美的道路上,理論物理學(xué)家們也走進(jìn)了科學(xué)的誤區(qū),物理學(xué)在過去的四十來年內(nèi)沒出現(xiàn)任何重大突破。她認(rèn)為,科學(xué)的客觀性已屈服于采取具有美學(xué)意義的方法論。
這篇文章中,我會(huì)探索在人工智能(或強(qiáng)人工智能AGI)領(lǐng)域探索過程中存在的類似偏差。
可能存在的偏差之一即是貝葉斯定理的濫用。貝葉斯定理的產(chǎn)生啟發(fā)自?shī)W卡姆剃刀定律:“需要假設(shè)條件最少的理論解釋最可能是正確的理論。”
因而,許多科學(xué)家們忠于他們的職業(yè),并信仰“所有的事情都應(yīng)該盡可能簡(jiǎn)單,但又不過分簡(jiǎn)單”的理念。
以上的確是人類理解世界的優(yōu)秀法則,但也正是Hossenfelder所反對(duì)的美學(xué)主義??茖W(xué)研究的重大突破往往依賴于科學(xué)家們某個(gè)瞬間的第六感,但這些假設(shè)不應(yīng)導(dǎo)致對(duì)預(yù)感的武斷應(yīng)用。在此引用Richard Feynman的一句:“無(wú)論你的理論多么美妙,你又有多么聰明,但如果與實(shí)驗(yàn)結(jié)果相佐,你的理論就是錯(cuò)的。”
在此我想談一談大部分(強(qiáng))人工智能研究者總是忽視的12個(gè)事實(shí):
1. 直覺
認(rèn)知心理學(xué)家們?cè)缫汛_定,人類認(rèn)知的運(yùn)作依賴于兩種獨(dú)立的認(rèn)知方式,這就是雙過程理論。直覺思維與理性意識(shí)互為競(jìng)爭(zhēng)又相互協(xié)作,支持著人類認(rèn)知。老式的人工智能的失敗可追溯至當(dāng)時(shí)對(duì)人類認(rèn)知主要基于理性認(rèn)知系統(tǒng)的理念,雖然諸多證據(jù)表明并非如此。直覺認(rèn)知系統(tǒng)才是驅(qū)動(dòng)所有人類認(rèn)知的本質(zhì)發(fā)動(dòng)機(jī),人類認(rèn)知普遍采用“分期推斷”。
2. 睡眠
大自然要求睡眠占人類生***一個(gè)不小的部分。缺覺會(huì)導(dǎo)致認(rèn)知障礙,最終可能致死。至少有實(shí)證證據(jù)表明,睡眠對(duì)認(rèn)知發(fā)展具有重要意義。但不幸的是,很多研究者忽視了人類“待機(jī)狀態(tài)下的”認(rèn)知發(fā)展。而事實(shí)上,人類掌握抽象概念的能力很可能是在睡眠過程中成長(zhǎng)的。
3. 不全面的呈現(xiàn)
很久以來,科學(xué)家們都試圖找到內(nèi)部心理的生成呈現(xiàn)出外部世界的存在,因此,老式的人工智能建立符號(hào)模型來倒映外部世界的語(yǔ)義。深度學(xué)習(xí)訓(xùn)練網(wǎng)絡(luò)學(xué)習(xí)對(duì)世界的內(nèi)部呈現(xiàn),這個(gè)內(nèi)部呈現(xiàn)在一個(gè)連續(xù)的高維空間反應(yīng)出觀察結(jié)果的語(yǔ)義。這個(gè)空間則允許諸如理性、相似性比較之類的操作。
這有兩個(gè)問題:***個(gè)問題是內(nèi)部呈現(xiàn)拋出了更深層的問題,繪制外部真實(shí)世界的內(nèi)部呈現(xiàn)仍需要一些用以理解內(nèi)部呈現(xiàn)的東西。第二個(gè)問題是,我們其實(shí)只關(guān)注我們觀察到的世界里的其中一小部分。認(rèn)知盲區(qū)是存在的,不像機(jī)器那樣能夠留下圖片般的呈現(xiàn),我們只關(guān)注很小一部分的圖景,其它部分靠想象。James Gibson在他生態(tài)認(rèn)知的理論中描述了另一種基于可供性的呈現(xiàn),也即大腦僅僅捕獲環(huán)境中可能存在的而非環(huán)境真實(shí)的反映。
4. 靈敏度
我們是如何僅靠觸摸來分辨一個(gè)物體的?我們是如何靠摸就能辨認(rèn)出棕色袋子里的蘋果?很明顯,感知并不僅靠現(xiàn)實(shí)世界的一張快照,而是由多角度的快照組合成一個(gè)前后一致的統(tǒng)一。人類擁有異乎尋常的靈巧的手,也許正因此我們才有了高級(jí)認(rèn)知能力。我們對(duì)世界有更好的呈現(xiàn),也許是因?yàn)槲覀兣c世界的參與度更高,且能夠更好地分辨不相干信息。但在如今的研究中,卻很少涉及認(rèn)知方面的探索,以及一體化機(jī)制。
5. 有限的理性
人類并非全然的理性動(dòng)物。大多數(shù)人無(wú)法同時(shí)處理五個(gè)以上的事情,幾乎所有人都無(wú)法探索三層以上的遞歸信息。但大部分諸如AIXI、梭羅莫諾夫感應(yīng)、符號(hào)計(jì)算和概率推理等AGI的議題都要求全然的理性。我想表達(dá)的是,簡(jiǎn)單啟發(fā)式思維也許就是驅(qū)動(dòng)人類思考的全部了,我們并不需要求助于優(yōu)雅的數(shù)學(xué)方法。研究者傾向于從他們的“武器庫(kù)”里取出那些數(shù)學(xué)工具來用,于是,要么把問題復(fù)雜化了,要么就是由于人類認(rèn)知能力的問題而選錯(cuò)了工具。莫羅夫復(fù)雜度(Kolmogorov complexity) 是一個(gè)衡量復(fù)雜度的有趣的公式,但這個(gè)方法幾乎沒可能與人類的有限理性卻完全的智能程度有任何相關(guān)性。
6. 描述性模型v.s.生成性模型
Daniel Dennett將革命和圖靈機(jī)器人描述成“不能思考的技能擁有者”,因?yàn)樗麄儞碛邢喈?dāng)?shù)哪芰硗瓿珊芏鄰?fù)雜的流程,但卻不明白為什么這么做。當(dāng)然這也是眾所周知了。但這迷惑了許多不能理解復(fù)雜設(shè)計(jì)怎么能從非智能中生成的人們。我懷疑這是因?yàn)槿祟惖恼J(rèn)知偏差要求從混沌中找出規(guī)律,從而找到內(nèi)在的設(shè)計(jì)。
關(guān)于現(xiàn)實(shí)的數(shù)學(xué)模型或邏輯模型都是描述性模型。這意味著,科學(xué)家們通過恒定的定律來分辨世界中的規(guī)律,而這些定律被視為現(xiàn)實(shí)世界的縮影描述。但是,描述性模型并非現(xiàn)實(shí)世界的本質(zhì),它們只不過是從復(fù)雜生成行為中觀察出的規(guī)律。
即使不存在規(guī)律,人類也還是努力去尋找聯(lián)系。我們看著天上的云,以為看到復(fù)活節(jié)兔子。但變化多端的云彩并非有意幻化成復(fù)活節(jié)兔子的樣子,這是人類尋找世界規(guī)律過程中的一個(gè)主觀臆斷。這意味著,對(duì)世界的描述性模型至多只是在歸納現(xiàn)實(shí)行為中的特點(diǎn),但并非是生成式模型。因此,如同概率模型等描述性模型模擬情景模擬得再好也只是模擬,與生成式模型不同。此外,“停機(jī)問題”意味著,通過觀測(cè)的描述性模型來發(fā)現(xiàn)真實(shí)的生成式模型是不現(xiàn)實(shí)的。
7. 生成自遠(yuǎn)離均衡過程
生成性而非描述性的規(guī)律究竟緣何而起?熱力學(xué)的第二定理表明了萬(wàn)物傾向于混沌?;煦缭诖酥傅氖且粋€(gè)測(cè)量單位,也即熵值,描述了我們無(wú)法從觀測(cè)中找到描述性的規(guī)律。Ilya Prigogine表示,遠(yuǎn)離均衡的狀態(tài)下才能找到規(guī)律。而現(xiàn)今的機(jī)器學(xué)習(xí)方法論的問題在于,運(yùn)用的數(shù)學(xué)總是假設(shè)一定的均衡狀態(tài)。
然而,我們還是不能僅僅考慮自我管理的功能。認(rèn)知能力會(huì)不斷通過一個(gè)層層嵌套新出現(xiàn)能力的程式來鍛煉提升自己。新出現(xiàn)問題的一項(xiàng)數(shù)學(xué)上的缺陷是,它無(wú)法被預(yù)先計(jì)算出來。這是因?yàn)槊恳豁?xiàng)新出現(xiàn)的能力都會(huì)使可能組合的數(shù)量大大增加,而同時(shí)一些先前未知的事件變得已知。人類科技創(chuàng)新既是對(duì)此的直觀描述。在萬(wàn)維網(wǎng)被發(fā)明之前,誰(shuí)能想象到谷歌的今天呢?
8. 主觀性
認(rèn)知模型中最容易被忽視的信息之一則是關(guān)于自身的信息。所有生物學(xué)上的反應(yīng)都與生物自身原始概念相關(guān)。也就是說,生物們的行為都由其生存與繁衍的基本目標(biāo)驅(qū)動(dòng)。所有的生物學(xué)原理都由這種維持自我邊界的概念所驅(qū)動(dòng)。因此當(dāng)我們開始探索更高級(jí)的存在(比如我們自己)的時(shí)候,我們必須在模型中囊括自我的概念。這樣做將導(dǎo)致自我模型需要被嵌入于某生態(tài)系統(tǒng)中。一個(gè)有認(rèn)知的個(gè)體必須與能夠意識(shí)到自我行為以及其行為如何與生態(tài)系統(tǒng)所交互的***人稱視角模型相結(jié)合。
9. 納米意向性
最簡(jiǎn)單的生物細(xì)胞中都存在維持自我的復(fù)雜認(rèn)知行為。Michael Levin的研究表明,在缺少中央神經(jīng)系統(tǒng)時(shí),形態(tài)發(fā)生過程中會(huì)需要復(fù)雜的認(rèn)知(也即生物電計(jì)算)。這個(gè)觀點(diǎn)大大扭轉(zhuǎn)了我們針對(duì)人類大腦建立的描述性模型。如果每一個(gè)神經(jīng)元都與真核細(xì)胞擁有一致的復(fù)雜行為,那么深度學(xué)習(xí)發(fā)現(xiàn)的協(xié)調(diào)操作模型可能并不足以捕捉基本能力(比如協(xié)調(diào)能力與自我修復(fù)能力)。
10. 非靜態(tài)認(rèn)知模型
我們目前擁有的認(rèn)知模型均為靜態(tài)模型,并且適用于單件任務(wù)。然而,若想實(shí)現(xiàn)生物學(xué)級(jí)別的協(xié)調(diào)適應(yīng)性,我們的認(rèn)知模型并不能為靜態(tài)模型;它們需要變得連續(xù)、及時(shí)并且可對(duì)話。我們需要最適合的啟發(fā)式算法支持的持續(xù)場(chǎng)景切換以保證模型隨著生態(tài)系統(tǒng)變化而調(diào)整。
結(jié)構(gòu)是如何在一個(gè)復(fù)雜且動(dòng)態(tài)的生態(tài)系統(tǒng)中被保存的呢?生物個(gè)體能夠自我調(diào)節(jié),擁有許多有意圖的成員的生態(tài)系統(tǒng)也能夠自我調(diào)節(jié)——存在防止事物偏離平衡點(diǎn)的更高一層機(jī)制。這將會(huì)是允許我們跟蹤復(fù)雜對(duì)話的那項(xiàng)機(jī)制嗎?
11. 集合而非個(gè)體
自我模型不能與其成長(zhǎng)的生態(tài)分離。實(shí)際上,各項(xiàng)能力基本只能在與其成長(zhǎng)的生態(tài)非常不同的環(huán)境中被培養(yǎng)出來。比如,生命需要氨基酸、DNA與脂質(zhì)。這三項(xiàng)物質(zhì)到底是如何各自進(jìn)化成為互相必不可少的成分呢?它們很可能在不同的生態(tài)系統(tǒng)內(nèi)各自進(jìn)化直到在目前的生物圈內(nèi)進(jìn)入一個(gè)協(xié)同關(guān)系。總體來說,生命無(wú)法脫離其歸屬的生態(tài)系統(tǒng)。這可能也意味著,高級(jí)認(rèn)知能力——比如語(yǔ)言能力——無(wú)法脫離人類存在的文化環(huán)境而成長(zhǎng)。人們并非與生俱來地?fù)碛姓Z(yǔ)言能力,而是我們獨(dú)特的文化教育了我們語(yǔ)言能力。
12. 產(chǎn)前發(fā)展與幼態(tài)持續(xù)發(fā)展
你有思考過為什么哺乳動(dòng)物(比起更為原始的有袋類動(dòng)物)會(huì)使其后代在子宮中發(fā)育嗎? 你知道人類嬰兒會(huì)在離開子宮真正出生之前數(shù)周就已擁有完整的認(rèn)知能力了嗎?我們假設(shè)人類認(rèn)知發(fā)展在出生之后才開始,然而實(shí)際上關(guān)于它在出生之前就已開始的證據(jù)非常充足;也正因于此,許多母親與世界的反應(yīng)與交互反映在她子宮中的孩子身上。孩子在子宮中學(xué)到了什么呢?
另一項(xiàng)人類的獨(dú)特之處在于,比起其他生物我們保持孩童外表的時(shí)間相對(duì)較長(zhǎng)。2.5歲至3歲的人類與大猩猩認(rèn)知水平類似。動(dòng)物保持年幼外表的這一特性被稱為幼態(tài)持續(xù)。以狗類為例,相較其狼類表親,它們保持較大的眼睛、松弛的耳朵以及更短的鼻吻。蠑螈在其整個(gè)”人生“中都保持其嬰兒時(shí)期的狀態(tài);他們擁有一項(xiàng)驚人的能力——重新長(zhǎng)出其身體的一部分。
一項(xiàng)近期研究表明,在人類體內(nèi)299項(xiàng)與年齡相關(guān)的基因中,有40項(xiàng)基因在人生后期才會(huì)被表達(dá)。實(shí)際上,為大眾所知,成熟相對(duì)較快的人類會(huì)喪失部分認(rèn)知能力。保持年輕確實(shí)對(duì)認(rèn)知能力有好處。年輕人擁有比成年人更強(qiáng)的腦可塑性;更久地保持年輕能夠使人們擁有更多時(shí)間來發(fā)展那些從社會(huì)中獲得的認(rèn)知技能(即模仿能力、語(yǔ)言能力與共情能力)。
人類可能比其他物種更有智慧是因?yàn)槲覀儽3至烁玫暮闷媾c探索心這樣的學(xué)習(xí)能力。
這***一點(diǎn)旨在告訴你,那些僵化的學(xué)習(xí)策略——比如依賴于其”武力、宗教或仇恨“的策略——是很難創(chuàng)新的。而那些試圖探索新道路的則是最可能發(fā)掘出新事物的策略。
敲黑板總結(jié)一下!
你可能已經(jīng)注意到了,這些盲點(diǎn)之間相互聯(lián)系。它們并非毫不相關(guān);結(jié)合在一起,它們?yōu)榍把谹GI研究揭示了一種新穎的完整角度。上文有趣之處在于它與常見的過度注重技術(shù)問題的那些AGI研究截然不同。這可能是由大多數(shù)STEM課程帶來的認(rèn)知偏差導(dǎo)致的。
你不能搭建空中樓閣式的AGI模型;相反,你得從根基開始搭建——這意味著你得一步步培育它。因此我們需要一種自然而有邏輯的方法。盡管,”成長(zhǎng)智慧“這一概念看起來顯而易見,其實(shí)有大量研究者堅(jiān)持走相反的道路(非常令人吃驚!)。很多人都有這樣的偏見:AI就是工程學(xué)。而實(shí)際上它與心理學(xué)與生物學(xué)更為相關(guān)。
在Beyond Efficiency一文中,Dave Ackley討論了為什么我們的計(jì)算系統(tǒng)如此脆弱這一問題。他認(rèn)為這應(yīng)歸咎于”只能正確、只能高效“的心態(tài)。經(jīng)常發(fā)生的計(jì)算機(jī)安全漏洞告訴我們,我們應(yīng)當(dāng)在其中應(yīng)用生物學(xué)告訴我們的魯棒性知識(shí)。Ackley怪罪于我們沒有強(qiáng)調(diào)”系統(tǒng)性思考“。
系統(tǒng)性思考著重于一種關(guān)注結(jié)構(gòu)的整體性方法;這與控制論相關(guān)(控制論學(xué)習(xí)控制、反饋、管制與交互)。高級(jí)AGI將需要我們更好地理解人類認(rèn)知,以及對(duì)生物學(xué)復(fù)雜性的認(rèn)識(shí)。因此我將在這里重述Arthur C. Clarke關(guān)于科技的名言。更精確地說這句話將為:任何足夠先進(jìn)的科技都與生物學(xué)密不可分。
相關(guān)報(bào)道:
https://medium.com/intuitionmachine/12-blind-spots-about-human-cognition-1883d0d58e0a
【本文是51CTO專欄機(jī)構(gòu)大數(shù)據(jù)文摘的原創(chuàng)譯文,微信公眾號(hào)“大數(shù)據(jù)文摘( id: BigDataDigest)”】