AI 發(fā)展方向大爭論:混合AI ?強化學(xué)習(xí) ?將實際知識和常識整合到AI中 ?
作者:Ben Dickson是一名軟件工程師,還是探討技術(shù)在如何解決和帶來問題的TechTalks博客的創(chuàng)始人。
對于AI界來說意義重大,這歸功于深度學(xué)習(xí)領(lǐng)域取得了驚人的進(jìn)步,AI的這個分支因收集、存儲和處理大量數(shù)據(jù)的能力不斷增強而變得切實可行。如今,深度學(xué)習(xí)不僅是一個科學(xué)研究課題,還是許多日常應(yīng)用系統(tǒng)的一個關(guān)鍵組成部分。
但是十年來的研究和應(yīng)用清楚地表明,在當(dāng)前狀態(tài)下,深度學(xué)習(xí)并不是克服打造智能與人類相當(dāng)?shù)腁I這一艱巨挑戰(zhàn)的最終解決方案。
我們需要怎樣才能將AI推到下一個高度?需要更多的數(shù)據(jù)和更龐大的神經(jīng)網(wǎng)絡(luò)?需要新的深度學(xué)習(xí)算法?還是需要深度學(xué)習(xí)之外的方法?
這個話題已在AI社區(qū)引起了激烈的討論,也是上周舉行的在線討論Montreal.AI的中心話題。背景和學(xué)科迥異的科學(xué)家們參加了這場名為《AI辯論2——推動AI前進(jìn):一種跨學(xué)科的方法》的大辯論。
混合AI
認(rèn)知科學(xué)家Gary Marcus共同主持了這場辯論,他重申了深度學(xué)習(xí)存在的幾大缺點,包括數(shù)據(jù)需求過高、將知識遷移到其他領(lǐng)域的能力偏低、不透明以及缺乏推理和知識表征。
Marcus一向公開炮轟純深度學(xué)習(xí)的方法,他在2020年初發(fā)表了一篇論文,他在論文中建議采用一種將學(xué)習(xí)算法與基于規(guī)則的軟件相結(jié)合的混合方法。
其他發(fā)言者也指出混合AI這種解決方案有望克服深度學(xué)習(xí)面臨的挑戰(zhàn)。
計算機科學(xué)家Luis Lamb說:“面臨的主要問題之一是確定AI的基本構(gòu)建模塊以及如何提高AI的可信賴性、可解釋性和可解讀性。”
Lamb是《神經(jīng)符號認(rèn)知推理》(Neural-symbolic Cognitive Reasoning)一書的合著者,他提出了一種同時基于邏輯形式化和機器學(xué)習(xí)的神經(jīng)符號AI基礎(chǔ)方法。
Lamb說:“我們使用邏輯和知識表征來表示將其與機器學(xué)習(xí)系統(tǒng)整合起來的推理過程,以便我們還可以利用深度學(xué)習(xí)機器有效地改革神經(jīng)學(xué)習(xí)。”
來自進(jìn)化的啟發(fā)
斯坦福大學(xué)計算機科學(xué)教授、谷歌云前首席AI科學(xué)家李飛飛強調(diào),綜觀進(jìn)化史,視覺一直是推動人類出現(xiàn)智能的主要因素之一。同樣,圖像分類和計算機視覺方面的研究工作已幫助引發(fā)了過去十年的深度學(xué)習(xí)革命。李飛飛開發(fā)了ImageNet,這個擁有數(shù)百萬個帶標(biāo)簽圖像的數(shù)據(jù)集被用來訓(xùn)練和評估計算機視覺系統(tǒng)。
李飛飛說:“作為科學(xué)家,我們問自己‘下一顆北極星是什么?’北極星不止一顆。進(jìn)化和發(fā)展一直給予我極大的啟發(fā)。”
李飛飛指出,人類和動物身上的智能來自于對現(xiàn)實世界的主動感知和互動,而目前的AI系統(tǒng)嚴(yán)重缺乏這項特性,它們而是依賴由人類篩選和標(biāo)記的數(shù)據(jù)。
她說:“感知(perception)和驅(qū)動(actuation)之間有一條根本上而言至關(guān)重要的環(huán)路,它決定著學(xué)習(xí)、理解、規(guī)劃和推理。如果我們的AI代理可以具體呈現(xiàn),可以在探索性行動和利用性行動之間進(jìn)行轉(zhuǎn)換,并具有多模態(tài)、多任務(wù)、可泛化且常常社交化的特性,就可以改進(jìn)這條環(huán)路。”
李飛飛目前在斯坦福大學(xué)實驗室致力于開發(fā)利用感知和驅(qū)動來理解現(xiàn)實世界的交互式代理。
OpenAI的研究人員Ken Stanley也討論了從進(jìn)化汲取的經(jīng)驗教訓(xùn)。Stanley說:“自然界進(jìn)化具有的一些特性極其強大,它們還無法用算法來解釋,原因是我們無法形成自然界中形成的現(xiàn)象。那些是我們應(yīng)繼續(xù)追逐和理解的特性,這些特性不僅在進(jìn)化當(dāng)中,還在我們自身當(dāng)中。”
強化學(xué)習(xí)
計算機科學(xué)家Richard Sutton指出,總的來說,AI方面的工作缺乏一種“計算理論”,以視覺研究而家喻戶曉的神經(jīng)科學(xué)家David Marr最先提出了這個術(shù)語。計算理論定義了信息處理系統(tǒng)力求完成的目標(biāo)以及為什么力求完成該目標(biāo)。
Sutton說:“在神經(jīng)科學(xué)領(lǐng)域,我們對這個目標(biāo)和整體思維的目的缺少大體了解。在AI中也是如此,在AI中可能更令人驚訝。AI中Marr所認(rèn)為的計算理論更是乏善可陳。”Sutton補充道,教科書常常將AI簡單地定義為“讓機器做人們所做的事情”,而AI社區(qū)最近的辨認(rèn)(包括神經(jīng)網(wǎng)絡(luò)和符號系統(tǒng)之爭)“著眼于如何實現(xiàn)某個目標(biāo),好像我們已經(jīng)了解了我們所要做的事情。”
Sutton說:“強化學(xué)習(xí)是智能的第一個計算理論。”他所說的強化學(xué)習(xí)是AI的一個分支,為代理賦予環(huán)境的基本規(guī)則,任由它們發(fā)現(xiàn)實現(xiàn)獎勵最大化的方法。Sutton說:“強化學(xué)習(xí)明確了目標(biāo),明確了什么和為什么。在強化學(xué)習(xí)中,目標(biāo)是實現(xiàn)任意獎勵信號最大化。為此,代理必須計算策略、價值函數(shù)和生成模型。”
他補充道,這個領(lǐng)域需要進(jìn)一步開發(fā)共同約定的智能計算理論,表示強化學(xué)習(xí)目前是出色的候選技術(shù),不過他承認(rèn)其他候選技術(shù)可能值得探究。
Sutton是強化學(xué)習(xí)領(lǐng)域的先驅(qū),出過該課題方面的一本經(jīng)典教科書。他目前效力的AI實驗室DeepMind大力投入于“深度強化學(xué)習(xí)”,這種強化學(xué)習(xí)技術(shù)將神經(jīng)網(wǎng)絡(luò)整合到基本的強化學(xué)習(xí)技術(shù)中。近年來,DeepMind利用深度強化學(xué)習(xí)來攻克圍棋、國際象棋和《星際爭霸2》等游戲。
雖然強化學(xué)習(xí)與人類和動物大腦中的學(xué)習(xí)機制有著驚人的相似之處,但它也面臨著困擾深度學(xué)習(xí)的同一些挑戰(zhàn)。強化學(xué)習(xí)模型需要進(jìn)行大量的訓(xùn)練才能學(xué)習(xí)最簡單的東西,并嚴(yán)格受制于它們被訓(xùn)練時所面向的狹窄領(lǐng)域。目前,開發(fā)深度強化學(xué)習(xí)模型需要非常昂貴的計算資源,這使得這個領(lǐng)域的研究僅限于幾家財力雄厚的公司,比如擁有DeepMind的谷歌和部分擁有OpenAI的微軟。
將實際知識和常識整合到AI中
計算機科學(xué)家和圖靈獎獲得者Judea Pearl以其在貝葉斯網(wǎng)絡(luò)和因果推理方面的工作而聞名,他強調(diào)AI系統(tǒng)需要實際知識和常識才能最有效地利用饋送給它們的數(shù)據(jù)。
Pearl說:“我認(rèn)為,我們應(yīng)該構(gòu)建一種將實際知識與數(shù)據(jù)結(jié)合在一起的系統(tǒng)。”他補充道,僅僅基于聚集和盲目處理大量數(shù)據(jù)的AI系統(tǒng)注定會失敗。
Pearl表示,知識并不來自數(shù)據(jù)。相反,我們利用大腦中的先天結(jié)構(gòu)與實際世界互動,我們利用數(shù)據(jù)來探究世界并從中學(xué)習(xí),如同新生兒探索世界那樣:新生兒在沒有明確指示的情況下學(xué)會了許多東西。
Pearl說:“這種結(jié)構(gòu)必須在數(shù)據(jù)外部加以實現(xiàn)。即使我們以某種方法神奇地從數(shù)據(jù)中學(xué)會了這種結(jié)構(gòu),仍需要以可以與人類溝通的形式來使用它。”
華盛頓大學(xué)的崔藝珍(Yejin Choi)教授也強調(diào)了常識的重要性以及缺乏常識給當(dāng)前的AI系統(tǒng)所帶來的挑戰(zhàn),當(dāng)前的AI系統(tǒng)側(cè)重于將輸入數(shù)據(jù)與結(jié)果對應(yīng)起來。
崔藝珍說:“當(dāng)今的深度學(xué)習(xí)即使不理解數(shù)據(jù)集背后的任務(wù),也可以解釋數(shù)據(jù)集,這歸因于AI和人類智能(尤其是關(guān)于實際世界的知識)之存在巨大差異,而常識正是缺失的基本要素之一。”
崔藝珍還指出,推理是個無限的領(lǐng)域,推理本身是一項生成任務(wù),與如今的深度學(xué)習(xí)算法和評估基準(zhǔn)測試所適用的分類任務(wù)大不相同。崔藝珍說:“我們從不枚舉太多,我們只是即時推理,這將是將來我們要考慮的關(guān)鍵的根本挑戰(zhàn)之一。”
但是我們?nèi)绾螌崿F(xiàn)AI也有常識和推理?崔藝珍提議致力于眾多的平行研究領(lǐng)域,包括結(jié)合符號表征和神經(jīng)表征、將知識整合到推理中以及設(shè)計不僅僅是分類的基準(zhǔn)測試。
但是我們?nèi)绾卧贏I中達(dá)到常識和推理呢?崔藝珍提出了廣泛的平行研究領(lǐng)域,包括將符號和神經(jīng)表示相結(jié)合,將知識整合到推理中以及設(shè)計不僅僅是分類的基準(zhǔn)測試。
崔藝珍表示,我們?nèi)圆恢劳ㄏ虺WR的完整道路。她補充道:“不過有一點可以肯定,那就是我們一味建造世界上更高的建筑物是無法抵達(dá)成功彼岸的。因此,GPT-4、GPT-5或GPT-6可能無濟于事。”