圖靈獎(jiǎng)得主Yoshua Bengio:深度學(xué)習(xí)當(dāng)務(wù)之急,是理解因果關(guān)系
深度學(xué)習(xí)擅長(zhǎng)在大量數(shù)據(jù)中發(fā)現(xiàn)模式,但無(wú)法解釋它們之間的聯(lián)系,而圖靈獎(jiǎng)獲得者Yoshua Bengio想要改變這一點(diǎn)。
圖:“將因果關(guān)系整合到人工智能中是一件大事!”——Yoshua Bengio
今年3月,Yoshua Bengio憑借著在深度學(xué)習(xí)技術(shù)的突出貢獻(xiàn)而獲得圖靈獎(jiǎng),這是計(jì)算機(jī)科學(xué)領(lǐng)域的最高榮譽(yù)。正是深度學(xué)習(xí)技術(shù)掀起了人工智能的復(fù)興浪潮,也一步步推動(dòng)了無(wú)人駕駛汽車、即時(shí)語(yǔ)音翻譯以及人臉識(shí)別成為可能。
而現(xiàn)在,Bengio指出“深度學(xué)習(xí)已經(jīng)走到了瓶頸期”。他認(rèn)為,除非深度學(xué)習(xí)能夠超越模式識(shí)別并真正掌握因果關(guān)系的更多信息,否則它根本不可能發(fā)揮其全部潛力,也無(wú)法帶來(lái)真正的AI革命。換句話說(shuō),深度學(xué)習(xí)應(yīng)當(dāng)開始理解“為什么”。
這位蒙特利爾大學(xué)(University of Montreal)教授已經(jīng)55歲了,留著濃密的白發(fā)與眉毛。他解釋道,深度學(xué)習(xí)技術(shù)在理想的場(chǎng)景下確實(shí)表現(xiàn)良好,但如果無(wú)法推理出因果關(guān)系,就無(wú)法接近人類的智力水平。“將因果關(guān)系整合到AI當(dāng)中已經(jīng)成為目前的頭等大事。”Bengio說(shuō),“當(dāng)前的機(jī)器學(xué)習(xí)實(shí)現(xiàn)方法立足一個(gè)基本假設(shè),即經(jīng)過(guò)訓(xùn)練的AI系統(tǒng)在解決實(shí)際問題時(shí),面對(duì)的數(shù)據(jù)與訓(xùn)練數(shù)據(jù)屬于同一類型。但在現(xiàn)實(shí)生活中,情況不可能如此簡(jiǎn)單。”
包括深度學(xué)習(xí)在內(nèi),目前的機(jī)器學(xué)習(xí)系統(tǒng)往往專用性極強(qiáng),只針對(duì)特定任務(wù)進(jìn)行訓(xùn)練,例如識(shí)別圖像中的小貓,或者音頻中的口語(yǔ)指令等。自2012年面世以來(lái),深度學(xué)習(xí)已經(jīng)展現(xiàn)出了卓越的數(shù)據(jù)模式識(shí)別能力,無(wú)論是從醫(yī)學(xué)影像素材中發(fā)現(xiàn)癌癥跡象,還是通過(guò)賬目記錄識(shí)別欺詐活動(dòng),深度學(xué)習(xí)技術(shù)已經(jīng)被廣泛應(yīng)用于多種實(shí)際場(chǎng)景當(dāng)中。
但是,深度學(xué)習(xí)本質(zhì)上對(duì)因果關(guān)系是盲目的。與真正的醫(yī)生不同,深度學(xué)習(xí)算法無(wú)法解釋為什么特定的圖像模式可能存在病變,這意味著某些危急情況下,我們必須謹(jǐn)慎使用深度學(xué)習(xí)。
而理解了因果關(guān)系之后,現(xiàn)有AI系統(tǒng)將在智能度與執(zhí)行效率方面更上一層樓。舉個(gè)例子,如果要讓一個(gè)機(jī)器人意識(shí)到,快速下落的瓷器極易損壞,就不需要把幾十個(gè)花瓶扔到地上再觀察結(jié)果。
Bengio補(bǔ)充道,上面的例子也可以延伸到無(wú)人駕駛汽車。“人類不需要經(jīng)歷大量事故,才意識(shí)到謹(jǐn)慎駕駛的重要性,因?yàn)槲覀內(nèi)祟惪梢栽谀X海中想象事故場(chǎng)景,以便在事故真的發(fā)生時(shí)做好心理準(zhǔn)備。”
問題在于,我們要如何為AI系統(tǒng)賦予這種能力?
Bengio在他的研究實(shí)驗(yàn)室里,正在開發(fā)一種能夠識(shí)別簡(jiǎn)單因果關(guān)系的深度學(xué)習(xí)新版本。他和他的同事最近發(fā)表了一篇研究論文,概述了這種方法。他們使用一套數(shù)據(jù)集,該數(shù)據(jù)集以概率形式描述了真實(shí)世界現(xiàn)象之間的因果關(guān)系,諸如吸煙、肺癌等。在此基礎(chǔ)上,他們又創(chuàng)建出直接包含因果關(guān)系的多套綜合數(shù)據(jù)集。
論文中提到的算法,在本質(zhì)上能夠就哪些變量之間具有因果關(guān)系做出基本假設(shè),而后測(cè)試不同變量的調(diào)整是否與其初步判斷相吻合。
機(jī)器最終可能會(huì)利用這種方法來(lái)形成一種假設(shè),即當(dāng)物體掉落時(shí)可能發(fā)生什么,而后通過(guò)少數(shù)幾次實(shí)際觀察東西摔到地板上時(shí),來(lái)確認(rèn)自己的結(jié)論是否正確。
Bengio已經(jīng)參與過(guò)一次AI技術(shù)革新。在過(guò)去幾十年中,他與今年的另外幾位圖靈獎(jiǎng)獲得者(包括任職于多倫多大學(xué)與谷歌公司的Geoffrey Hinton,以及任職于紐約大學(xué)及Facebook的Yann LeCun)一起,共同發(fā)展出釋放現(xiàn)代深度學(xué)習(xí)潛力的思想與工程技術(shù)。
深度學(xué)習(xí)利用人工神經(jīng)網(wǎng)絡(luò)生成并加強(qiáng)數(shù)學(xué)形式的聯(lián)系,從而模擬人類神經(jīng)元與突觸的學(xué)習(xí)方式。訓(xùn)練數(shù)據(jù)(例如圖像或者音頻)會(huì)被饋送至神經(jīng)網(wǎng)絡(luò)當(dāng)中,神經(jīng)網(wǎng)絡(luò)則對(duì)訓(xùn)練素材進(jìn)行分析及自我調(diào)整,直到能夠以正確的方式做出響應(yīng)為止。因此在理論上,只要能夠看到足夠多的訓(xùn)練圖像并擁有充裕的計(jì)算能力,深度學(xué)習(xí)程序即可通過(guò)訓(xùn)練以極高的準(zhǔn)確率識(shí)別照片中的對(duì)象。
深度學(xué)習(xí)使用人工神經(jīng)網(wǎng)絡(luò),通過(guò)形成和加強(qiáng)連接,在數(shù)學(xué)上近似于人類神經(jīng)元和突觸的學(xué)習(xí)方式。訓(xùn)練數(shù)據(jù),如圖像或音頻,被輸入到一個(gè)神經(jīng)網(wǎng)絡(luò),這個(gè)神經(jīng)網(wǎng)絡(luò)會(huì)逐漸調(diào)整,直到它做出正確的反應(yīng)。如果深度學(xué)習(xí)程序能看到大量的訓(xùn)練圖像,并具有足夠的計(jì)算能力,那么它就能被訓(xùn)練來(lái)識(shí)別照片中的物體,而且準(zhǔn)確率很高。
但是,深度學(xué)習(xí)算法并不善于概括總結(jié),也很難將自己在一種場(chǎng)景下學(xué)習(xí)到的知識(shí)應(yīng)用于另一種場(chǎng)景。換句話說(shuō),深度學(xué)習(xí)只能捕捉到現(xiàn)象之間的相關(guān)性——例如公雞啼叫與太陽(yáng)升起,但卻無(wú)法考慮產(chǎn)生這種相關(guān)性的深層次原因。
其他不少領(lǐng)域已經(jīng)在因果關(guān)系研究方面投入了大量時(shí)間與精力,近幾十年來(lái)出現(xiàn)了許多探索因果關(guān)系的數(shù)學(xué)技術(shù),也徹底改變了包括社會(huì)科學(xué)、經(jīng)濟(jì)學(xué)以及流行病學(xué)在內(nèi)的多個(gè)行業(yè)的研究范式。目前,已經(jīng)有少數(shù)研究人員開始努力將因果關(guān)系與機(jī)器學(xué)習(xí)結(jié)合起來(lái)。
憑借因果推理方面的貢獻(xiàn)獲得2011年圖靈獎(jiǎng)的Judea Pearl表示,盡管并沒有認(rèn)真研究過(guò),但Bengio的思考方式給他留下了深刻的印象。Pearl在最近合著的《因果之書:因果關(guān)系的新科學(xué)(The Book of Why: The New Science of Cause and Effect)》當(dāng)中提到,如果沒有對(duì)因果關(guān)系的推理能力,AI的發(fā)展將從根本上受到限制。
認(rèn)知科學(xué)實(shí)驗(yàn)也表明,理解因果關(guān)系對(duì)于人類成長(zhǎng)乃至智力發(fā)展至關(guān)重要,盡管我們尚不清楚人類是如何掌握這種關(guān)鍵知識(shí)的。
Bengio關(guān)于因果關(guān)系的研究,代表行業(yè)已經(jīng)在這個(gè)問題的探索方面邁出重要一步。雖然只是一小步,但可以由此看到,深度學(xué)習(xí)正朝著現(xiàn)實(shí)主義方向勇敢前行,事實(shí)上,盡管這項(xiàng)技術(shù)的應(yīng)用正在快速普及,但已經(jīng)有越來(lái)越多的專家提到“其在語(yǔ)言理解等核心領(lǐng)域仍面臨著嚴(yán)重局限”。
在采訪當(dāng)中,Bengio還對(duì)企業(yè)嚴(yán)重夸大AI及深度學(xué)習(xí)實(shí)際能力的行為表示失望。他指出,“在我看來(lái),商界最好能扭轉(zhuǎn)這一波不良風(fēng)氣,現(xiàn)在的炒作氛圍實(shí)在太過(guò)濃重了。”
其他一些研究人員則認(rèn)為,對(duì)深度學(xué)習(xí)的過(guò)度關(guān)注也是造成目前問題的原因之一。紐約大學(xué)名譽(yù)教授Gary Marcus在最近出版的《重新引導(dǎo)AI:構(gòu)建我們能夠信任的人工智能(Rebooting AI: Building Artificial Intelligence We Can Trust)》中提到,Bengio對(duì)因果推理的關(guān)注預(yù)示著技術(shù)思想層面已經(jīng)開始出現(xiàn)可喜的變化。
他表示,“目前有太多深度學(xué)習(xí)項(xiàng)目都單純關(guān)注缺少因果關(guān)系的粗糙關(guān)聯(lián)性,這常常導(dǎo)致深度學(xué)習(xí)系統(tǒng)在真實(shí)條件下(明顯不同于訓(xùn)練場(chǎng)景的條件下)進(jìn)行測(cè)試時(shí),往往拿不出良好的實(shí)際表現(xiàn)。”
Marcus認(rèn)為,人類的行為應(yīng)當(dāng)成為指導(dǎo)AI技術(shù)發(fā)展的重要依據(jù)。“當(dāng)孩子們提出「為什么」的時(shí)候,就代表他們想要了解現(xiàn)象背后的因果關(guān)系。一旦機(jī)器學(xué)會(huì)提出「為什么」,其智能化水平也將迎來(lái)真正的飛躍。”