相關(guān)不等于因果,深度學(xué)習(xí)讓AI問(wèn)出“十萬(wàn)個(gè)為什么”
大數(shù)據(jù)文摘出品
來(lái)源:searchenterpriseai
編譯:張大筆茹
生活經(jīng)驗(yàn)告訴我們,相關(guān)關(guān)系并不能直接推導(dǎo)出因果關(guān)系,但不管是日常生活還是學(xué)術(shù)研究,對(duì)于因果關(guān)系的解釋要遠(yuǎn)比相關(guān)關(guān)系重要得多。很多時(shí)候,我們也會(huì)對(duì)事件之間的因果關(guān)系捉襟見(jiàn)肘。
如果,把這個(gè)過(guò)程交給AI來(lái)處理會(huì)怎樣呢?
AI可以利用深度學(xué)習(xí)技術(shù)來(lái)構(gòu)建相關(guān)關(guān)系模型。但是,用于確定事情發(fā)生原因的因果深度學(xué)習(xí)目前仍處于起步階段,而且它的自動(dòng)化比普通神經(jīng)網(wǎng)絡(luò)也困難許多。
大部分AI都是通過(guò)分析大量數(shù)據(jù)尋找其中隱藏的規(guī)律。全球IT服務(wù)公司L&T Infotech的執(zhí)行副總裁兼首席數(shù)據(jù)分析官蘇門(mén)德拉·莫漢蒂(Soumendra Mohanty)表示,“顯然,這能使我們能了解到‘是什么’,但卻很少能理解‘為什么’”。
這個(gè)區(qū)別的影響是很大的。建造人工智能的最終目的是訓(xùn)練AI回答為什么這個(gè)因素會(huì)影響那個(gè)因素,這就是許多研究人員現(xiàn)在將注意力轉(zhuǎn)向這兒的原因。
加州大學(xué)洛杉磯分校的教授朱迪亞·珀?duì)?Judea Pearl)的關(guān)于實(shí)施貝葉斯網(wǎng)絡(luò)統(tǒng)計(jì)分析的研究取得重要成績(jī),他在開(kāi)發(fā)一個(gè)可以在可計(jì)算框架中區(qū)分事件原因的、用于繪制因果關(guān)系圖的框架。
分析因果關(guān)系的最大挑戰(zhàn)之一是通過(guò)專(zhuān)家判斷一件事情的原因,此為主觀意見(jiàn),然后再通過(guò)各種分析技術(shù)將其分開(kāi)。這與統(tǒng)計(jì)機(jī)器學(xué)習(xí)所追求的“客觀”形成鮮明對(duì)比。長(zhǎng)遠(yuǎn)來(lái)看,因果關(guān)系研究可以幫助我們更好地理解世界;短期內(nèi),因果分析也可以更好地解釋機(jī)器學(xué)習(xí)模型的結(jié)果。
不再期待AI奇跡般地預(yù)測(cè)未來(lái)
Information Builders營(yíng)銷(xiāo)副總裁杰克·弗賴瓦爾德(Jake Freivald)說(shuō):“商業(yè)精英通常不相信黑盒子技術(shù),但他們卻對(duì)人工智能技術(shù)有著異乎尋常的期待。”他表示,企業(yè)家意識(shí)到將業(yè)務(wù)流程交給人工智能算法可能就像讓他們兩歲的孩子駕駛自己的汽車(chē)一樣冒險(xiǎn)。
問(wèn)題在于,分析型AI主要用于查找數(shù)據(jù)集中的相關(guān)性,而相關(guān)性僅僅能暗示因果關(guān)系,無(wú)法準(zhǔn)確解釋事情為什么發(fā)生。相關(guān)性只能告訴你接下來(lái)可能會(huì)發(fā)生什么。
“我們?cè)侥茉谀P椭惺崂沓鲆蚬P(guān)系,就越能在現(xiàn)實(shí)基礎(chǔ)上準(zhǔn)確評(píng)估事情發(fā)生的原因以及接下來(lái)會(huì)發(fā)生什么,”弗雷瓦德說(shuō),“只有到那時(shí),將業(yè)務(wù)交給人工智能就可以很好地完成工作。否則,結(jié)果可能是災(zāi)難性的。”
不再僅僅是擬合曲線
擬合曲線在回答諸如“下一個(gè)最佳報(bào)價(jià)是什么?”、“這會(huì)是詐騙嗎?” 或者“它是貓嗎?”這類(lèi)問(wèn)題上表現(xiàn)出色。
“但現(xiàn)實(shí)世界中,很多問(wèn)題是無(wú)法僅通過(guò)曲線擬合度解決的,”莫漢蒂說(shuō)。如果幾個(gè)因素都可以預(yù)測(cè)產(chǎn)品偏好,那企業(yè)應(yīng)該選擇哪些因素以及如何確定其重要性順序呢?簡(jiǎn)單地將不同變量按強(qiáng)度排列與獨(dú)立選擇一些因素并單獨(dú)評(píng)估其對(duì)預(yù)測(cè)結(jié)果的貢獻(xiàn)程度的結(jié)果是不同的。
“我們可以觀察相關(guān)性,但并不能證明甚至解釋因果關(guān)系,”莫漢蒂說(shuō)。因果關(guān)系回答的是“我應(yīng)該采取什么行動(dòng)才能實(shí)現(xiàn)改變?”或“如果我改變模型的一些基本假設(shè)會(huì)怎樣?”
因果深度學(xué)習(xí)技術(shù)(又稱(chēng)結(jié)構(gòu)方程模型SEM)已存在多年了。然而,這些技術(shù)或多或少地局限于學(xué)術(shù)研究,目前還沒(méi)有應(yīng)用到商業(yè)領(lǐng)域。
蒙特卡羅模擬,馬爾可夫鏈分析,樸素貝葉斯和隨機(jī)建模是當(dāng)今常用的一些技術(shù),但它們幾乎都不能分析因果關(guān)系。還有一些開(kāi)源軟件包,如DAGitty(一個(gè)基于瀏覽器的環(huán)境,用于創(chuàng)建,編輯和分析因果模型以及Microsoft的DoWhy庫(kù)的軟件包)也用于因果推理。但這些仍在發(fā)展中。
自動(dòng)庫(kù)存管理系統(tǒng)的制造商Pinsa Systems的首席執(zhí)行官兼總裁理查德·施瓦茨(Richard Schwartz)表示,在整體上看,AI應(yīng)用程序會(huì)根據(jù)其觀察到的模式執(zhí)行一系列操作。深度學(xué)習(xí)使用統(tǒng)計(jì)技術(shù)來(lái)發(fā)現(xiàn)規(guī)律。在AI中嵌入因果理解的不同方法需要開(kāi)發(fā)基于規(guī)則的系統(tǒng)。這種系統(tǒng)可以從其他類(lèi)型的客觀事實(shí)中得出結(jié)論,例如“右轉(zhuǎn)三次等同于左轉(zhuǎn)”。
規(guī)則可以是因果關(guān)系或認(rèn)知關(guān)系,它們有助于根據(jù)輸入對(duì)結(jié)果進(jìn)行建模,但它們也有缺點(diǎn):“因果規(guī)則很難界定的,明確定義往往更難。”
潛在的解決方案是兩種方法的組合,例如,為神經(jīng)網(wǎng)絡(luò)創(chuàng)建可解釋性模塊。這種系統(tǒng)的因果深度學(xué)習(xí)模式是以更加艱苦的方式構(gòu)建如何達(dá)成結(jié)論的認(rèn)知模型。
另外一種比較好的因果AI技術(shù)是通過(guò)強(qiáng)化學(xué)習(xí)領(lǐng)域的“從示范中學(xué)習(xí)”(Learning from demonstration),這種方法首先輸入一些計(jì)算機(jī)完成某些事情的例子,然后讓計(jì)算機(jī)適應(yīng)該技術(shù),自己解決問(wèn)題。
彭薩(Pensa)在其庫(kù)存管理工具中使用兩種類(lèi)型的人工智能來(lái)解決與商店貨架上重新進(jìn)貨庫(kù)存相關(guān)的問(wèn)題。主要產(chǎn)品使用神經(jīng)網(wǎng)絡(luò),用以解決攝像機(jī)的計(jì)算機(jī)視覺(jué)輸入識(shí)別貨架上的物品(例如,亨氏牌番茄醬)以及貨架的擺放方式(例如,亨氏牌產(chǎn)品通常在亨特牌產(chǎn)品的旁邊)等問(wèn)題。
使用因果模型生成自動(dòng)提示,例如“亨氏番茄醬快要缺貨”,或者“亨氏番茄醬已經(jīng)完全缺貨”。為了得出這個(gè)結(jié)論,系統(tǒng)不僅需要識(shí)別產(chǎn)品,還需要理解貨架上物品的相關(guān)庫(kù)存控制規(guī)則以及重新進(jìn)貨的意義。
人類(lèi)通常非常擅長(zhǎng)得到認(rèn)知型結(jié)論,例如制定經(jīng)驗(yàn)法則,從而得出結(jié)論。“這是人工智能的瓶頸,”施瓦茨說(shuō)。
無(wú)需模型的因果關(guān)系
德克薩斯大學(xué)奧斯汀分校的人工智能教授斯科特·尼克姆(Scott Niekum)說(shuō),強(qiáng)化學(xué)習(xí)本質(zhì)上是因果關(guān)系,因?yàn)橹悄荏w會(huì)嘗試不同的方式并通過(guò)反復(fù)試驗(yàn)來(lái)了解其是如何得到結(jié)果的。這種類(lèi)型的學(xué)習(xí)被稱(chēng)為“非模型學(xué)習(xí)”,很受歡迎,因?yàn)樗梢詫W(xué)習(xí)正確的或有效的行為而無(wú)需學(xué)習(xí)世界是如何運(yùn)作的。
換句話說(shuō),智能體學(xué)習(xí)行動(dòng)與后果之間的因果關(guān)系,而不是行動(dòng)如何直接影響世界的。例如,它可以在不了解水和火之間的關(guān)系的情況下翻轉(zhuǎn)火上方的水桶將水倒出用來(lái)滅火。
非模型學(xué)習(xí)是一把雙刃劍。如果沒(méi)有模型,智能體就必須從頭學(xué)習(xí)如何在問(wèn)題發(fā)生變化時(shí)解決問(wèn)題。
在前面的例子中,如果給智能體一個(gè)水管而不是一桶水,它就不知道怎么辦了而需要從頭開(kāi)始學(xué)習(xí),因?yàn)樗粚W(xué)習(xí)了“翻桶”行動(dòng)與撲滅火災(zāi),并沒(méi)有學(xué)習(xí)水和火之間的因果關(guān)系。
尼克姆說(shuō):“由于這些原因,人們?cè)絹?lái)越關(guān)注基于模型的強(qiáng)化學(xué)習(xí),盡管它也有缺點(diǎn),例如,如何衡量模型的置信度,模型錯(cuò)誤時(shí)該怎么做,如何管理大范圍長(zhǎng)線計(jì)劃的不確定性?”
解釋機(jī)器學(xué)習(xí)模型
可解釋性的核心是這樣的:解釋必須能夠識(shí)別和量化所有對(duì)深度學(xué)習(xí)模型的行為負(fù)有因果關(guān)系的因素。在這方面,因果關(guān)系是指模型函數(shù)本身,而不是模型正在解決的任務(wù),F(xiàn)iddler Labs(一家可解釋的AI引擎公司)的數(shù)據(jù)科學(xué)負(fù)責(zé)人安庫(kù)爾·泰利(Ankur Taly)表示。
由于模型的復(fù)雜性,完整地解釋深度學(xué)習(xí)模型很難。難以分析推斷模型函數(shù)中每個(gè)特征的重要性,早期的因果深度學(xué)習(xí)方法是通過(guò)觀察模型對(duì)數(shù)據(jù)集的預(yù)測(cè),在其中擬合一個(gè)更簡(jiǎn)單、可解釋的模型來(lái)解釋它。
“不幸的是,這些方法容易受到從觀察數(shù)據(jù)推斷因果關(guān)系的影響,”泰利說(shuō),人們無(wú)法將與模型預(yù)測(cè)真正相關(guān)的特征與那些與之相關(guān)的特征區(qū)分開(kāi)來(lái)。
最近出現(xiàn)了一套基于合作博弈理論的Shapley值的不同算法。這些算法使用反事實(shí)輸入探測(cè)模型。然而,F(xiàn)iddlerLabs的研究發(fā)現(xiàn),如果數(shù)據(jù)集不是正態(tài)分布的,這些算法大多數(shù)情況下都會(huì)導(dǎo)致偏差。泰利說(shuō)他們正在研究將解釋模型與特定數(shù)據(jù)集分離的方法。
這種研究有助于識(shí)別模型學(xué)會(huì)依賴的虛假相關(guān)性。例如,黑客最近可以通過(guò)添加某些類(lèi)型的數(shù)據(jù)來(lái)偽造Cylance反惡意軟件引擎。減輕這種風(fēng)險(xiǎn)的第一步是確定顯著影響模型預(yù)測(cè)的因果特征。
“然后人們可以通過(guò)研究這些特征來(lái)檢查它們是否也是這項(xiàng)任務(wù)的原因,或者它們是否被對(duì)手利用了,就像Cylance一樣,”泰利說(shuō)。
不可盲目迷信AI
據(jù)Information Builders的弗賴瓦爾德說(shuō),目前人類(lèi)可以比AI更好地通過(guò)深度學(xué)習(xí)建立因果關(guān)系。這涉及到限制數(shù)據(jù)集,剔除可能導(dǎo)致偏差的字段,并塑造學(xué)習(xí)過(guò)程。人類(lèi)關(guān)注因果關(guān)系,讓算法完成學(xué)習(xí)過(guò)程。這是一個(gè)反饋循環(huán),但人是必不可少的。
如果因果關(guān)系可以由人工智能決定,那么人工智能可以重塑學(xué)習(xí)過(guò)程而不再需要人類(lèi)。理論上,AI可以使用任意數(shù)據(jù)集來(lái)確定因果關(guān)系,并以人類(lèi)完全沒(méi)意料到的方式進(jìn)行學(xué)習(xí)。
目前還是存在很多未知的。人類(lèi)可以用自己廣泛的智慧解決問(wèn)題,而機(jī)器尚無(wú)法做到。最近的嘗試還產(chǎn)生了不少令人頭疼的并發(fā)癥。“我們希望人工智能越萬(wàn)能,需要的數(shù)據(jù)就越多,誤報(bào)的可能性也就越大——這是機(jī)器的局限,我們不能盲目的迷信機(jī)器,”弗賴瓦爾德說(shuō)。
相關(guān)報(bào)道:
https://searchenterpriseai.techtarget.com/feature/Causal-deep-learning-teaches-AI-to-ask-why
【本文是51CTO專(zhuān)欄機(jī)構(gòu)大數(shù)據(jù)文摘的原創(chuàng)譯文,微信公眾號(hào)“大數(shù)據(jù)文摘( id: BigDataDigest)”】