當(dāng)下,應(yīng)抓緊探索超越深度學(xué)習(xí)的其他實(shí)現(xiàn)方法
譯文【51CTO.com快譯】盡管深度學(xué)習(xí)確實(shí)為我們帶來諸多令人印象深刻的成功案例,但其只是機(jī)器學(xué)習(xí)技術(shù)的一小部分,而機(jī)器學(xué)習(xí)又是人工智能的一小部分。在我們看來,未來的人工智能應(yīng)當(dāng)探索超越深度學(xué)習(xí)的其它實(shí)現(xiàn)方法。
深度學(xué)習(xí)技術(shù)——人工智能領(lǐng)域的閃耀明星
時(shí)至今日,每個(gè)人都在學(xué)習(xí),或者自稱在學(xué)習(xí)深度學(xué)習(xí)(簡稱DL)技術(shù)——人工智能(簡稱AI)領(lǐng)域的閃耀明星。
目前,面向各階段學(xué)習(xí)者的付費(fèi)及免費(fèi)深度學(xué)習(xí)課程已經(jīng)超過十萬種。眾多初創(chuàng)企業(yè)及產(chǎn)品打著“深度XX”的旗號(hào),但明眼人一望而知這只是其標(biāo)榜自我的噱頭。事實(shí)上,很多人都忽略了深度學(xué)習(xí)僅占機(jī)器學(xué)習(xí)(簡稱ML)整體的1%比例,而機(jī)器學(xué)習(xí)又僅占人工智能的1%。余下還有99%的比例擁有更為廣闊的實(shí)踐空間。更具體地講,“純深度學(xué)習(xí)專家”并不屬于“全面的人工智能專家”。
深度學(xué)習(xí)并不是人工智能的同義詞!
谷歌、Facebook等技術(shù)巨頭在廣告宣傳當(dāng)中提及最多的人工智能工具仍然主要體現(xiàn)為深度學(xué)習(xí),因此公眾們也誤以為所有的人工智能技術(shù)成果目前乃至未來都將需要依托于深度學(xué)習(xí)來完成。但實(shí)際情況并非如此。
像XGBoost這樣的決策樹并沒有成為頭條新聞的追蹤焦點(diǎn),不過其卻在眾多Kaggle表數(shù)據(jù)競賽當(dāng)中悄然擊敗了深度學(xué)習(xí)方法。媒體將ALphaGo稱為純深度學(xué)習(xí)產(chǎn)物,但其實(shí)際上是蒙特卡洛樹加深度學(xué)習(xí)的結(jié)晶,而且有證據(jù)證明純深度學(xué)習(xí)并不足以支持其擊敗世界一流棋手。神經(jīng)進(jìn)化的NEAT解決了眾多強(qiáng)化學(xué)習(xí)型任務(wù),但其并沒有使用任何反向傳播機(jī)制。很明顯,目前關(guān)于人工智能的認(rèn)知當(dāng)中存在“深層誤區(qū)”。
當(dāng)然,我并不是說深度學(xué)習(xí)無法解決實(shí)際任務(wù):深度學(xué)習(xí)確實(shí)非常出色。當(dāng)下,樹與其它算法往往無法帶來能夠與深度學(xué)習(xí)相匹敵的實(shí)際表現(xiàn),且無法替代深度學(xué)習(xí)解決某些特定任務(wù)。然而,我期望著未來能夠出現(xiàn)更多能夠擊敗深度學(xué)習(xí)技術(shù)的非深度學(xué)習(xí)系統(tǒng)。值得強(qiáng)調(diào)的是,深度學(xué)習(xí)決策還代表著一場(chǎng)法律層面的災(zāi)難——即使結(jié)果正確,我們也無法通過解釋其決策流程來消除法律層面的質(zhì)疑。
此外,我還期待著能夠在媒體當(dāng)中看到深度學(xué)習(xí)當(dāng)中的“災(zāi)難性遺忘”問題,即其在學(xué)習(xí)新信息時(shí)突然忘記以往已經(jīng)學(xué)習(xí)到的其它信息的狀況,以及其持續(xù)存在的過度擬合傾向。在“智能”方面,深度學(xué)習(xí)只會(huì)簡單相信其獲取到的訓(xùn)練數(shù)據(jù),而無法判斷這些數(shù)據(jù)究竟是真是假、是公平還是存在偏見。人類雖然在一定程度上也會(huì)被虛假新聞所誤導(dǎo),但仍保持著強(qiáng)大的自主判斷力——具體來講,孩子們都知道電影內(nèi)容是虛構(gòu)的,而不會(huì)將其信以為真。
深度學(xué)習(xí)比HTML更古老
20年前,每個(gè)人都在學(xué)習(xí)HTML。HTML是用于手寫網(wǎng)頁的標(biāo)記語言,在當(dāng)時(shí)人們廣泛認(rèn)為掌握了這門手藝即擁有了成為百萬巨富的潛力。
與其他人一樣,我也學(xué)習(xí)了一切看似有用的技術(shù):HTML、移動(dòng)應(yīng)用、深度學(xué)習(xí)以及其它陸續(xù)出現(xiàn)的新生事物。但事實(shí)上,我們的生活不可能單純圍繞著一種技術(shù)展開!如果您學(xué)習(xí)了深度學(xué)習(xí),仍然無法窺見人工智能漫長發(fā)展周期中的全月的。
早在1995年,HTML就開始過時(shí),并在不久之后被CSS、JavaScript以及服務(wù)器語言所逐漸替代。同樣的,深度學(xué)習(xí)也會(huì)過時(shí)。時(shí)至今日,大多數(shù)主流移動(dòng)應(yīng)用根本不包含任何HTML元素,因此也許未來的人工智能應(yīng)用也將徹底告別深度學(xué)習(xí)——誰知道呢。
事實(shí)上,深度學(xué)習(xí)是上世紀(jì)八十年代誕生的技術(shù),比HTML更古老:上世紀(jì)七十年代的“神經(jīng)網(wǎng)絡(luò)加隱藏層”機(jī)制證明利用更多數(shù)據(jù)訓(xùn)練將可提供更理想的結(jié)果,而其隨后被更名為深度學(xué)習(xí)并廣受關(guān)注。
1992年,我簡要檢查了一些神經(jīng)網(wǎng)絡(luò)源代碼,以及分形及元胞自動(dòng)機(jī)等技術(shù)產(chǎn)物。與其他人一樣,我也把深度學(xué)習(xí)視為一種沒有實(shí)際用途的純學(xué)術(shù)性數(shù)學(xué)難題。相反,我更關(guān)注其它更具實(shí)效性的技術(shù):3D視頻游戲,而后是互聯(lián)網(wǎng)等等。但事實(shí)證明,我們都犯下了嚴(yán)重的錯(cuò)誤——深度學(xué)習(xí)完全可以配合大數(shù)據(jù)完成令人印象深刻的目標(biāo)!
我在2015年深陷Deep Dream以及GAN而不能自拔。然而,深度學(xué)習(xí)絕不可能、也不應(yīng)該是我們所發(fā)明的最后一項(xiàng)人工智能技術(shù)成果。古老的深度學(xué)習(xí)已經(jīng)得到廣泛研究,并通過數(shù)十年的更新獲得準(zhǔn)確解決更多任務(wù)的能力,但還沒有哪個(gè)深度學(xué)習(xí)版本(包括卷積、RNN、RNN+LSTM、GAN等)能夠解釋其決策過程。
盡管深度學(xué)習(xí)肯定能夠解決更多任務(wù),并在未來替代更多相關(guān)工作人員,但只要其無法就自身決策的公正性給出合法且有效的解釋,其仍不太可能解決所有問題或者繼續(xù)保持這種令人驚訝的發(fā)展態(tài)勢(shì)。
探索其他途徑,而不僅局限于深度學(xué)習(xí)
未來的人工智能應(yīng)該能夠探索其它或新或舊,但遭到忽視的途徑——而不僅局限于深度學(xué)習(xí)。
深度學(xué)習(xí)的一大局限,在于其會(huì)簡單將真實(shí)情況視為數(shù)據(jù)當(dāng)中頻繁出現(xiàn)的事實(shí),而不會(huì)考慮在統(tǒng)計(jì)學(xué)層面更為罕見的狀況。深度學(xué)習(xí)的公平性并非來自這項(xiàng)技術(shù)本身,而是來自人類為深度學(xué)習(xí)所選定及準(zhǔn)備的數(shù)據(jù)。深度學(xué)習(xí)可以閱讀文本并實(shí)現(xiàn)文本內(nèi)容間的翻譯,但無法以“人文方式”完成理解性翻譯。如果一套深度學(xué)習(xí)模型在訓(xùn)練當(dāng)中接觸100本論著,其中40本認(rèn)為仇恨、戰(zhàn)爭、死亡與破壞不值得提倡,而60本宣揚(yáng)希特勒的納粹思想值得鼓勵(lì),那么其最終得到的將是100%的納粹傾向!
深度學(xué)習(xí)自身永遠(yuǎn)無法意識(shí)到屠殺猶太人、同性戀者以及殘障人士屬于錯(cuò)誤的作法,而只會(huì)簡單遵循訓(xùn)練數(shù)據(jù)當(dāng)中提供的納粹主義觀點(diǎn)。也正因?yàn)槿绱?,深度學(xué)習(xí)無法解釋自己的決策——其會(huì)天真地認(rèn)為“我經(jīng)常讀到納粹主義是正確的論點(diǎn),所以其應(yīng)該是正確的。”
深度學(xué)習(xí)會(huì)學(xué)習(xí)并模仿那些明顯存在缺陷的邏輯,而無法發(fā)現(xiàn)包括恐怖主義在內(nèi)的各類錯(cuò)誤思維的內(nèi)在缺陷。然而,與深度學(xué)習(xí)不同,即使是小孩子也能夠自行發(fā)現(xiàn)電影當(dāng)中表現(xiàn)的反派角色。反向傳播中的梯度下降以及自定義深度學(xué)習(xí)硬件等成果確實(shí)值得肯定,但其主要作用于統(tǒng)計(jì)與幾何層面,因此我認(rèn)為2037年的人工智能方案當(dāng)中將不再以此作為主要判斷依據(jù)。
對(duì)于眾多任務(wù),人工智能的深度學(xué)習(xí)將會(huì)變得不非法且有違合規(guī)性要求。根據(jù)即將于2018年5月25日正式實(shí)施的通用數(shù)據(jù)保護(hù)條例(簡稱GDPR)的要求,對(duì)28個(gè)歐盟國家公民數(shù)據(jù)進(jìn)行收集的各相關(guān)方必須遵循其中的監(jiān)管規(guī)定。屆時(shí),深度學(xué)習(xí)在歐盟區(qū)域之內(nèi)的實(shí)際應(yīng)用將受到嚴(yán)厲限制,意味著各人工智能初創(chuàng)企業(yè)必須盡快找到能夠替代深度學(xué)習(xí)的其它實(shí)現(xiàn)途徑,否則將面臨遭遇巨額罰款的威脅。條例規(guī)定罰款數(shù)額將為跨國企業(yè)全球營收的4%——包括來自美國市場(chǎng)的收入。
而在自動(dòng)化決策方面,GDPR需要相關(guān)實(shí)現(xiàn)技術(shù)給出鍬,并防止其中包含與種族、觀點(diǎn)以及健康等相關(guān)的歧視性因素。而與GDPR類似的其它法律條款在全球范圍內(nèi)的出臺(tái)也只是時(shí)間問題。美國公平信用報(bào)告法案要求有關(guān)各方披露一切可能對(duì)消費(fèi)者信用評(píng)分產(chǎn)生不利影響的因素,且此類因素最多只能同時(shí)存在4項(xiàng)。相比之下,深度學(xué)習(xí)中所囊括的因素?cái)?shù)量往往成千上萬,那么我們?cè)撊绾螌⑵浜喕癁?項(xiàng)?展望未來,人工智能將如同比特幣一樣,在發(fā)展初期缺乏監(jiān)管,但相關(guān)法律與懲罰制度終將出現(xiàn)。
深度學(xué)習(xí)的復(fù)雜性很難像非技術(shù)人解釋清楚
深度學(xué)習(xí)系統(tǒng)需要作出遠(yuǎn)超必要數(shù)量的決策,才能完成判斷某一圖像內(nèi)容是否為貓,或者如何在自拍圖像中添加兔耳朵這類任務(wù)——很明顯,未來將有更簡單的非深度學(xué)習(xí)機(jī)制能夠代替其處理這些工作。
與深度學(xué)習(xí)不同,人工智能方案必須以負(fù)責(zé)任的方式通過更為簡單且合法有效的語言向無技術(shù)背景的法官及用戶作出決策解釋。對(duì)于法官及用戶而言,深度學(xué)習(xí)的復(fù)雜性使其更像是一種“魔法”,這無疑是一類法律風(fēng)險(xiǎn)、而不僅是一項(xiàng)很酷的功能。深度學(xué)習(xí)能夠向人類發(fā)出建議或警告——例如從醫(yī)學(xué)影像當(dāng)中檢測(cè)疾病,并由醫(yī)生加以驗(yàn)證,但這種自動(dòng)化機(jī)制仍然缺乏充足的細(xì)節(jié)。我們可以設(shè)想,相關(guān)方要如何向被人工智能拒絕的用戶(例如拒絕其貸款或者工作申請(qǐng))作出解釋?
法律當(dāng)中包含“解釋權(quán)”,即負(fù)責(zé)解釋申請(qǐng)人的工作或貸款申請(qǐng)為何會(huì)被拒絕。然而,深度學(xué)習(xí)給出的結(jié)果不具備自然(法律)語言的解釋內(nèi)容。雖然能夠提供深度學(xué)習(xí)變量頁,但法官或用戶仍然無法接受,因此即使是最杰出的數(shù)學(xué)家或其它算法也無法弄清其內(nèi)容并將其簡化為深度學(xué)習(xí)模型。另外,即使對(duì)于那些由人類作出決策的場(chǎng)景,人工智能工具也應(yīng)該能夠給出詳細(xì)的可判斷原因(例如據(jù)此否決人工智能的決策),或者通過簡單地復(fù)制、粘貼以及確認(rèn)由人工智能提供的解釋內(nèi)容以完成快速認(rèn)證。
目前還沒人知道要如何修改深度學(xué)習(xí)算法以給出與人類相近的簡單解釋內(nèi)容,因此深度學(xué)習(xí)顯然無法通過合規(guī)性審計(jì)!這個(gè)問題也同樣影響到其它多種人工智能與機(jī)器學(xué)習(xí)算法,但這種影響程度遠(yuǎn)不及深度學(xué)習(xí)。在增強(qiáng)或組合的情況下,決策樹也同樣無法進(jìn)行解釋。但在未來,我相信會(huì)出現(xiàn)新型或者經(jīng)過重新發(fā)明的認(rèn)證機(jī)制,且其足以捍衛(wèi)自己的決策并徹底替代傳統(tǒng)深度學(xué)習(xí)以及人類的判斷方法。
在GDPR的約束下,只有人力部門能夠處理申請(qǐng)拒絕工作:人工智能僅可接受申請(qǐng),而對(duì)貸款或工作申請(qǐng)的拒絕則必須被交由人力資源部門處理,只有這樣才能為遭到拒絕的對(duì)象提供有說服力的解釋信息。
但即使是在這樣的情況下,如果人工智能選擇拒絕,人力資源部門仍然無法獲得任何幫助或者解釋信息,也無從知曉深度學(xué)習(xí)所遵循的邏輯是對(duì)還是錯(cuò)。他們將被迫從頭開始重新檢查數(shù)據(jù),從而決定是否仍然加以拒絕,并為此作出合理的解釋。這樣做的風(fēng)險(xiǎn)在于,為了節(jié)約時(shí)間與金錢,人力資源部門會(huì)傾向于為人工智能提供并不屬實(shí)的拒絕解釋,或者盲目接受人工智能的批準(zhǔn)意見。
然而,法官會(huì)要求驗(yàn)證人工智能決策的公平性,包括詢問為何情況類似的其他人會(huì)被接受等等。出于安全考慮,大家需要主動(dòng)獲取堅(jiān)定的批準(zhǔn)理由——無論GDPR等法律是否作出明確要求。未來的非深度學(xué)習(xí)型人工智能系統(tǒng)應(yīng)能夠提供人類可讀的決策解釋以供用戶、法官以及支持人員進(jìn)行參考,只有這樣其才能被最終全面引入自動(dòng)化決策流程。
可解釋性在相關(guān)法律甚至是深度學(xué)習(xí)出現(xiàn)之前就已經(jīng)存在。在反壟斷案件當(dāng)中,谷歌等企業(yè)被問及為何某些產(chǎn)品——而非其它產(chǎn)品——被顯示在搜索結(jié)果的頂部。這意味著早在深度學(xué)習(xí)技術(shù)出現(xiàn)之前,其它眾多算法同樣在以令人無法理解的方式混合數(shù)據(jù)以獲取結(jié)果,即沒人能夠輕松重構(gòu)相關(guān)決策的產(chǎn)生原因。
工程師們向法官解釋稱他們也不確切了解整個(gè)決策過程,并提交線性代數(shù)頁作為證據(jù)。但這并不能很好地解決爭議,多起案件結(jié)果顯示這些企業(yè)遭遇到數(shù)十億美元的罰款,甚至在特定法律出臺(tái)之前,其被警告需要對(duì)現(xiàn)有機(jī)制作出徹底改變。用戶所提出的與就業(yè)、貸款以及退稅等相關(guān)的拒絕判斷成為集體訴訟中的“???rdquo;,并導(dǎo)致相關(guān)零售、銀行以及保險(xiǎn)等自動(dòng)化決策單位因無法作出合理解釋而面臨著罰款甚至是公關(guān)危機(jī)的挑戰(zhàn)。
深度學(xué)習(xí)缺乏解釋能力,可以解決任務(wù)十分有限
我們擁有的只是無法進(jìn)行自我解釋的“深度學(xué)習(xí)型人工智能”,而且由于缺乏解釋能力,其可以解決的任務(wù)也十分有限。深度學(xué)習(xí)不會(huì)節(jié)約成本,也不能因?yàn)樽詣?dòng)化決策內(nèi)容的敏感性而中止處理。
對(duì)于大多數(shù)人來講,人工智能的典型代表是科幻電影中那些能夠進(jìn)行智能解釋的產(chǎn)物。更具體地講,人類可以根據(jù)這些解釋快速?zèng)Q定是否支持其論斷,這意味著合法性驗(yàn)證的難度并不高。
正因?yàn)槿绱?,包括法官以及GDPR立法者在內(nèi)的大多數(shù)人都認(rèn)為采用人工智能技術(shù)的企業(yè)應(yīng)當(dāng)能夠像電影中一樣將其引入法庭,且其有能力以簡單明確的方式捍衛(wèi)自己的決定。但實(shí)際情況恰恰相反,我們擁有的只是無法進(jìn)行自我解釋的“深度學(xué)習(xí)型人工智能”,而且由于缺乏解釋能力,其可以解決的任務(wù)也十分有限。深度學(xué)習(xí)不會(huì)節(jié)約成本,也不能因?yàn)樽詣?dòng)化決策內(nèi)容的敏感性而中止處理。即使對(duì)于需要由人類作出最終決策的業(yè)務(wù)流程,我們也更期待能夠出現(xiàn)可以解釋自身建議的人工智能成果——而非如今這種無法給出任何原因或理由的“黑匣子”。
未來可能出現(xiàn)的可解釋型人工智能方案將幫助各類機(jī)構(gòu)更安全、更具合規(guī)性、更快速且以更低成本代替深度學(xué)習(xí)與人為處理流程??紤]到深度學(xué)習(xí)的誕生時(shí)間為上世紀(jì)六十到八十年代之間,因此也許能夠?qū)崿F(xiàn)這一要求的技術(shù)業(yè)已存在,只是等待著被重新發(fā)現(xiàn)或者是迎來一波脫胎換骨的升級(jí)。
在自動(dòng)化決策制定方面,GDPR亦要求防止基于種族、觀點(diǎn)乃至健康狀況等因素的歧視性影響。然而,用戶生成型數(shù)據(jù)(包括社交媒體與新聞)不同于醫(yī)學(xué)或財(cái)務(wù)記錄等實(shí)際情況數(shù)據(jù),其中總是隱含著某些邪惡的偏見。
如前所述,深度學(xué)習(xí)能夠讀取大量文本與數(shù)據(jù)并模仿其內(nèi)容傾向,但卻無法以批判性方式加以理解。深度學(xué)習(xí)只會(huì)相信經(jīng)常發(fā)現(xiàn)的結(jié)論,強(qiáng)調(diào)數(shù)據(jù)當(dāng)中出現(xiàn)的模式與趨勢(shì),這無疑將進(jìn)一步擴(kuò)大人類社會(huì)中存在的偏見問題。
數(shù)據(jù)顯示,黑人相較于白人擁有更高的入獄比例,因此如果出現(xiàn)相關(guān)案件,深度學(xué)習(xí)自然會(huì)首先懷疑黑人。數(shù)據(jù)顯示,企業(yè)董事會(huì)中的男性成員要遠(yuǎn)多于女性成員,因此深度學(xué)習(xí)在考慮職位申請(qǐng)時(shí)將優(yōu)先選擇男性候選人。
深度學(xué)習(xí)的決策在歧視性、種族主義等問題
深度學(xué)習(xí)的決策在歧視性、種族主義以及性別歧的程度上將高于訓(xùn)練數(shù)據(jù)中的平均樣本。這個(gè)問題存在于所有機(jī)器學(xué)習(xí)算法當(dāng)中,但深度學(xué)習(xí)模型無疑是其中最難測(cè)試、檢測(cè)、控制及調(diào)整的區(qū)間之一。這個(gè)問題很難得到解決,且會(huì)廣泛引發(fā)諸如聊天機(jī)器人納粹化與出現(xiàn)仇恨傾向、乃至美顏應(yīng)用直接過濾圖像中的黑人面孔等情況。
在訓(xùn)練完成后,我們無法通過平衡調(diào)?;虬惭b補(bǔ)丁的方式解決深度學(xué)習(xí)模型中的歧視、種族主義或者性別歧視傾向。深度學(xué)習(xí)是一套神經(jīng)網(wǎng)絡(luò),其與其它一些人工智能方法不同,意味著我們無法利用局部調(diào)整的方式編輯具體答案,而只能選擇利用不同的、100%平衡且公正的數(shù)據(jù)對(duì)其進(jìn)行重新訓(xùn)練。很明顯,這類數(shù)據(jù)集非常罕見。
另外,深度學(xué)習(xí)模型會(huì)模仿其在數(shù)據(jù)集中發(fā)現(xiàn)的結(jié)論,但卻并不能真正理解其含義:深度學(xué)習(xí)不會(huì)對(duì)任何數(shù)據(jù)加以否定,不會(huì)意識(shí)到其中代表著哪些不公正傾向,而僅僅簡單進(jìn)行“數(shù)據(jù)學(xué)習(xí)”。有鑒于此,我們可能需要雇用專門的人員為其創(chuàng)造理想條件下的偽公平數(shù)據(jù),即白人的拘捕率與黑人一致,且其中50%為女性等等。
然而,為了訓(xùn)練深度學(xué)習(xí)而創(chuàng)造大量經(jīng)過人為編輯的無偏見數(shù)據(jù)將耗費(fèi)大量資源,其成本將導(dǎo)致人工智能變得缺乏實(shí)際意義!此外,即使我們訓(xùn)練出這樣一套真正公平的深度學(xué)習(xí)模型,由于其無法作出任何解釋,因此它仍然無法向法官或者用戶自證判斷結(jié)論的公平性。
在非商業(yè)應(yīng)用或者不構(gòu)成法律風(fēng)險(xiǎn)的游戲當(dāng)中,深度學(xué)習(xí)有可能成為輔助性要素。當(dāng)可解釋人工智能方案出現(xiàn)之后,深度學(xué)習(xí)技術(shù)也不會(huì)像磁帶機(jī)或者顯像管電視那樣被徹底淘汰。畢竟人們不會(huì)因?yàn)檩斀o游戲機(jī)器人而向法院提起訴訟,宣傳其無法解釋自己如何獲勝。
另外,即使人們對(duì)FaceApp在照片當(dāng)中對(duì)年長、年輕或異性人物的面部進(jìn)行修飾有所不滿,也不會(huì)因人工智能無法解釋其外貌判斷過程而將其告上法庭。再有,只要用戶在服用藥物之前向醫(yī)生進(jìn)行確認(rèn),那么利用深度學(xué)習(xí)技術(shù)檢測(cè)醫(yī)療影像中的疾病就非常安全。
深度學(xué)習(xí)更多代表著一種法律風(fēng)險(xiǎn)
合法深度學(xué)習(xí)市場(chǎng)在規(guī)模上存在嚴(yán)重局限: 法官可以對(duì)可能導(dǎo)致財(cái)務(wù)或健康差異,或者存在歧視性傾向的條件下提出罰款判決,而深度學(xué)習(xí)算法將無法理解該判決是否公正以及為何公正。
事實(shí)上,除了進(jìn)行藝術(shù)創(chuàng)作、游戲設(shè)計(jì)或者笑話編輯之外,深度學(xué)習(xí)更多代表著一種法律風(fēng)險(xiǎn)。現(xiàn)有的非深度學(xué)習(xí)實(shí)現(xiàn)方法將在必要時(shí)取代深度學(xué)習(xí),并憑借著相關(guān)新方法的發(fā)展而繼續(xù)推動(dòng)人工智能的歷史進(jìn)程。只有每個(gè)人都重視深度學(xué)習(xí)之外的一切人工智能與機(jī)器學(xué)習(xí)技術(shù),我們才真正有可能成為“全面的人工智能專家”。
除了“非法”問題之外,深度學(xué)習(xí)在其它幾類任務(wù)的解決方面同樣非常無力:在抽象推理方面,人們需要弄清其所看到的數(shù)據(jù)是否公平,同時(shí)解釋自己作出決策的邏輯。即使對(duì)于圖像識(shí)別這類似乎最適合深度學(xué)習(xí)算法且不太需要解釋的任務(wù),深度學(xué)習(xí)的安全性仍然遠(yuǎn)不及人類。
事實(shí)上,我們完全可以用“敵對(duì)性樣本”欺騙深度學(xué)習(xí)算法:在貓的照片當(dāng)中添加無形干擾因素,即可誤導(dǎo)深度學(xué)習(xí)算法將其內(nèi)容視為狗。在這種情況下,盡管人類仍然會(huì)將其判斷為貓,但深度學(xué)習(xí)卻會(huì)將其判斷為狗,或者其它由黑客悄悄植入的內(nèi)容。如此一來,攻擊者將能夠通過篡改路牌干擾目前的自動(dòng)駕駛車輛。未來的新型人工智能系統(tǒng)必須有能力解決這類黑客活動(dòng),從而全面替代深度學(xué)習(xí)類方法。
高人氣深度學(xué)習(xí)庫Keras作者在他撰寫的《深度學(xué)習(xí)的局限性》一文中提到:“深度學(xué)習(xí)惟一的真正成功之處,在于其能夠利用大量人類注釋數(shù)據(jù)通過連續(xù)的幾何變換將空間X映射至空間Y。”這些空間當(dāng)中包含諸多維度——而不僅僅是三維,因此深度學(xué)習(xí)能夠模仿畢加索的藝術(shù)風(fēng)格、學(xué)習(xí)如何在德州撲克比賽中虛張聲勢(shì),并完成其它一些能夠體現(xiàn)人類創(chuàng)造性的任務(wù)。
但從外行的角度來講,我認(rèn)為這同時(shí)意味著深度學(xué)習(xí)會(huì)在不理解什么是貓的前提下通過訓(xùn)練學(xué)會(huì)如何識(shí)別照片中的貓,也能夠在不清楚種族主義為何物的前提下抱有種族主義傾向。雖然這并不影響深度學(xué)習(xí)成功識(shí)別出貓、抱有種族主義傾向或者刻比賽,但其在根本上與人類的判斷方式仍然相去甚遠(yuǎn)。
在《深度學(xué)習(xí)的未來》一文中,Keras庫的作者描述了他對(duì)于深度學(xué)習(xí)系統(tǒng)只能在“幾何模塊”中才能同目前尚不存在的潛在未來“算法模塊”與“元學(xué)習(xí)方法”進(jìn)行交互的設(shè)想。雖然這種方法能夠增加可解決任務(wù)的數(shù)量與類型,但仍然無法解釋深度學(xué)習(xí)模塊所作出的具體決策。
正如我們無法用言語來解釋我們大腦當(dāng)中計(jì)算得出的某種感覺或者圖像一樣,人類雖然能夠給出一定的說明,但其往往只是一種自認(rèn)為準(zhǔn)確的簡單化借口。在這樣的前提下,要求機(jī)器作出非常準(zhǔn)確的解釋反而不太公平。
在另一方面,也有不少專家在努力構(gòu)建起非深度學(xué)習(xí)型人工智能系統(tǒng),但他們面臨著缺乏資金的窘境——畢竟目前大家的投入重點(diǎn)仍然集中在深度學(xué)習(xí)身上,而這種狂熱的態(tài)勢(shì)仍將持續(xù)一段時(shí)間。沒人知道人工智能的下一波浪潮何時(shí)才會(huì)到來,但我認(rèn)為其不太可能體現(xiàn)為深度學(xué)習(xí)2.0。
眼于整個(gè)人工智能與機(jī)器學(xué)習(xí)領(lǐng)域
深度學(xué)習(xí)之所以得到廣泛的關(guān)注與炒作,主要是因?yàn)槟切╀N售深度學(xué)習(xí)軟件與硬件的廠商的推波助瀾。作為另一個(gè)角度的證明,大家可能會(huì)發(fā)現(xiàn),并沒有心理學(xué)家或者哲學(xué)家這類“自然智能”專家群體對(duì)深度學(xué)習(xí)提出支持。
如果大家并不急于在人工智能領(lǐng)域一試身手,或者沒有太多時(shí)間投身其中,那么不妨跳過嘗試學(xué)習(xí)1.0并等待人工智能系統(tǒng)的下一波變革——畢竟只有成熟的技術(shù)才值得我們進(jìn)行學(xué)習(xí)。但如果您需要盡快掌握人工智能技術(shù),那么請(qǐng)務(wù)必著眼于整個(gè)人工智能與機(jī)器學(xué)習(xí)領(lǐng)域,而非單純關(guān)注深度學(xué)習(xí)。
【51CTO譯稿,合作站點(diǎn)轉(zhuǎn)載請(qǐng)注明原文譯者和出處為51CTO.com】