掌握地球?智能機(jī)器帶來(lái)的真正風(fēng)險(xiǎn)
作者:Abhimanyu Dubey
翻譯:吳蕾、霍靜、任杰
當(dāng)人們問(wèn)我是做什么工作的時(shí)候,我總是非常困惑如何回答才好。“人工智能”這個(gè)答復(fù)吧,我覺(jué)得太寬泛了,而“圖像識(shí)別”似乎又太專(zhuān)業(yè)了。不過(guò)呢,還是下面這個(gè)問(wèn)題令我真正抓狂:
人工智能會(huì)掌控整個(gè)地球嗎?
對(duì)于一名從事于機(jī)器智能研究的專(zhuān)業(yè)人士來(lái)說(shuō),這個(gè)問(wèn)題太讓我惱火了。我也不想去抱怨懷疑論者,事實(shí)上大部分人都覺(jué)得人工智能是一種神秘,而且有著無(wú)窮無(wú)盡陰謀詭計(jì)的玩意兒,最終它們會(huì)把人類(lèi)滅絕,因?yàn)?,它能夠在我們狂看一晚Evan Goldberg編導(dǎo)的電影之后,就預(yù)測(cè)到下一部我們將觀看的影片將會(huì)是《Sausage Party》(《香腸派對(duì)》)。
“然而,大多數(shù)人并沒(méi)有意識(shí)到,無(wú)論我們認(rèn)為自己多么有個(gè)性,多么特殊,從普遍意義上來(lái)看,人們還是遵循一些普遍行為模式的。只要經(jīng)過(guò)足夠多訓(xùn)練,計(jì)算機(jī)就可以輕松識(shí)別出人們的行為模式。”
因此,機(jī)器能推測(cè)你喜歡的音樂(lè),或者給你一些手機(jī)APP應(yīng)用的建議,這對(duì)機(jī)器來(lái)說(shuō)很容易實(shí)現(xiàn)。不過(guò),這并不代表所有的預(yù)測(cè)工作的難度和性質(zhì)類(lèi)似,我只是希望大家能理解,這相對(duì)于人類(lèi)的能力來(lái)說(shuō)是一種延伸和拓展。
要想了解時(shí)下人工智能領(lǐng)域中哪些技術(shù)很厲害,重點(diǎn)在于懂得機(jī)器學(xué)習(xí)做得不錯(cuò)的兩個(gè)主要場(chǎng)景:
- 受控環(huán)境
- 監(jiān)督
我們看到了Google的人工圍棋選手AlphaGo打敗了人類(lèi)最厲害的圍棋選手,計(jì)算機(jī)象棋的問(wèn)題很早以前就已經(jīng)解決了,而最近又有很多論文在探討Doom游戲比賽中擊敗人類(lèi)的話題。事實(shí)上,在游戲里面,你能夠完全掌控操作環(huán)境、能夠?qū)嵤┑男袨橐约翱赡墚a(chǎn)生的結(jié)果,這使得建模變得相當(dāng)容易。而一旦我們能夠?qū)⒂螒颦h(huán)境進(jìn)行建模,下一步任務(wù)就是模擬和學(xué)習(xí)。實(shí)際上,這些理論早就已經(jīng)成熟了,正是近年來(lái)計(jì)算機(jī)硬件的發(fā)展使大規(guī)模機(jī)器學(xué)習(xí)得以實(shí)現(xiàn),才能夠令A(yù)lphaGo這類(lèi)技術(shù)在實(shí)現(xiàn)層面上獲得重大突破。
監(jiān)督式受控環(huán)境表示對(duì)于每一個(gè)行為,你能夠估計(jì)出可能受到的懲罰,從而能夠有效地從錯(cuò)誤中積累經(jīng)驗(yàn),而游戲正是這種監(jiān)督式受控環(huán)境的完美表達(dá)。還有一個(gè)例子就是我們剛才提到的電影預(yù)測(cè),可以理解為有一個(gè)很大的樣本,里面存在“用戶”和“影片”兩類(lèi)數(shù)據(jù),還有一個(gè)給定的用戶選擇模型。通過(guò)這些,我們就能進(jìn)行下一次看什么電影的預(yù)測(cè)。
在監(jiān)督式受控環(huán)境中,我們知道會(huì)得到何種信息,并能夠?qū)︻?lèi)似的信息加以處理。我們可以對(duì)這類(lèi)目標(biāo)創(chuàng)建“表達(dá)法”(representation),在我們需要進(jìn)行預(yù)測(cè)的時(shí)候,這些“表達(dá)法”能夠幫助我們最終確定準(zhǔn)確的計(jì)算模型。這是通用學(xué)習(xí)類(lèi)型中的一個(gè)非常狹窄的子類(lèi),也是和我們?nèi)祟?lèi)差不多的一類(lèi)智能方式。
圖注:分類(lèi)器概觀
然而,大部分的人類(lèi)行為并非監(jiān)督式的,而是在與環(huán)境交互的基礎(chǔ)上建立的邏輯和直覺(jué)。人類(lèi)的基本活動(dòng),比如說(shuō)識(shí)別物體,理解物理過(guò)程都是時(shí)常發(fā)生的事情。通常,我們通過(guò)與事物的互動(dòng)能習(xí)得很多的新知。
在當(dāng)前階段,這對(duì)于計(jì)算機(jī)來(lái)說(shuō)還是很難達(dá)到的水平?,F(xiàn)在如果你要一臺(tái)機(jī)器能認(rèn)識(shí)所有你給的圖片里面的汽車(chē),你必須告訴機(jī)器先去看那些圖片,還得告訴它你的汽車(chē)是什么樣子的。當(dāng)你給機(jī)器看了大量汽車(chē)圖片時(shí),它就能認(rèn)出汽車(chē)了。這就是監(jiān)督式學(xué)習(xí),在它尚未理解看什么東西的時(shí)候,你得教它汽車(chē)是什么樣子的。
現(xiàn)在,計(jì)算機(jī)科學(xué)家在努力使這種學(xué)習(xí)變成幾乎無(wú)需監(jiān)督的,即非監(jiān)督式學(xué)習(xí)。最終,我們希望機(jī)器能夠理解物體和景象的概念本身,而不需要特地去調(diào)教它。
當(dāng)前大多數(shù)研究的重心在于非監(jiān)督式學(xué)習(xí),解決這個(gè)問(wèn)題更加困難。誠(chéng)然,我們的機(jī)器看上去更聰明了,不過(guò)大多數(shù)都是在監(jiān)督式受控環(huán)境中的情況。首先我們必須能令機(jī)器人在非監(jiān)督的環(huán)境下正常工作,然后再考慮系統(tǒng)在非受控的情形下運(yùn)行,這樣才更為接近人類(lèi)的智能。
“盡管,現(xiàn)在探討機(jī)器滅絕人類(lèi),或者是機(jī)器人的‘不良企圖’仍為時(shí)尚早。然而,人工智能更嚴(yán)峻的威脅正悄然逼近,這可能造成極其嚴(yán)重的后果”。
早先通過(guò)觀察特定的特性的算法稱(chēng)為決策樹(shù)分割數(shù)據(jù)
在這個(gè)會(huì)議的最初討論時(shí),我導(dǎo)師曾提到了一個(gè)問(wèn)題,令我第一次真正質(zhì)疑人工智能的可用性。早期傳統(tǒng)的人工智能技術(shù)的算法很容易理解,比如說(shuō),我們要造一個(gè)機(jī)器來(lái)測(cè)量人的身高和體重,并告訴他們是不是超重了。這個(gè)很簡(jiǎn)單,我們只需要計(jì)算出這個(gè)人的體重指數(shù)(Body Mass Index, BMI),如果超過(guò)了特定閾限,那就是超重。這是人工智能的原型算法。如果我說(shuō)某人肥胖,這是必須要有合理的判斷的(而不是熊孩子罵人),這個(gè)人的BMI確實(shí)是落在超重人群的平均BMI范圍里。
現(xiàn)在大多數(shù)的機(jī)器已經(jīng)不是這么簡(jiǎn)單了,它們采用大量復(fù)雜的數(shù)據(jù)作為輸入(比如高清晰度的圖片),經(jīng)過(guò)非常精細(xì)粒度的算法來(lái)完成輸出。這樣的話,簡(jiǎn)單的閾限或決策樹(shù)的方法就不夠用了。漸漸地,系統(tǒng)采用了一套廣為人知的深度學(xué)習(xí)算法,去識(shí)別和學(xué)習(xí)大量數(shù)據(jù),用類(lèi)似于人類(lèi)的方式去細(xì)化模板。
圖注:典型的深度學(xué)習(xí)模型。它包含了若干個(gè)互相連通傳播信息的神經(jīng)元(圓圈),這與已發(fā)現(xiàn)的人腦運(yùn)作模式十分相似
這些系統(tǒng)性能非常好,但是學(xué)習(xí)過(guò)程很慢,因?yàn)樾枰芏鄶?shù)據(jù)來(lái)學(xué)習(xí)。
“但是,有個(gè)問(wèn)題:一旦它們給了我們結(jié)果,不管正確與否,我們并不知道機(jī)器是怎么得到這個(gè)結(jié)果的。”
這個(gè)聽(tīng)起來(lái)并不是那么要緊—在開(kāi)始的時(shí)候,在機(jī)器學(xué)習(xí)系統(tǒng)里面,我們有兩種類(lèi)型的數(shù)據(jù)—特征和標(biāo)簽。特征是觀察到的變量,標(biāo)簽是我們需要預(yù)測(cè)的。舉個(gè)例子,在之前的肥胖癥檢測(cè)器中,我們的特征是人的身高和體重,標(biāo)簽是每個(gè)人的超重或者健康指標(biāo)。為了從圖片中檢測(cè)癌癥細(xì)胞,特征是若干張器官的圖像,標(biāo)簽是圖片有沒(méi)有癌癥細(xì)胞。
癌癥檢測(cè)算法會(huì)先掃描這組圖片
機(jī)器學(xué)習(xí)算法一般會(huì)這樣解決問(wèn)題,先給每個(gè)特征配置權(quán)重,相加,最后基于所得的和來(lái)做決定。比如,如果你要預(yù)測(cè)一個(gè)蘋(píng)果是不是壞了,你會(huì)先看蘋(píng)果的氣味、顏色,如果觸摸一下那么就還有它的質(zhì)感,最后大腦會(huì)配置給這些特征不同的權(quán)重。
假如蘋(píng)果爛了,光憑顏色一個(gè)特征就可以解決問(wèn)題了
計(jì)算機(jī)遵循類(lèi)似的想法,只不過(guò)權(quán)重是通過(guò)不同的優(yōu)化算法算出來(lái)的。但是,在深度學(xué)習(xí)中,我們并不確定我們想用哪些具體的特征,更不用說(shuō)配置權(quán)重。所以我們?cè)趺崔k?我們讓計(jì)算機(jī)自己學(xué)習(xí)選出最好的特征群,把它們用最佳方式組合來(lái)做決定,從某種意義上模擬人類(lèi)大腦的做法。
這個(gè)主意給我們帶來(lái)驚人的結(jié)果—在計(jì)算機(jī)視覺(jué)領(lǐng)域(這個(gè)領(lǐng)域研究如何讓計(jì)算機(jī)理解圖像數(shù)據(jù)),尤其是隨著高效GPU和新框架的出現(xiàn),使學(xué)習(xí)基本的圖像級(jí)別的概念變得小菜一碟。但是,要注意的是—我們討論的這些機(jī)器通過(guò)學(xué)習(xí)選出的特征,物理意義并不像傳統(tǒng)方法那么直觀。
這些例子展示了計(jì)算機(jī)從圖片中尋找的東西—看上去它們?cè)跈z測(cè)形狀,但是對(duì)于非圖像數(shù)據(jù),并不是這么直觀。
大部分人不覺(jué)得這是個(gè)問(wèn)題—從技術(shù)角度在現(xiàn)階段這并不是一個(gè)大問(wèn)題,因?yàn)楝F(xiàn)在人工智能解決的任務(wù)都是具體的,比如從圖片中辨認(rèn)人物和物體、臉部追蹤以及合成聲音信號(hào)。我們大致知道算法在學(xué)習(xí)什么樣的物體(事實(shí)上,這個(gè)展示是這個(gè)方面的一個(gè)最近的發(fā)展)。但是,當(dāng)我們使用深度學(xué)習(xí)來(lái)處理那些有更多風(fēng)險(xiǎn)的預(yù)測(cè)的時(shí)候,每個(gè)預(yù)測(cè)都需要合情合理,可以解釋。
設(shè)想你是一家銀行,你有所有客戶詳細(xì)的交易信息和信用歷史。你使用一個(gè)復(fù)雜的深度學(xué)習(xí)算法來(lái)找出拖欠貸款者。既然你已經(jīng)有了一個(gè)大型數(shù)據(jù)庫(kù)囊括用戶的各類(lèi)行為模式信息,算法解決這個(gè)問(wèn)題可能會(huì)給出很高的準(zhǔn)確率,但是,一旦你懷疑未來(lái)的拖欠者,你并不確切的知道到底是什么引起了懷疑,對(duì)于預(yù)測(cè)的解釋變得非常困難。
大部分的深度學(xué)習(xí)系統(tǒng)沒(méi)有好的技術(shù)去理解它們的決策能力,這個(gè)也是研究的熱點(diǎn)。對(duì)于某些與特定任務(wù)相關(guān)的深度網(wǎng)絡(luò),尤其在計(jì)算機(jī)視覺(jué),我們?cè)诶斫膺@些系統(tǒng)上已經(jīng)有了很大的進(jìn)步—對(duì)其較好的定位,理解是什么激發(fā)產(chǎn)生了一種算法以及算法是否確實(shí)(按照我們的理解)這么做了。但是總的來(lái)說(shuō),還是有很大的空間需要提高。
機(jī)器學(xué)習(xí)有個(gè)很?chē)?yán)重的缺陷—為了把信號(hào)和噪聲分開(kāi),需要很多人工處理?;蛘哂脤?zhuān)業(yè)的話說(shuō),過(guò)擬合。我說(shuō)這個(gè)專(zhuān)業(yè)詞的意思是,當(dāng)一個(gè)模型要擬合一個(gè)特定的數(shù)據(jù)集,用以預(yù)測(cè)新的未知的數(shù)據(jù),它可能對(duì)于已知數(shù)據(jù)擬合的過(guò)于完美。所以導(dǎo)致的結(jié)果是,當(dāng)應(yīng)用于現(xiàn)實(shí)世界的時(shí)候,它就不會(huì)那么準(zhǔn)確。
具體來(lái)講,模型不是學(xué)習(xí)在這個(gè)世界中確實(shí)存在的模式,而是學(xué)習(xí)已經(jīng)采集數(shù)據(jù)集的模式。有幾種方式可以理解過(guò)擬合,對(duì)于感興趣的人現(xiàn)實(shí)中有很多的關(guān)于過(guò)擬合的例子。一個(gè)簡(jiǎn)單的例子就是在你居住的地方是夏天,所以你把自己的行李箱裝滿了夏天的衣服,結(jié)果在阿姆斯特丹只有11度,你在那里只能冷的瑟瑟發(fā)抖。
該圖反映了過(guò)擬合的情況,即,最后一幅圖顯然對(duì)噪音也進(jìn)行了擬合
關(guān)注過(guò)擬合問(wèn)題的原因是想強(qiáng)調(diào)一下機(jī)器學(xué)習(xí)的可解釋性的重要性。如果我們不能理解這些機(jī)器學(xué)習(xí)算法到底學(xué)習(xí)的是什么,我們并不能判斷它們是不是過(guò)擬合了。舉個(gè)例子說(shuō),某機(jī)器算法是根據(jù)上網(wǎng)瀏覽歷史來(lái)預(yù)測(cè)可疑的上網(wǎng)行為。因?yàn)槭褂玫拇蟛糠值挠?xùn)練數(shù)據(jù)是來(lái)自美國(guó)的19歲少年,那么用于預(yù)測(cè)美國(guó)的19歲少年以外的任何個(gè)體就會(huì)是有偏的,盡管他們的搜索歷史都有PewDiePie (專(zhuān)注恐怖與動(dòng)作游戲)的視頻。
這個(gè)問(wèn)題的反響會(huì)隨著深度學(xué)習(xí)在推斷任務(wù)中的應(yīng)用增加而迅速加大。比如,我們看到很多研究關(guān)于醫(yī)療圖像預(yù)測(cè) – 這個(gè)應(yīng)用需要更多的可解釋性和可理解性。除此之外,假如預(yù)測(cè)任務(wù)的批量太大不可能去人工檢查預(yù)測(cè)結(jié)果,我們就需要系統(tǒng)來(lái)幫我們理解和調(diào)整機(jī)器學(xué)習(xí)到底做了什么。
這個(gè)威脅剛剛出現(xiàn),但是這個(gè)方面的研究需要更多的時(shí)間,來(lái)找到更好的解決辦法。但是,我們必須意識(shí)到模型可解釋性的重要性,尤其當(dāng)我們建立模型是為了讓生活變得更好。
我想用一個(gè)例子來(lái)結(jié)尾:如果一個(gè)人撞車(chē)了,我們可以找出原因,來(lái)理解事故是怎么發(fā)生的 – 也許司機(jī)喝醉了,也許路人正邊端著熱飲邊發(fā)短信呢。
但是如果無(wú)人駕駛車(chē)撞到另外一輛車(chē),致一名乘客死亡,我們?nèi)フ艺l(shuí)呢?原因又是什么呢?你怎么保證它不會(huì)再發(fā)生呢?
這些事故最近發(fā)生過(guò)幾次,隨著更多的人工智能系統(tǒng)的出現(xiàn),會(huì)有更多的失誤發(fā)生。為了更好的改正,我們需要理解到底哪里出了問(wèn)題:這是今天人工智能要面臨的主要挑戰(zhàn)之一。
【本文是51CTO專(zhuān)欄機(jī)構(gòu)大數(shù)據(jù)文摘的原創(chuàng)譯文,微信公眾號(hào)“大數(shù)據(jù)文摘( id: BigDataDigest)”】