譯者 | 晶顏
審校 | 重樓
量子計(jì)算、神經(jīng)形態(tài)芯片和其他技術(shù)正悄悄地將機(jī)器學(xué)習(xí)推向深不可測(cè)的新高度。
機(jī)器學(xué)習(xí)在短時(shí)間內(nèi)取得了長(zhǎng)足進(jìn)步,似乎每天我們都會(huì)聽到有關(guān)人工智能(AI)能力的新突破。但即使有這么多炒作,一些改變游戲規(guī)則的進(jìn)步最初卻往往被忽視。
無(wú)論是在國(guó)際象棋和圍棋上戰(zhàn)勝人類大師,創(chuàng)作新的視頻游戲配樂(lè),還是在診斷癌癥方面擊敗醫(yī)生,人工智能顯然已經(jīng)不再只是科學(xué)幻想。但即便如此,我們實(shí)際上也只是觸及了各種可能性的“冰山一角”。
機(jī)器學(xué)習(xí)在數(shù)據(jù)、計(jì)算能力、可解釋性等方面仍然面臨一些基本限制。但這正是這些新興創(chuàng)新讓人們?nèi)绱伺d奮的原因。它們可以打破現(xiàn)有的限制,為人工智能開辟一個(gè)我們今天幾乎無(wú)法想象的新應(yīng)用世界。
在探索這個(gè)新世界之前,讓我們先回顧一下機(jī)器學(xué)習(xí)。
機(jī)器學(xué)習(xí)的演進(jìn)
機(jī)器學(xué)習(xí)一夜成名。第一個(gè)神經(jīng)網(wǎng)絡(luò)出現(xiàn)在1958年!但是,當(dāng)研究人員意識(shí)到殘酷的數(shù)據(jù)和計(jì)算需求時(shí),早期的樂(lè)觀情緒很快就消失了。
這些原始的“感知機(jī)”(Perceptrons)在能力上很快就遇到了瓶頸??爝M(jìn)到80年代,由于有了更先進(jìn)的模型,人們的興趣又開始回升。但在學(xué)術(shù)界之外,機(jī)器學(xué)習(xí)仍然是相當(dāng)小眾的領(lǐng)域。此時(shí),它對(duì)大多數(shù)企業(yè)來(lái)說(shuō)還不是很方便或有用。
云計(jì)算,像TensorFlow這樣的開源框架,以及由網(wǎng)絡(luò)釋放的大量數(shù)據(jù)集,都完全改變了游戲規(guī)則。當(dāng)你把它與功能強(qiáng)大的現(xiàn)代硬件結(jié)合起來(lái)時(shí),機(jī)器學(xué)習(xí)終于在2010年代實(shí)現(xiàn)了騰飛。盡管如此,今天的機(jī)器學(xué)習(xí)仍有明顯的缺陷:算法吸收了大量的數(shù)據(jù),但提供了很少的透明度。
它們需要艱辛的人類工程,而且在狹義的任務(wù)范圍之外,表現(xiàn)是脆弱的。雖然視覺和語(yǔ)音識(shí)別繼續(xù)快速發(fā)展,但像情商、社交技能和抽象推理等領(lǐng)域仍然嚴(yán)重缺乏。即使是在新環(huán)境中的導(dǎo)航也能難倒今天的機(jī)器人!顯然,我們需要的不僅僅是漸進(jìn)式的進(jìn)步來(lái)推動(dòng)人工智能進(jìn)入下一個(gè)階段。我們需要量子飛躍——完全不同的技術(shù)將我們“彈射”至未來(lái)。
量子機(jī)器學(xué)習(xí):一場(chǎng)恐怖的革命?
好了,是時(shí)候來(lái)點(diǎn)科幻了。當(dāng)提及“量子機(jī)器學(xué)習(xí)”(Quantum Machine Learning)時(shí),你的腦海中可能會(huì)浮現(xiàn)《黑客帝國(guó)》中的幽靈圖像。但是這里的“量子”究竟是什么意思呢?簡(jiǎn)而言之,量子計(jì)算機(jī)利用奇異的物理現(xiàn)象(如糾纏和疊加),以即使是最強(qiáng)大的超級(jí)計(jì)算機(jī)也無(wú)法觸及的方式處理信息。
這里就不贅述“量子力學(xué)”的概念了,但關(guān)鍵的思想是量子計(jì)算機(jī)并不局限于二進(jìn)制位,它可以并行地探索廣闊的可能性空間?!疤剿骺赡苄浴?,這聽起來(lái)跟機(jī)器學(xué)習(xí)的理念不謀而合!這正是量子計(jì)算能讓機(jī)器學(xué)習(xí)研究人員如此興奮的原因。
對(duì)于量子計(jì)算機(jī)來(lái)說(shuō),某些阻礙傳統(tǒng)硬件的優(yōu)化問(wèn)題變得輕而易舉。利用量子效應(yīng),像格羅弗搜索(Grover Search)和量子退火(Quantum Annealing,一種利用量子隧穿效應(yīng)尋找全局最優(yōu)解的技術(shù))這樣的算法可以比經(jīng)典方法更快地發(fā)現(xiàn)隱藏在巨大數(shù)據(jù)集中的模式。
制藥研究人員已經(jīng)在實(shí)際藥物數(shù)據(jù)上使用量子算法來(lái)分析分子間的相互作用。這一結(jié)果無(wú)疑是令人興奮的。展望未來(lái),量子人工智能還將為醫(yī)學(xué)生產(chǎn)出全新的化合物,或者譜寫出我們從未聽過(guò)的永恒旋律。
當(dāng)然,量子計(jì)算仍處于萌芽階段。我們還需要幾年的時(shí)間才能獲得足夠穩(wěn)定的量子比特來(lái)運(yùn)行先進(jìn)的人工智能應(yīng)用程序。當(dāng)然,也不是所有的機(jī)器學(xué)習(xí)技術(shù)都能完美地轉(zhuǎn)化為量子平臺(tái)。但如果我們克服了工程上的障礙,量子人工智能可以以驚人的速度和準(zhǔn)確性承擔(dān)從疾病診斷到天氣預(yù)報(bào)的任何事情。
神經(jīng)形態(tài)計(jì)算:芯片能模擬大腦嗎?
現(xiàn)在,我們來(lái)看一種不那么令人費(fèi)解但同樣具有變革意義的技術(shù)——神經(jīng)形態(tài)計(jì)算(Neuromorphic Computing)。下一個(gè)趨勢(shì)不是量子怪誕性(Quantum Weirdness),而是試圖用微芯片模擬我們的生物大腦。
人類的大腦可以毫不費(fèi)力地處理讓AI費(fèi)解的復(fù)雜的模式識(shí)別和學(xué)習(xí)任務(wù)。神經(jīng)形態(tài)芯片旨在通過(guò)物理上類似神經(jīng)網(wǎng)絡(luò)的電路來(lái)模擬大腦的大規(guī)模并行結(jié)構(gòu)。
這個(gè)領(lǐng)域的領(lǐng)先項(xiàng)目甚至結(jié)合了突觸可塑性和脈沖信號(hào)來(lái)傳遞數(shù)據(jù)。最終結(jié)果是快速模式識(shí)別以及超低功耗。這種神經(jīng)形態(tài)的方法可以為我們提供所需的震動(dòng),以開發(fā)更靈活的類人智能。想象一下,可以根據(jù)面部線索感知情緒的交互式助手,或者像動(dòng)物一樣本能地在陌生地方導(dǎo)航的機(jī)器人。與量子計(jì)算一樣,神經(jīng)形態(tài)硬件仍處于高度實(shí)驗(yàn)階段。
與經(jīng)過(guò)市場(chǎng)驗(yàn)證的GPU和張量處理單元(Tensor Processing Units)相比,未經(jīng)驗(yàn)證的新架構(gòu)通常面臨著大規(guī)模采用的困局。但就神經(jīng)形態(tài)計(jì)算而言,一切冒險(xiǎn)都將是值得的。Darpa、IBM和英特爾實(shí)驗(yàn)室的項(xiàng)目就很好地證明了這一點(diǎn)。
聯(lián)邦學(xué)習(xí):將人工智能帶給人們
我們的人工智能創(chuàng)新之旅已經(jīng)進(jìn)行了一半,讓我們換個(gè)話題,談?wù)勡浖矫娴耐黄疲簿褪撬^的聯(lián)邦學(xué)習(xí)(Federated Learning)?,F(xiàn)在,技術(shù)人員可能知道機(jī)器學(xué)習(xí)會(huì)吞噬數(shù)據(jù),而且還是海量的數(shù)據(jù)。
當(dāng)涉及敏感數(shù)據(jù)(如醫(yī)療記錄)時(shí),問(wèn)題就出現(xiàn)了。嚴(yán)格的隱私法意味著醫(yī)院通常不能輕易匯集患者數(shù)據(jù)來(lái)訓(xùn)練共享模型——即使它可以挽救生命。
傳統(tǒng)上,數(shù)據(jù)科學(xué)家必須在強(qiáng)大的集中式人工智能和局部缺陷模型之間做出艱難抉擇。不過(guò),無(wú)論哪種選擇都不能盡如人意。聯(lián)邦學(xué)習(xí)的出現(xiàn)很好地解決了這一問(wèn)題。它允許組織在不共享原始私有數(shù)據(jù)的情況下協(xié)作訓(xùn)練高質(zhì)量的模型,其本質(zhì)上是點(diǎn)對(duì)點(diǎn)發(fā)送算法模型更新,而不是將敏感數(shù)據(jù)傳輸?shù)街醒敕?wù)器。
領(lǐng)先的研究人員認(rèn)為,在本世紀(jì)20年代及以后,私人聯(lián)邦學(xué)習(xí)將為醫(yī)學(xué)、金融、生物識(shí)別等領(lǐng)域開啟改變生活的人工智能。當(dāng)然,濫用仍然會(huì)損害隱私。反對(duì)者還認(rèn)為,它比集中式方法效率低。也許吧,但通過(guò)將協(xié)作式人工智能安全地帶入落后的醫(yī)院和銀行,我認(rèn)為聯(lián)邦學(xué)習(xí)是一場(chǎng)勝利!
小樣本學(xué)習(xí):“健忘癥”AI?
至此,你可能想知道人工智能研究人員是否還有其他瘋狂的想法。當(dāng)然,畢竟我們還沒說(shuō)到“小樣本學(xué)習(xí)”(few-shot learning)呢!你可能以為我要抱怨人工智能所謂的金魚記憶了,但事實(shí)恰恰相反。
今天的模式饑渴型(pattern-hungry)神經(jīng)網(wǎng)絡(luò)面臨的一個(gè)巨大限制是它們對(duì)標(biāo)記訓(xùn)練數(shù)據(jù)的無(wú)盡需求。構(gòu)建有能力的圖像和語(yǔ)言模型需要將算法暴露于數(shù)百萬(wàn)個(gè)高質(zhì)量的示例中。對(duì)于許多應(yīng)用程序來(lái)說(shuō),組裝大量數(shù)據(jù)集是不可行的。這就是小樣本學(xué)習(xí)可以發(fā)揮作用的地方!
避免繁重的數(shù)據(jù)集編碼和無(wú)休止的重復(fù)訓(xùn)練。小樣本學(xué)習(xí)使模型能夠熟練地從少量樣本中分類新概念。
還記得你的大腦是如何在幾次接觸后輕松識(shí)別新的動(dòng)物或語(yǔ)言的嗎?“小樣本學(xué)習(xí)”的目標(biāo)是為機(jī)器帶來(lái)這種通用的、采樣效率高的智能。
研究人員報(bào)告稱已經(jīng)在使用快速積累知識(shí)的專業(yè)神經(jīng)網(wǎng)絡(luò)架構(gòu)方面實(shí)現(xiàn)了新突破。令人難以置信的是,一些計(jì)算機(jī)視覺模型可以在觀看一兩張圖像后準(zhǔn)確地分類看不見的物體類別!
想象一下,這對(duì)衛(wèi)星圖像分析、醫(yī)學(xué)甚至是有限參考圖像的藝術(shù)修復(fù)的影響。當(dāng)然,懷疑者警告說(shuō),小樣本方法仍然無(wú)法與無(wú)限制數(shù)據(jù)的性能飽和模型相匹配。
不過(guò),先別就此氣餒!如果說(shuō)過(guò)去十年機(jī)器學(xué)習(xí)的進(jìn)步教會(huì)了我們什么,那就是永遠(yuǎn)不要低估研究人員的聰明才智。
可解釋性AI:不再有黑匣子的借口了?
最后,我有一個(gè)更令人振奮的創(chuàng)新要分享,但需要提醒的是,最后一個(gè)存在一些爭(zhēng)議。到目前為止,我們已經(jīng)介紹了解決ML在速度、效率和數(shù)據(jù)需求等方面限制的前沿進(jìn)展。
但許多專家認(rèn)為,如今的算法存在一個(gè)更大的缺陷——缺乏透明度。批評(píng)者抱怨神經(jīng)網(wǎng)絡(luò)是難以理解的“黑匣子”,甚至設(shè)計(jì)師也很難追溯其預(yù)測(cè)和建議背后的邏輯。
立法者對(duì)不透明的人工智能決策的社會(huì)后果持謹(jǐn)慎態(tài)度。如果我們根本不知道這些模型是如何運(yùn)行的,我們?nèi)绾文鼙WC問(wèn)責(zé)制呢?面對(duì)這種情況,研究人員并未選擇擺爛,為復(fù)雜性辯護(hù),而是正面解決了黑箱困境,讓人工智能邁入了可解釋的新領(lǐng)域。
可解釋性人工智能(Explainable AI,簡(jiǎn)稱XAI)包含了一些巧妙的技術(shù),本質(zhì)上是對(duì)機(jī)器學(xué)習(xí)模型的內(nèi)部工作原理進(jìn)行逆向工程。XAI工具包中的工具范圍從敏感性分析到精確定位有影響的訓(xùn)練數(shù)據(jù)的技術(shù)。它甚至包括生成模型邏輯的自然語(yǔ)言解釋的算法。
不要誤解我的意思——考慮到最先進(jìn)模型的復(fù)雜性,可解釋性人工智能仍然是一個(gè)令人難以置信的雄心勃勃的目標(biāo)。但恢復(fù)透明度的穩(wěn)步進(jìn)展讓我感到樂(lè)觀??山忉屝匀斯ぶ悄懿粌H可以緩解合規(guī)性壓力,還可以嗅出隱藏的偏見,建立公眾信任。這些見解可能會(huì)為下一代機(jī)器學(xué)習(xí)算法打開思路。
人工智能的未來(lái)——即將到來(lái)的融合
我們剛剛講了很多內(nèi)容,希望你已經(jīng)瞥見了當(dāng)今主流人工智能表面下一些令人興奮的進(jìn)展。
但即便如此,我們也只是觸及了表面。我甚至沒有談到3D機(jī)器學(xué)習(xí)、GAN創(chuàng)造力等方面的創(chuàng)新!現(xiàn)在,你可能想知道,這么多的進(jìn)步同時(shí)進(jìn)行,我們?nèi)绾卫斫膺@一切?
這個(gè)問(wèn)題問(wèn)得好。我認(rèn)為最令人興奮的可能性實(shí)際上來(lái)自于多種技術(shù)協(xié)同作用的交匯點(diǎn)。例如,將小樣本學(xué)習(xí)與量子優(yōu)化相結(jié)合實(shí)際上可以消除某些應(yīng)用程序的數(shù)據(jù)障礙。神經(jīng)形態(tài)芯片可能解鎖曾經(jīng)被計(jì)算瓶頸阻礙的能力。
可解釋的接口對(duì)于解釋量子算法或解碼的大腦活動(dòng)至關(guān)重要。為尚未證實(shí)的技術(shù)繪制開發(fā)路線圖是很棘手的。但我認(rèn)為,與這些突破對(duì)未來(lái)社會(huì)可能產(chǎn)生的劃時(shí)代意義相比,這些挑戰(zhàn)都顯得蒼白無(wú)力。
我們需要深思熟慮地解決偏見、自動(dòng)化等方面的風(fēng)險(xiǎn)。但如果引導(dǎo)謹(jǐn)慎,將互補(bǔ)的量子、神經(jīng)、聯(lián)邦和其他學(xué)習(xí)方法結(jié)合起來(lái),可能會(huì)催化人工智能的復(fù)興,為人類進(jìn)步積聚數(shù)十年的動(dòng)力。
結(jié)語(yǔ)
我們探索的創(chuàng)新——從量子機(jī)器學(xué)習(xí)到可解釋性人工智能——突顯了人工智能領(lǐng)域的發(fā)展速度有多快。每一項(xiàng)技術(shù)突破都有可能打破限制當(dāng)前人工智能系統(tǒng)的障礙。它們有望共同開創(chuàng)一個(gè)前所未有的機(jī)器學(xué)習(xí)能力時(shí)代。
然而,如此強(qiáng)大的力量也帶來(lái)了巨大的責(zé)任。當(dāng)我們將機(jī)器推向未知的智能領(lǐng)域時(shí),我們必須在如何開發(fā)和部署這些技術(shù)方面保持謹(jǐn)慎和道德。深思熟慮的治理、問(wèn)責(zé)措施和社會(huì)意識(shí)對(duì)于確保繁榮和公平地分享人工智能的利益,同時(shí)降低風(fēng)險(xiǎn)至關(guān)重要。
如果我們明智地引導(dǎo)進(jìn)步,這場(chǎng)多維度的人工智能革命可以使我們以前所未有的方式蓬勃發(fā)展。從個(gè)性化醫(yī)療保健到清潔能源等領(lǐng)域,量子、神經(jīng)和其他機(jī)器學(xué)習(xí)領(lǐng)域的融合突破可能很快就會(huì)幫助人類解決最棘手的挑戰(zhàn)。
原文標(biāo)題:Quantum leaps in machine learning: Pushing the boundaries of AI capabilities,作者:Shafeeq Rahaman