算法的智能化升級(jí)讓我們的未來(lái)數(shù)字化生活充滿光明
譯文
研究人員當(dāng)前正在致力于打造一套新的算法版本,旨在為搜索效果提升、自動(dòng)駕駛汽車(chē)、手機(jī)智能化升級(jí)以及物聯(lián)網(wǎng)發(fā)展提供助力。
作為基于人腦結(jié)構(gòu)的松散化模擬機(jī)制,深入學(xué)習(xí)算法已經(jīng)被應(yīng)用在眾多先進(jìn)技術(shù)當(dāng)中,包括語(yǔ)音識(shí)別、自然語(yǔ)言處理以及機(jī)器人自主性運(yùn)作等等。
現(xiàn)在,研究人員正在對(duì)這些算法進(jìn)行換代研發(fā),希望將其大規(guī)模應(yīng)用于機(jī)器學(xué)習(xí)與人工智能領(lǐng)域、甚至可能將其作為此類(lèi)關(guān)鍵性技術(shù)進(jìn)步的實(shí)現(xiàn)基礎(chǔ)。
Gabriel咨詢公司分析師Dan Olds指出,如果我們將目光投向更為“深刻”的技術(shù)進(jìn)步——例如能夠自行駕駛、允許乘客省下時(shí)間進(jìn)行休憩或者閱讀的智能汽車(chē),或者可以自主啟動(dòng)并將我們直接帶至目的地的其它載具——那么深度學(xué)習(xí)算法將是其中必不可少的前提條件與組成部分。
“這些自動(dòng)駕駛汽車(chē)領(lǐng)先‘觀察’到的周邊路況信息及機(jī)動(dòng)性障礙實(shí)現(xiàn)安全先進(jìn)。而更為出色的汽車(chē)能夠區(qū)分行人及標(biāo)志牌內(nèi)容,從而更好地預(yù)測(cè)可能出現(xiàn)的突發(fā)性狀況,”Olds解釋道。“此外,智能化升級(jí)不僅將影響到我們未來(lái)的數(shù)字化生活,同時(shí)也會(huì)給現(xiàn)實(shí)生活帶來(lái)重大影響。如果我們能夠利用可信系統(tǒng)處理航班飛行或者駕駛?cè)蝿?wù),從而完成覆蓋全國(guó)乃至全世界的貨運(yùn)任務(wù),結(jié)果會(huì)怎樣?如果我們可以在寬大的后座上睡覺(jué),而讓汽車(chē)自動(dòng)完成駕駛?cè)蝿?wù),結(jié)果又會(huì)怎樣?”
基本上講,雖然大多數(shù)人甚至根本沒(méi)聽(tīng)說(shuō)過(guò)深度學(xué)習(xí)算法這一概念,但更卓越的算法確實(shí)能夠?yàn)槲覀儙?lái)愈加光明的數(shù)字化前景——其中包括更具智能特性的家居環(huán)境、甚至是能夠照顧病人并幫用戶遛狗的機(jī)器人產(chǎn)品。
“這類(lèi)研究成果可以說(shuō)意義非凡,甚至有可能通過(guò)物聯(lián)網(wǎng)及移動(dòng)技術(shù)等途徑將數(shù)據(jù)驅(qū)動(dòng)機(jī)制拓展至無(wú)窮無(wú)盡的資源池范疇,”Moor Insights & Strategy公司分析師Patrick Moorhead指出。“盡管大多數(shù)人對(duì)此根本聞所未聞,但深度學(xué)習(xí)確實(shí)可算是數(shù)字化世界發(fā)展前景當(dāng)中的核心組成部分。”
Andrew Ng在斯坦福大學(xué)計(jì)算機(jī)科學(xué)系擔(dān)任副教授,同時(shí)也是百度公司的***科學(xué)家——這里向外國(guó)的讀者朋友解釋一句,百度是中國(guó)的一家網(wǎng)絡(luò)服務(wù)企業(yè)、同時(shí)也是份額***的中文搜索引擎供應(yīng)商。通過(guò)與來(lái)自斯坦福大學(xué)及百度公司的其他科學(xué)家進(jìn)行協(xié)作,Ng目前正潛心打造下一代深度學(xué)習(xí)算法。他在于本周在美國(guó)坎布里奇市舉辦的麻省理工學(xué)院技術(shù)回顧EmTech會(huì)議上進(jìn)行了主題演講,透徹解讀了深度學(xué)習(xí)技術(shù)在搜索及未來(lái)技術(shù)領(lǐng)域的實(shí)際應(yīng)用。
斯坦福大學(xué)計(jì)算機(jī)科學(xué)系副教授Andrew Ng
他擁有豐富的背景積累,足以支撐起與深度算法相關(guān)的各項(xiàng)工作。Ng曾經(jīng)在谷歌公司效力過(guò)一年半,并屬于該公司Google Brain深度學(xué)習(xí)項(xiàng)目的發(fā)起者。
除了谷歌之外,微軟、Facebook以及百度等多家企業(yè)也正在著手開(kāi)發(fā)更為理想的深度學(xué)習(xí)算法,旨在滿足自身對(duì)于大規(guī)模數(shù)據(jù)處理的實(shí)際需求。
Ng在接受采訪時(shí)指出,此類(lèi)算法的美妙之處在于當(dāng)我們將規(guī)模愈發(fā)龐大的數(shù)據(jù)提交給傳統(tǒng)算法時(shí),這些陳舊方案往往開(kāi)始變得遲鈍、緩慢并最終無(wú)法繼續(xù)消化。但深度學(xué)習(xí)算法卻能夠帶來(lái)完全不同的使用效果。我們向其提交的數(shù)據(jù)總量越大,得出的分析結(jié)論也就越好。
人類(lèi)大腦的運(yùn)作效果之所以如此卓越,是因?yàn)槠渲谐涑庵罅勘舜诉B通且利用電脈沖實(shí)現(xiàn)交流的神經(jīng)元。深度學(xué)習(xí)算法的模仿對(duì)象正是人類(lèi)大腦,旨在建立起一套基于模擬神經(jīng)元的網(wǎng)絡(luò)體系。
“當(dāng)我們建立起規(guī)模愈發(fā)龐大的人腦模擬體系后,這些模型在吸納大規(guī)模數(shù)據(jù)之后開(kāi)始表現(xiàn)出相對(duì)更高效的處理成果,”Ng解釋道。“這些屬于容量極高的學(xué)習(xí)算法。”
目前工作進(jìn)展可謂相當(dāng)迅速。
大約四年之前,規(guī)模***的神經(jīng)網(wǎng)絡(luò)或者深度學(xué)習(xí)算法集合大約擁有1000萬(wàn)個(gè)連接節(jié)點(diǎn)。Ng指的是2011年年初,當(dāng)時(shí)他剛剛開(kāi)始推進(jìn)谷歌的Google Brain項(xiàng)目,但如今整套模型當(dāng)中的連接節(jié)點(diǎn)已經(jīng)激增至10億級(jí)別。去年,他與斯坦福大學(xué)的技術(shù)團(tuán)隊(duì)共同構(gòu)建出一套擁有100億個(gè)連接節(jié)點(diǎn)的神經(jīng)網(wǎng)絡(luò)模型。
Ng的一部分工作在于提升該算法,但他和他的同事們同時(shí)也在積極利用GPU或者叫圖形處理單元來(lái)取代傳統(tǒng)CPU或者叫中央處理單元在神經(jīng)網(wǎng)絡(luò)中的核心地位。這些專(zhuān)門(mén)針對(duì)計(jì)算機(jī)圖形處理任務(wù)設(shè)計(jì)的芯片在實(shí)踐活動(dòng)中顯示出強(qiáng)大的實(shí)力,被證明能夠很好地完成大規(guī)模神經(jīng)網(wǎng)絡(luò)的構(gòu)建任務(wù)——這是因?yàn)樗鼈兏朴谔幚泶祟?lèi)計(jì)算工作。
“我們正在利用GPU硬件構(gòu)建起新型深度學(xué)習(xí)平臺(tái),旨在幫助自身更出色地完成規(guī)模擴(kuò)展工作,”Ng表示。“我們的協(xié)作伙伴包括我自己都是***次接觸到如此規(guī)模的網(wǎng)絡(luò)體系。其它企業(yè)也開(kāi)始緊跟我們的腳步,但據(jù)我個(gè)人了解,目前百度仍然是***家針對(duì)深度學(xué)習(xí)構(gòu)建起超大規(guī)模GPU集群的公司。”
如果能讓這些算法迎來(lái)更為龐大的容量規(guī)模,應(yīng)該意味著用戶將在語(yǔ)音識(shí)別效果以及可視化搜索領(lǐng)域獲得顯著改進(jìn)。根據(jù)Ng的觀點(diǎn),這些在技術(shù)領(lǐng)域絕對(duì)堪稱歷史性壯舉。
隨著越來(lái)越多貧困人口以及低文化群體開(kāi)始接觸網(wǎng)絡(luò)體系,利用口頭表達(dá)而非手動(dòng)輸入進(jìn)行搜索查詢工作的用戶群體也將進(jìn)一步膨脹。除此之外,相對(duì)于輸入描述詞匯,直接利用圖片作為搜索目標(biāo)的用戶也會(huì)變得越來(lái)越多。
“在未來(lái)五年之內(nèi),將有大約半數(shù)查詢請(qǐng)求將通過(guò)語(yǔ)音及圖片的形式進(jìn)行,因此這項(xiàng)技術(shù)也成為我們的主要資源投入對(duì)象,”Ng指出。
經(jīng)過(guò)改進(jìn)的語(yǔ)音識(shí)別技術(shù)允許司機(jī)在駕駛過(guò)程中大聲發(fā)出口頭指令,也允許乘客在自己的座位上直接向手機(jī)表達(dá)自己的需要,而這些內(nèi)容將被準(zhǔn)確發(fā)送到對(duì)應(yīng)的接收方——例如向朋友匯報(bào)稱自己無(wú)法按時(shí)抵達(dá)會(huì)合地點(diǎn)。
“盡管整個(gè)世界都開(kāi)始向移動(dòng)技術(shù)傾斜,我認(rèn)為仍然沒(méi)有哪家廠商能拿出一套真正適合移動(dòng)設(shè)備的***用戶界面,而其中的核心矛盾在于我們很難在智能手機(jī)上利用細(xì)小的軟鍵盤(pán)方案快速完成輸入,”Ng表示。“語(yǔ)音識(shí)別的效果已經(jīng)變得越來(lái)越好,但平心而論尚無(wú)法達(dá)到我們的預(yù)期要求。當(dāng)其水平改進(jìn)到足夠程度時(shí),我非常樂(lè)意將語(yǔ)音識(shí)別作為智能手機(jī)設(shè)備上新型用戶界面方案的設(shè)計(jì)核心。”
深度泥塑算法還將被用在我們的智能設(shè)備當(dāng)中,包括智能汽車(chē)與可穿戴式技術(shù)——而這一切結(jié)合起來(lái),也就構(gòu)成了物聯(lián)網(wǎng)時(shí)代的絕對(duì)主體。
“我認(rèn)為遠(yuǎn)程控制方案將在我們的家庭環(huán)境中無(wú)處不在,”Ng指出。“如果大家身處家中并打算聽(tīng)點(diǎn)音樂(lè)來(lái)放松身心,比起現(xiàn)在掏出手機(jī)、解鎖屏幕并按下一大堆虛擬按鈕完成播放的操作,未來(lái)我們完全可以躺在沙發(fā)里、用口頭方式讓自己的百度設(shè)備直接播放來(lái)自Justin Timberlake的作品。我希望未來(lái)自己的孫兒們能夠問(wèn)我,‘很久以前,大家的家庭設(shè)備真的聽(tīng)不懂我們的口頭命令嗎?’相信到那個(gè)時(shí)候,他們肯定不敢相信原先家中需要準(zhǔn)備一大堆不同類(lèi)型的遙控器來(lái)操作各種設(shè)備。”