2016年:互聯(lián)網(wǎng)交出控制權(quán) 深度學習顛覆一切
據(jù)連線雜志網(wǎng)站報道,在澳大利亞的西海岸,生物學家阿曼達·霍奇森(Amanda Hodgson)控制無人機飛向印度洋上的高空。這位儒艮專家使用無人機幫助他們觀察瀕臨滅絕的研究對象。不過霍奇森和她的團隊并沒有能力來篩查所有拍得的照片。在45000張照片中尋找儒艮的身影,對于未經(jīng)過訓練的眼睛來說太難了。她的解決之道是把這工作交給深度神經(jīng)網(wǎng)絡來完成。
神經(jīng)網(wǎng)絡是種機器學習模型,大眾所熟知的“人臉識別”便是其應用之一。此外,手機的智能語音助理之所以能理解你說的話,谷歌搜索引擎之所以能呈現(xiàn)準確的搜索結(jié)果,也都有它在背后的功勞。通過對人類大腦神經(jīng)網(wǎng)絡進行模仿,這些掃描數(shù)學模型通過對大量數(shù)據(jù)的分析來習得專項功能。前文所述霍奇森博士便使用這種技術(shù)在數(shù)千張航拍照片中尋找儒艮的蹤跡?;羝嫔纳窠?jīng)網(wǎng)絡基于TensorFlow打造,這是谷歌研發(fā)的第二代人工智能學習系統(tǒng)。
由于儒艮習慣在水面以下捕食,所以檢測這些動物的任務需要格外的精確度。“它們的身跡很容易跟水面眩光相混淆。”她說。現(xiàn)在她的神經(jīng)網(wǎng)絡可以識別散布海面80%的儒艮。
該項目尚處在早期階段,但它卻展示了深度學習在剛過去的一年里廣泛的影響。深度學習在2016年風光***。這個古老的技術(shù)被賦予新的活力,幫助谷歌在世界矚目的圍棋大戰(zhàn)中擊敗人類。這在幾個月前還是幾乎不可能的事。AlphaGo(“圍棋”的英文名字即叫“Go”)僅僅是最突出的例子。一年過去,深度學習不再只是科技極客的小眾玩寵,轉(zhuǎn)而走向了風光臺面。谷歌、Facebook、微軟和亞馬遜籍著它從里到外煥然一新。反過來這些互聯(lián)網(wǎng)巨頭的推波助瀾——通過開放源代碼和提供云服務——也加速了深度學習的流行。
新翻譯
去年,神經(jīng)網(wǎng)絡在Google Photo等應用上將圖像識別技術(shù)提升到新臺階,Google Now和微軟小娜也因它的加持實現(xiàn)了更優(yōu)異的語音識別效果。今年,輪到了翻譯界被改造。機器翻譯實現(xiàn)了大躍進。九月份,谷歌推出“神經(jīng)機器翻譯”服務。這種翻譯完全通過神經(jīng)網(wǎng)絡運行,將翻譯誤差率降低了55%~85%。
谷歌通過大量現(xiàn)有翻譯的集合數(shù)據(jù)來對神經(jīng)網(wǎng)絡進行訓練。培訓材料既包括舊版翻譯軟件差強人意的翻譯,也包括由人類語言專家提供的信雅達式翻譯,后者無疑對提高素材質(zhì)量有加分。深度學習擁有克服缺陷的神奇魔法:盡管培訓材料質(zhì)量參差不齊,但神經(jīng)網(wǎng)絡最終能夠?qū)崿F(xiàn)遠超低水平的翻譯水準。
雖然谷歌的***工程師麥克·舒斯特(Mike Schuster)坦誠他們的造物還遠非***,但它仍然不失是一個突破性成就。由于該服務完全基于深度學習運行,未來改進工作也將輕松許多。開發(fā)人員可以集中精力從整體上對系統(tǒng)做出改進,而不是像過去那樣再為小部件糾結(jié)。
谷歌之外,微軟也在朝同一方向努力。本月,微軟也發(fā)布了自己翻譯應用的新版本。號稱能夠在九種語言之間實現(xiàn)即時翻譯。微軟副總裁沈向洋(Harry Shum)表示微軟翻譯的系統(tǒng)同樣完全運行在神經(jīng)網(wǎng)絡上。這意味著微軟翻譯的水平也有迅速提升的可能。
新聊天
2016年,深度學習也在聊天機器人領域大顯身手。其中最引人注目的當數(shù)Google Allo。Allo于今年秋天推出,通過對用戶文本和照片的分析,能夠提供即時的智能回復。其功能的實現(xiàn)基于谷歌此前一項名為“智能回復”(Smart Reply)的技術(shù),該技術(shù)與電子郵件技術(shù)在很大程度上有相似之處。
Allo不僅僅是一個聊天app,它還能在你毫無察覺中提升你的谷歌搜索體驗。程序幫助搜索引擎理解你的需求,從而使搜索返回的結(jié)果更合乎你的需求。根據(jù)谷歌搜索產(chǎn)品經(jīng)理大衛(wèi)·奧爾(David Orr)的說法,如果沒有深度學習,程序就無法實現(xiàn)回答。“使用神經(jīng)網(wǎng)絡是我們找到的唯一方法。”他說。“我們必須使用我們所掌握的***進科技。”
盡管有其強項,但進行真正的對話仍然讓神經(jīng)網(wǎng)絡力不能及。造出這種完全以假亂真的“聊天機器人”還有很長的路要走。當下,谷歌、Facebook和其他地方的研究員正在積極探索深度學習技術(shù),以期有朝一日能實現(xiàn)宏偉目標??梢源_定的是這些技術(shù)探索將會帶來和“語音識別”、“圖像識別”和“機器翻譯”一樣偉大的進步。“聊天機器人”就是下一個技術(shù)前沿。
新數(shù)據(jù)中心
谷歌在深度學習的路上停都停不下來。今年夏天,在打造了名聲大噪的AlphaGo之后,Google DeepMind實驗室領導人杰米斯·哈薩比斯(Demis Hassabis)表示他們還開發(fā)了一個AI來管理谷歌全球計算機數(shù)據(jù)中心網(wǎng)絡。使用一種被稱為“深度強化學習”(Deep Reinforcement Learning)的技術(shù),AI能夠智能管理服務器中冷卻風扇的開關(guān)和溫度控制??傊粋€數(shù)據(jù)中心超過120項功能全由它掌控。
彭博社報道,這個AI的部署幫助谷歌節(jié)省了數(shù)億美元。2014年谷歌花6.5億美元收購DeepMind,現(xiàn)在已經(jīng)完全撈回了成本。目前DeepMind正計劃在這些計算設施外安裝更多傳感器,收集更多數(shù)據(jù)來訓練AI到更高的水平。
新的云計算
當互聯(lián)網(wǎng)巨頭紛紛用新技術(shù)武裝自己時,他們也通過自家服務將之獻給大眾。2015年底,谷歌宣布將TensorFlow開源。僅僅一年內(nèi),這個一度專有的軟件造福了像阿曼達·霍奇森這樣的千萬大眾。與此同時,谷歌還與微軟、亞馬遜一道在云計算服務中提供自己的深度學習技術(shù),讓任何個人或組織開發(fā)者使用它們來構(gòu)建自己的程序。“人工智能服務”可能成為這三個網(wǎng)絡巨頭的***業(yè)務。
在過去的十二個月中,技術(shù)的火熱讓領域內(nèi)的人才變得炙手可熱。李飛飛(Fei-Fei Li)是AI研究領域技術(shù)***級人物,谷歌聘請她來管理其AI云計算組織。亞馬遜則聘請卡內(nèi)基梅隆大學教授亞歷克斯·斯摩納(Alex Smolna)坐鎮(zhèn)其云計算帝國??萍季揞^竭盡全力招攬人才,彼此毫不相讓。所幸他們競爭產(chǎn)生的研究成果都會為公眾所用,這倒不是壞事。
隨著AI的演變,計算機科學家的角色也正在發(fā)生改變。傳統(tǒng)意義上能夠編寫代碼的人變的不那么重要,新趨勢需要的是更多能夠訓練神經(jīng)網(wǎng)絡的人。后者所需的技能非同以往,與自己開發(fā)東西相比,它更像是誘導數(shù)據(jù)產(chǎn)生結(jié)果。谷歌這些大企業(yè)不僅積極招徠新式人才,并且也在將已有員工往這方向引導。未來AI將會使每個人生活中的技術(shù)變革一新。