Google Brain:重建谷歌帝國的人工大腦
這是互聯(lián)網(wǎng)上最無聊的工作之一,一隊谷歌員工日復(fù)一日盯著電腦屏幕,審查著一張張街景圖片,不斷的問自己:“我看到的是個地址嗎?” 然后點擊Yes,點擊Yes,點擊No。
這就是谷歌公司地圖服務(wù)構(gòu)建工作中極其關(guān)鍵的一部分。對于地圖制圖者來說,知道一棟建筑的準(zhǔn)確地址實在是太有用了。但這卻并沒有讓那些可憐的谷歌員工生活更美好,因為他們必須分清谷歌街景車捕捉到的一串?dāng)?shù)字究竟是一個手機號,還是一個涂鴉,或是一個合法的地址。
幾個月之前,他們的苦惱一下子煙消云散,因為谷歌工程師們訓(xùn)練了公司的計算機,這些機器可以來處理這項費力不討好的任務(wù)。過去,計算機總是搞不定這樣的高級圖像識別,而谷歌公司最終用他們稱為“谷歌大腦”(Google Brain)的、***的人工智能系統(tǒng)攻克了這個難題,谷歌現(xiàn)在可以在一小時之內(nèi)將法國街景中的地址全部轉(zhuǎn)錄。
“谷歌實際上不是一個搜索公司,它是一個機器學(xué)習(xí)公司。”
自從三年前谷歌公司神秘的X實驗室(X Labs)誕生以來,谷歌大腦項目就在公司內(nèi)部活躍起來,使得它的軟件工程師團(tuán)隊有用武之地,可以應(yīng)用最***的機器學(xué)習(xí)算法來解決不斷增多的問題。而且從很多方面看,就像過去十年中谷歌的搜索算法和數(shù)據(jù)中心專長幫助其打造起取得巨大成功的廣告業(yè)務(wù)一樣,這一項目很可能為谷歌在未來十年進(jìn)軍其它領(lǐng)域帶來領(lǐng)先優(yōu)勢。
“谷歌實際上不是一個搜索公司,它是一個機器學(xué)習(xí)公司。”圖像搜索創(chuàng)業(yè)公司Clarifai的CEO馬修·蔡勒(Matthew Zeiler)這樣表示,他曾在谷歌大腦項目實習(xí)過兩次。他表示,谷歌最重要的幾個項目,如無人駕駛汽車、廣告、谷歌地圖,一直都從這類研究中獲益。“實際上機器學(xué)習(xí)驅(qū)動著公司的一切。”
不僅是谷歌地圖,安卓的語音識別軟件及Google+圖像搜索也受益于谷歌大腦。但按照項目背后主要的思想家之一杰夫·迪恩(Jeff Dean)的說法,這僅僅是個開始。他認(rèn)為谷歌大腦項目能幫助公司的搜索算法并提升谷歌翻譯的性能。“谷歌現(xiàn)在有30或40個小組在使用我們的基礎(chǔ)設(shè)施,”迪恩表示。“有些小組用它進(jìn)行生產(chǎn),有些則對它進(jìn)行探索,并將它和現(xiàn)有的系統(tǒng)比較,總的說來,對于很多類型的問題能都取得很好的效果。”
這一項目是向稱為“深度學(xué)習(xí)”的新型人工智能轉(zhuǎn)變過程中的一部分。Facebook正在做類似的工作,微軟、IBM等其它公司亦是如此。但是谷歌似乎技術(shù)更先進(jìn)——至少現(xiàn)在是這樣。
人工智能即服務(wù)
2011年,谷歌大腦項目啟動,這只是個內(nèi)部代號,不是官方稱謂,當(dāng)時斯坦福大學(xué)的吳恩達(dá)教授加入了谷歌公司具有“探月”意義的Google X實驗室團(tuán)隊,來進(jìn)行深度學(xué)習(xí)的實驗。一年之后,谷歌將安卓語音識別錯誤率令人驚嘆地降低了25%。不久,谷歌開始將它所能找到的深度學(xué)習(xí)專家全部招致麾下。去年,谷歌請來了世界上***的深度學(xué)習(xí)專家之一的杰夫·辛頓(Geoff Hinton)。接著又在一月,耗資4億美元收購了頗具神秘色彩的深度學(xué)習(xí)公司DeepMind。
利用深度學(xué)習(xí)技術(shù),計算機科學(xué)家建立軟件模型可以在一定程度上模擬人類大腦的學(xué)習(xí)模型。然后,這些模型可以用大量的新數(shù)據(jù)進(jìn)行訓(xùn)練,不斷微調(diào),最終應(yīng)用到全新的任務(wù)中去。舉個例子,谷歌圖像搜索建立了一個圖像識別模型,它也可以幫助谷歌地圖團(tuán)隊解決問題。為谷歌搜索引擎建立的文本分析模型也可以為Google+所用。
谷歌大腦可以看懂的街景圖像示例。
谷歌在公司內(nèi)部網(wǎng)上建立了幾個AI模型,而迪恩和他的團(tuán)隊編寫了后端軟件,使得谷歌的服務(wù)器群能處理這些數(shù)據(jù)并將結(jié)果顯示在軟件界面上,讓開發(fā)者可以看到他們AI代碼的運行情況。迪恩說:“看起來就像是個核反應(yīng)堆的控制面板。”
而有些項目,如安卓語音識別,杰夫·迪恩的團(tuán)隊就需要進(jìn)行一些大改動以使機器學(xué)習(xí)模型能適應(yīng)手頭的任務(wù)。但也許,使用谷歌大腦軟件的隊伍中有半數(shù)都只是簡單的下載源代碼、微調(diào)配置文件,接著就把數(shù)據(jù)輸入到谷歌大腦中。迪恩表示:“如果你想要在這一領(lǐng)域做前沿研究,并超越現(xiàn)有的技術(shù),為新問題建立合適的模型,那么你必須要在機器學(xué)習(xí)領(lǐng)域接受過多年的訓(xùn)練。但是如果你只想應(yīng)用一下這個技術(shù),而你要處理的問題和深度模型已解決的問題有點類似,那么,人們已經(jīng)用它取得了很大的成功,你也無需是個深度學(xué)習(xí)專家。”
新版MapReduce
這樣的內(nèi)部代碼共享也對另一項谷歌領(lǐng)先的技術(shù)MapReduce產(chǎn)生了重大影響。十年前,迪恩作為團(tuán)隊一員編寫了MapReduce,使它成為了利用谷歌數(shù)以萬計服務(wù)器的可行之路,并訓(xùn)練它們來解決如為萬維網(wǎng)建立索引這類單一問題。MapReduce的代碼最終在內(nèi)部公開,而谷歌思維敏捷的工程師們就想出了如何訓(xùn)練它來解決新的大數(shù)據(jù)計算問題的方法。MapReduce背后的思想最終寫成了開源項目Hadoop的代碼,將谷歌曾經(jīng)獨享的超強數(shù)據(jù)處理技術(shù)拱手獻(xiàn)給世界。
隨著谷歌宏偉的人工智能項目細(xì)節(jié)不斷流出,谷歌大腦也許***也會成為開源項目。今年一月,谷歌發(fā)表了一份關(guān)于谷歌地圖的論文,考慮到谷歌有分享其研究成果的記錄,很可能有更多的論文將會發(fā)表。
考慮到深度學(xué)習(xí)算法要解決的問題范圍非常廣,谷歌與迪恩以及他團(tuán)隊的代碼還有大量工作要做。他們發(fā)現(xiàn),使用的數(shù)據(jù)越多,這些模型就會變得更精確。那也許是谷歌下一個宏大目標(biāo):建立十億級數(shù)據(jù)點的人工智能模型,而不是***的。就像迪恩所說的:“我們正在嘗試將可擴展性推進(jìn)到下一個級別,可以訓(xùn)練準(zhǔn)確的、真真正正的大數(shù)據(jù)模型。”
原文鏈接: ROBERT MCMILLAN 翻譯: 伯樂在線 - toolate