揭秘谷歌內(nèi)部的萬人機(jī)器學(xué)習(xí)項(xiàng)目—忍者計(jì)劃!
如果你想讓人工智能融入每一個產(chǎn)品中,那么你得訓(xùn)練一支強(qiáng)大的機(jī)器學(xué)習(xí)戰(zhàn)隊(duì) 。
Google工程師卡爾森•霍爾蓋特(Carson Holgate)正把自己訓(xùn)練成忍者。
訓(xùn)練并不涉及武術(shù),若論武功,26歲的霍爾蓋特已是高手——跆拳道黑帶二段。該訓(xùn)練主要針對算法?;魻柹w特參加這項(xiàng)訓(xùn)練已經(jīng)好幾個星期了,這是能讓她獲得比體力更強(qiáng)大技能的一項(xiàng)訓(xùn)練——機(jī)器學(xué)習(xí),即ML。
霍爾蓋特是Google 安卓部門的工程師,也是公司本年度機(jī)器學(xué)習(xí)“忍者計(jì)劃”的十八名程序猿之一,該計(jì)劃云集了各團(tuán)隊(duì)中的優(yōu)秀編程員。Ender游戲風(fēng)格是要教授他們,可以讓產(chǎn)品更智能的機(jī)器學(xué)習(xí)技術(shù),哪怕這會讓他們開發(fā)的程序更難理解。
Google工程師霍爾蓋特
Christine Robson(克里斯汀•羅伯森)經(jīng)常說:“想成為機(jī)器學(xué)習(xí)忍者么?”羅伯森是Google內(nèi)部機(jī)器學(xué)習(xí)計(jì)劃的產(chǎn)品經(jīng)理,也負(fù)責(zé)管理該學(xué)習(xí)項(xiàng)目。“
因此wired(連線雜志)邀請Google內(nèi)部的同仁來參與項(xiàng)目,用6個月的時間致力于機(jī)器學(xué)習(xí),跟著老師學(xué)習(xí),在這6個月里潛心機(jī)器學(xué)習(xí),做一些項(xiàng)目,把項(xiàng)目啟動起來,他們會收獲頗豐。”
霍爾蓋特四年前獲得計(jì)算機(jī)科學(xué)與數(shù)學(xué)學(xué)位,并加入了Google。對她來說,這是一個掌握前沿技術(shù)的機(jī)會——利用學(xué)習(xí)算法(學(xué)習(xí)者)和海量數(shù)據(jù)來“教會”軟件完成任務(wù)。
近期研究結(jié)果表明,神經(jīng)網(wǎng)絡(luò)甚至?xí)饺四X。Google決心在內(nèi)部擴(kuò)大精英培訓(xùn)范圍,以期待讓機(jī)器學(xué)習(xí)成為一種常態(tài)。
對霍爾蓋特這樣的工程師來講,可以向高手中的高手討教,忍者計(jì)劃是他們飛躍到技術(shù)前沿的機(jī)會。她說:“這些人會開發(fā)神奇的模型,并且擁有博士學(xué)位。”言語間透露著一種難以掩飾的敬畏之情。
谷歌員工人數(shù)眾多(6萬員工中約有半數(shù)是工程師),而這只是個小項(xiàng)目。但這個項(xiàng)目卻標(biāo)志著谷歌內(nèi)部認(rèn)識的轉(zhuǎn)變。
盡管機(jī)器學(xué)習(xí)早已成Google的一項(xiàng)技術(shù),Google還率先聘請了業(yè)內(nèi)專家,但大約到了2016年,Google才開始真正癡迷于機(jī)器學(xué)習(xí)技術(shù)。
在去年底財(cái)報(bào)電話會議上,谷歌CEO桑達(dá)爾•皮查伊(Sundar Pichai)表示:“我們還會盡力將它應(yīng)用于所有的產(chǎn)品中,包括搜索、廣告、YouTube或Play。
正如機(jī)器學(xué)習(xí)暢銷書《算法大師》(The Master Algorithm)的作者佩德羅•多明戈斯(Pedro Domingos)所說:“機(jī)器學(xué)習(xí)是新生事物,是可以自我學(xué)習(xí)的技術(shù)。”
Google ML計(jì)劃負(fù)責(zé)人杰夫•迪恩(Jeff Dean)說:“想用這種方式解決問題的人越多,我們就會變得越好。”他估計(jì)谷歌2.5萬工程師中,只有幾千人懂得機(jī)器學(xué)習(xí), 差不多只有10%。他希望這個比例能接近100%。他說:“如果能讓所有工程師都多少懂得一點(diǎn)機(jī)器學(xué)習(xí)技術(shù),就太棒了。”
多年來,約翰•賈南德雷亞(John Gianandrea)一直都是谷歌機(jī)器學(xué)習(xí)的主力助推者,而最近他成了搜索業(yè)務(wù)主管。
但當(dāng)他2010年加入公司時(伴隨著谷歌收購MetaWeb公司而加入,該公司在人群、地點(diǎn)和事項(xiàng)方面的龐大數(shù)據(jù)庫,已經(jīng)作為知識圖譜融入了谷歌搜索中),他在機(jī)器學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)方面還沒有太多經(jīng)驗(yàn)。
2011年左右,他被神經(jīng)信息處理系統(tǒng)大會(NIPS)的新聞?wù)痼@了。好像每年NIPS的一些團(tuán)隊(duì)都會發(fā)布機(jī)器學(xué)習(xí)的成果,讓先前解決問題的努力灰飛煙滅,包括機(jī)器翻譯、語音識別或者視覺處理。
他說:“當(dāng)我第一次看到它,NIPS大會依然是模糊的。但在過去三年,整個領(lǐng)域從學(xué)術(shù)界到工業(yè)界發(fā)展十分迅猛。我感覺去年得有6000人參加。”
谷歌大腦負(fù)責(zé)人杰夫•迪恩
杰夫•迪恩:典型的谷歌計(jì)算機(jī)科學(xué)家,現(xiàn)在正建立機(jī)器學(xué)習(xí)工具和并帶領(lǐng)團(tuán)隊(duì)。這些改進(jìn)的神經(jīng)網(wǎng)絡(luò)算法,加上摩爾定律更強(qiáng)大的運(yùn)算能力,以及像Google和Facebook海量用戶的行為數(shù)據(jù)呈指數(shù)級地增長,開啟了一個方興未艾的機(jī)器學(xué)習(xí)新時代。
賈南德雷亞(Giannandrea)加入了那些被認(rèn)為是公司核心的項(xiàng)目。其中還有谷歌大腦(Google Brain)聯(lián)合創(chuàng)始人迪恩,神經(jīng)網(wǎng)絡(luò)的項(xiàng)目源于公司研究部門的Google X.(現(xiàn)簡稱為X.)。
Google對機(jī)器學(xué)習(xí)的“熊抱”,并不簡單等同于編程技術(shù)的轉(zhuǎn)變。這是對于可賦予電腦無限能力技術(shù)的一種嚴(yán)肅的承諾。其領(lǐng)先優(yōu)勢在于圍繞受大腦支配的、復(fù)雜神經(jīng)網(wǎng)絡(luò)建立“深度學(xué)習(xí)”算法。
谷歌大腦是一個深度學(xué)習(xí)項(xiàng)目。Google 于2014年1月買下(據(jù)說花了5億美元)的AI公司Deepmind,也致力于該領(lǐng)域研究。
Deepmind打造的AlphaGO擊敗了世界圍棋冠軍,打破了人們對于智能機(jī)器性能的固有想象,也在害怕智能機(jī)器和殺手機(jī)器人的人心中激起了憂慮的漣漪。
賈南德雷亞(Giannandrea)破除了認(rèn)為“AI會殺死我們”的無知語言,他確信機(jī)器學(xué)習(xí)系統(tǒng)在各方面都會是革命性的,從醫(yī)療診斷到駕駛汽車。機(jī)器學(xué)習(xí)將會改變?nèi)祟?,但不會取代人類?/p>
賈南德雷亞引用Google Photos為例,解釋了機(jī)器學(xué)習(xí)能力。他展示了一些博德牧羊犬的圖片。
他解釋道,通過學(xué)習(xí),電腦能“知道”博德牧羊犬的樣子,而且還能找出其幼年、成年、長毛、以及剃毛后的圖片。當(dāng)然人也可以做到這個。但是人類無法從上百萬個圖例中同時識別上萬只狗的品種,而機(jī)器學(xué)習(xí)系統(tǒng)可以。
如果機(jī)器認(rèn)識了一個品種,它就能用相同的技巧去識別其他9999種。賈南德雷亞說:“這就是新奇之處。對于這類些狹窄領(lǐng)域來說,你能在這些博學(xué)的系統(tǒng)里找到人們所謂的超人性能。”
當(dāng)然,Google早就理解了機(jī)器學(xué)習(xí)概念,其創(chuàng)始人始終都對AI力量深信不疑。”機(jī)器學(xué)習(xí)已經(jīng)被用于許多Google產(chǎn)品。(早期機(jī)器學(xué)習(xí)往往依賴更直接的統(tǒng)計(jì)方法)
事實(shí)上,十多年前,Google就開設(shè)了內(nèi)部課程,向工程師們教授機(jī)器學(xué)習(xí)。
科恩認(rèn)為,只有Goolger人自己,能教授這樣一門內(nèi)部課程,因?yàn)镚oogle的運(yùn)用規(guī)模無人可以比擬(可能國防部除外)。
課程太受歡迎了,而開始變得失控了。班加羅爾辦公室的人們要熬夜到半夜才能參加。幾年后,一些Google工程師把課程制成短視頻,現(xiàn)場授課停止了??贫髡J(rèn)為這可能足以作為慕課(MOOC)的先驅(qū)。
隨后幾年,Google又有一些不同的 ML培訓(xùn),但均不是有組織地連貫進(jìn)行。就在科恩2013年離開谷歌前,他說:“ML在谷歌突然就成了重中之重。”
在2012年之前,這種認(rèn)識尚未形成氣候,直到賈南德雷亞決定“招募一批從事這項(xiàng)工作的人”,并將他們安排到單獨(dú)的辦公樓。從X部門脫離出來的谷歌大腦也加入進(jìn)來。“
工程師們開發(fā)的機(jī)器學(xué)習(xí)成果,越來越多地出現(xiàn)在谷歌熱門產(chǎn)品中。
由于機(jī)器學(xué)習(xí)的關(guān)鍵領(lǐng)域是視覺、語音、聲音識別和翻譯,所以ML現(xiàn)在成為語音搜索、翻譯和Photos的主要部分并不奇怪。更驚人的是,力圖讓機(jī)器學(xué)習(xí)融入所有產(chǎn)品。
杰夫•迪恩說,隨著他和團(tuán)隊(duì)對機(jī)器學(xué)習(xí)的理解逐步深入,他們的探索更加雄心勃勃。“
我們以前,也許只是將機(jī)器學(xué)習(xí)技術(shù)用于系統(tǒng)里的一些子功能,但是現(xiàn)在我們是要用這項(xiàng)技術(shù)替代整套系統(tǒng),而不是給每個系統(tǒng)設(shè)計(jì)一個更好的機(jī)器學(xué)習(xí)模型。”
迪恩表示,如果現(xiàn)在讓他重新規(guī)劃谷歌的基礎(chǔ)架構(gòu),其中大部分都不會再通過編碼實(shí)現(xiàn)而是通過學(xué)習(xí)而獲得。迪恩最為人熟知的身份是Bit Table和MapReduce等顛覆性系統(tǒng)的聯(lián)合創(chuàng)造者。
谷歌大腦聯(lián)合創(chuàng)始人格雷格•科拉多
谷歌大腦聯(lián)合創(chuàng)始人格雷格•科拉多(Greg Corrado)與產(chǎn)品團(tuán)隊(duì)一起,致力于將AI與機(jī)器學(xué)習(xí)融入軟件,從而實(shí)現(xiàn)先前未能預(yù)想到一些產(chǎn)品特征。其中一例便是于2015年11月發(fā)布的Gmail 的智能回復(fù)(Smart Reply)。
該功能的靈感源于格雷與前Gmail工程師巴林特•米克洛斯(Bálint Miklós)的一次談話。(米克洛斯,曾在Gmail致力于研究垃圾郵件檢測和郵件分類的ML算法。)
談話中米克洛斯提出了一些激進(jìn)的建議:“如果團(tuán)隊(duì)利用ML來自動生成郵件回復(fù)內(nèi)容,幫助手機(jī)用戶擺脫,用手機(jī)小鍵盤回信的難題會怎么樣呢?
科拉多說:”這瘋狂的建議讓我大吃一驚。但后來我想,如果利用我們有預(yù)測模式的神經(jīng)網(wǎng)絡(luò)技術(shù),這也許可行。一旦我們發(fā)現(xiàn)有點(diǎn)機(jī)會,我們就得試試。”
科拉多及其團(tuán)隊(duì)與Gmail團(tuán)隊(duì)保持著密切又頻繁的聯(lián)系,谷歌成功幾率大大提升,隨著機(jī)器學(xué)習(xí)專家在產(chǎn)品團(tuán)隊(duì)中的擴(kuò)散,這種方法越來越普遍。
科拉多說:“機(jī)器學(xué)習(xí)既是科學(xué)又是藝術(shù)。就好像烹飪,其中會有化學(xué)反應(yīng),但是要做到真正有趣,你就得學(xué)會搭配現(xiàn)有的原料。”
傳統(tǒng)的AI技術(shù)在理解語言時,靠的是將語音規(guī)則嵌入系統(tǒng),但在這個項(xiàng)目中,和現(xiàn)在所有的機(jī)器學(xué)習(xí)一樣,系統(tǒng)存儲了足夠的數(shù)據(jù)來實(shí)現(xiàn)自我學(xué)習(xí),就像小孩子學(xué)習(xí)那樣。
科拉多說:“我并非是從語言學(xué)家那學(xué)會說話的,而是通過聽別人說話而學(xué)會的。”但真正令智能回復(fù)變得切實(shí)可行的,是它的成功很容易定義——他們的目的不是創(chuàng)造一個妖艷的虛擬斯嘉麗•約翰遜(Scarlett Johansson),而是希望它能回復(fù)真正的電子郵件。“
然而,當(dāng)該團(tuán)隊(duì)開始測試智能回復(fù)時,用戶卻注意到了一些怪事:它經(jīng)常會推薦一些不合時宜的曖昧語言。“其中一個失敗模型確實(shí)太過可笑,科拉多說:“一旦系統(tǒng)變得混淆,它就會說‘我愛你’。
這并不是軟件漏洞,問題出在我們讓它做的事情上。” 不管怎樣,這個程序?qū)W到了一些人類微妙的行為。“如果你感到擔(dān)憂,‘我愛你’是一種很好的防御策略。” 科拉多能幫助團(tuán)隊(duì)壓制系統(tǒng)的熱情。
在通過該應(yīng)用發(fā)送的回復(fù)信息中,有十分之一都是由機(jī)器學(xué)習(xí)系統(tǒng)生成的??评嘈χf:“這個項(xiàng)目能夠成功還是令我感到有些驚訝。”
智能回復(fù),只是證明谷歌ML有效性諸多實(shí)例中的一個。
或許最終的拐點(diǎn)是當(dāng)機(jī)器學(xué)習(xí),成為搜索的一個必不可少的組成部分時——作為谷歌的旗艦產(chǎn)品,搜索幾乎為該公司貢獻(xiàn)了所有營收。
多年以來,由于搜索引擎對谷歌過于重要,所以始終沒有融入機(jī)器學(xué)習(xí)算法。賈南德雷亞說:“由于搜索在公司內(nèi)部占據(jù)的份額巨大,高級管理者深度參與其中,所以很多人都懷疑我們無法真正取得進(jìn)展”。
在某種程度上,那是文化阻力——必須要讓那些有極強(qiáng)控制欲的程序員,適應(yīng)帶有禪宗韻味的機(jī)器學(xué)習(xí)模式。
長期掌管谷歌搜索業(yè)務(wù)的艾米特•辛格(Amit Singhal)曾是傳奇計(jì)算機(jī)科學(xué)家杰拉德•薩爾頓(Gerald Salton)的助手。
薩爾頓在文檔檢索方面的開創(chuàng)性工作,啟迪辛格幫助謝爾蓋•布林(Sergey Brin)和拉里•佩奇(Larry Page)把研究生時期編寫的代碼擴(kuò)展成了可以適應(yīng)當(dāng)今網(wǎng)絡(luò)時代的程序。(這使得他成為了“檢索派”的一員。)
他從二十世紀(jì)的方法中,梳理出了令人驚訝的結(jié)果,并對將機(jī)器學(xué)習(xí)系統(tǒng)整合到作為谷歌命脈的復(fù)雜系統(tǒng)中產(chǎn)生了懷疑。
戴維•帕布羅•科恩說:“進(jìn)入谷歌的頭兩年,我負(fù)責(zé)搜索質(zhì)量,試圖用機(jī)器學(xué)習(xí)來改進(jìn)排名。結(jié)果發(fā)現(xiàn)艾米特的團(tuán)隊(duì)是全世界最優(yōu)秀的,通過將艾米特腦海里的想法都變成了硬編碼,我們發(fā)展的更好。已經(jīng)找不到比他更好的方法了。”
到2014年初,谷歌的機(jī)器學(xué)習(xí)大師們認(rèn)為需要改變現(xiàn)狀。“我們與排名團(tuán)隊(duì)展開了一系列討論。”迪恩說,“我們認(rèn)為至少應(yīng)該嘗試一下,看看能不能有一些收獲。”
他的團(tuán)隊(duì)所設(shè)想的那個實(shí)驗(yàn),最終成為了搜索的核心:文件排名與搜索請求的匹配程度有多高(需要以用戶的點(diǎn)擊為衡量標(biāo)準(zhǔn))。“我們跟他們說,可以用神經(jīng)網(wǎng)絡(luò)計(jì)算額外的分?jǐn)?shù),看看到底有沒有用。”
最終答案是肯定的。這套系統(tǒng)如今已經(jīng)成為谷歌搜索的一部分,被稱作RankBrain。
它于2015年4月上線。谷歌還是像以往一樣,對如何改進(jìn)搜索諱莫如深(究竟是與長尾理論有關(guān)?還是更好地解讀了模糊不清的搜索請求?)。
但迪恩表示,RankBrain“融入到每一個搜索請求中”,雖然未必會影響所有的排名,但的確對很多搜索請求的排名都產(chǎn)生了影響。
此外,它非常有效。在谷歌計(jì)算排名時,所使用的數(shù)百個“signals”中(這些signals可能包括,用戶所在的地理位置,或者頁面標(biāo)題是否與搜索請求匹配),現(xiàn)在RankBrain的有效性名列前三甲。
“我們成功利用機(jī)器學(xué)習(xí)改進(jìn)了搜索結(jié)果,這對公司來說意義重大。”賈南德里亞說,“這引發(fā)了很多人的關(guān)注。”
華盛頓大學(xué)教授佩德羅•多明戈斯在其著作《算法大師》中則給出了不同的說法:“檢索派與機(jī)器學(xué)習(xí)派始終都存在斗爭。最終是機(jī)器學(xué)習(xí)獲勝。”
谷歌面臨的新挑戰(zhàn)是,如何讓所有工程師都能熟悉機(jī)器學(xué)習(xí)。
還有很多公司也都秉承著相同的目標(biāo),其中最引人關(guān)注的當(dāng)屬Facebook,該公司與谷歌一樣著迷于機(jī)器學(xué)習(xí)和深度學(xué)習(xí)。
這一領(lǐng)域的畢業(yè)生變得非常搶手,而谷歌正在努力保持對畢業(yè)生的吸引力。學(xué)術(shù)圈多年以來都流傳著一個玩笑:即使不需要頂尖學(xué)生,谷歌也會招聘他們,避免人才被競爭對手搶走。(這個玩笑的錯誤之處在于,谷歌的確需要這些人才。)
“我的學(xué)生無一例外都得到了谷歌的錄用通知。”多明戈斯說。目前看來,競爭的激烈程度有增無減:就在前不久,谷歌宣布將在蘇黎世開設(shè)一個新的機(jī)器學(xué)習(xí)實(shí)驗(yàn)室,有很多工作崗位有待填補(bǔ)。
但由于學(xué)術(shù)項(xiàng)目尚未培養(yǎng)出大量機(jī)器學(xué)習(xí)專家,培訓(xùn)員工就成為了必要措施。但這并非易事,尤其是在谷歌,這樣擁有許多世界一流工程師的公司,他們一直致力于通過編程來實(shí)現(xiàn)魔幻般的世界。
機(jī)器學(xué)習(xí)卻需要截然不同的思維模式,大師級程序工程師之所以能有如今的成就,往往是因?yàn)樗麄兿M耆刂埔惶拙幋a系統(tǒng)。
機(jī)器學(xué)習(xí)還需要掌握一些數(shù)學(xué)和統(tǒng)計(jì)學(xué)知識,但是很多程序員卻對此不屑一顧的,即便是那些能夠?qū)懗龀L代碼的超級黑客也不例外。
克里斯汀•羅伯森,負(fù)責(zé)培養(yǎng)谷歌員工和參與機(jī)器學(xué)習(xí)技術(shù)的外部人員。這需要一定的耐心。
羅伯森說:“機(jī)器學(xué)習(xí)模型并非靜態(tài)編碼,你得不停地輸入數(shù)據(jù)。我們一直在持續(xù)更新模型、學(xué)習(xí)、增加數(shù)據(jù)、調(diào)整預(yù)測方式。就像生活呼吸一樣,這是另一種工程學(xué)。”
克里斯汀
“這是一個使用千變?nèi)f化的算法,進(jìn)行實(shí)驗(yàn)的學(xué)科,需要挑選那些真正適合使用場景的訓(xùn)練數(shù)據(jù)。”賈南德雷亞說。盡管他也是新的搜索業(yè)務(wù)主管,但卻仍然把在谷歌內(nèi)部傳播機(jī)器學(xué)習(xí)理念,作為自己工作的一部分。
“計(jì)算機(jī)科學(xué)那一部分不會消失,但需要更加關(guān)注數(shù)學(xué)和統(tǒng)計(jì)學(xué),而對數(shù)十萬行代碼的關(guān)注度則需要相應(yīng)地降低。”
至于谷歌所擔(dān)心的障礙,完全可以通過明智的內(nèi)部培訓(xùn)來解決。“歸根結(jié)底,這些模型中使用的數(shù)學(xué)原理并不那么復(fù)雜。”迪恩說,“谷歌聘用的多數(shù)軟件工程師都可以掌握。”
為了進(jìn)一步幫助不斷擴(kuò)容的機(jī)器學(xué)習(xí)專家團(tuán)隊(duì),谷歌開發(fā)了一系列強(qiáng)大的工具,幫助他們選擇合適的算法訓(xùn)練模型,加快培訓(xùn)和提煉過程。
其中最強(qiáng)大的是TensorFlow,它可以加速神經(jīng)網(wǎng)絡(luò)的構(gòu)建過程。
T
ensorFlow源自谷歌大腦項(xiàng)目,由迪恩和他的同事拉加特•芒格(Rajat Monga)共同發(fā)明。它能把構(gòu)建系統(tǒng)過程中,涉及的晦澀難懂的細(xì)節(jié)變成標(biāo)準(zhǔn)化的內(nèi)容——尤其是在谷歌2015年11月開始將其開放給公眾后,這種做法的效果更加得以顯現(xiàn)。
盡管谷歌煞費(fèi)苦心地,將這種行為描述為一種無私的舉動,但該公司也承認(rèn),如果新一代程序員,都能熟悉該公司內(nèi)部的機(jī)器學(xué)習(xí)工具,那對谷歌未來的招聘活動將會起到莫大的幫助。
(質(zhì)疑者甚至指出,谷歌的TensorFlow開源項(xiàng)目是為了追趕Facebook,后者已經(jīng)在2015年6月公布了早期機(jī)器學(xué)習(xí)系統(tǒng)的深度學(xué)習(xí)模塊Torch。)
不過,TensorFlow的功能以及谷歌的開源模式,很快受到了程序員的歡迎。賈南德雷亞表示,當(dāng)谷歌首次提供TensorFlow課程時,共有7.5萬人報(bào)名參加。
但谷歌仍為自己的程序員保留了很多好東西。該公司在內(nèi)部擁有一套更加優(yōu)秀的機(jī)器學(xué)習(xí)工具——Tensor Processing Unit(以下簡稱“TPU”)。他們雖然使用這項(xiàng)創(chuàng)新已經(jīng)多年時間,但直到最近才對外宣布。
這是一種針對機(jī)器學(xué)習(xí)程序優(yōu)化的處理器,就像GPU是專門針對圖形處理優(yōu)化的芯片一樣。該公司的龐大數(shù)據(jù)中心里,使用了數(shù)以千計(jì)的TPU(具體有多少恐怕只有上帝和佩奇才知道)。
通過賦予神經(jīng)網(wǎng)絡(luò)這種超級計(jì)算能力,TPU為谷歌帶來了巨大優(yōu)勢。“如果沒有它,我們就無法實(shí)現(xiàn)RankBrain。”迪恩說。
他們也在不斷嘗試各種方式,來為工程師提供機(jī)器學(xué)習(xí)方面的培訓(xùn)。這些培訓(xùn)的規(guī)模各異,其中也包括為期兩天的速成班。
谷歌希望這只是初步嘗試,工程師隨后還會尋找更多資源來深入學(xué)習(xí)。“已經(jīng)有數(shù)千人報(bào)名參加下一次課程。”迪恩說。
此外,一些小項(xiàng)目吸引了外部人才加入谷歌機(jī)器學(xué)習(xí)計(jì)劃。今年初春,谷歌啟動了Brain Residency項(xiàng)目,在谷歌智庫內(nèi)部為有前途的外部人才提供為期一年的集訓(xùn)。
協(xié)助管理該項(xiàng)目的羅伯森說:“我們稱之為深度學(xué)習(xí)職業(yè)生涯的搶跑。”
盡管這27名來自不同學(xué)科的機(jī)器學(xué)習(xí)學(xué)員中,可能有一些會留在谷歌,但他表示,該公司的目的是讓他們自行發(fā)展,利用自己掌握的先進(jìn)知識,在世界各地傳播谷歌的機(jī)器學(xué)習(xí)技術(shù)。
因此,從某種意義上講,卡爾森•霍爾蓋特在忍者項(xiàng)目中學(xué)到的知識,正是谷歌為了保持世界主流AI公司地位這一計(jì)劃的核心,其中機(jī)器學(xué)習(xí)正在成為主角。
課程最開始是一個為期四周的新兵訓(xùn)練營,由谷歌最專業(yè)的人工智能項(xiàng)目產(chǎn)品負(fù)責(zé)人提供指導(dǎo),教如何將機(jī)器學(xué)習(xí)融入項(xiàng)目進(jìn)行訓(xùn)練。
羅伯森說:“我們把忍者帶進(jìn)會議室,格雷格•科拉多站在白板前講解LSTM(長短期記憶,一種可以打造強(qiáng)大神經(jīng)網(wǎng)絡(luò)的技術(shù))。
他做著夸張的手勢,演示工作原理、利用何種數(shù)學(xué)原理、如何應(yīng)用到產(chǎn)品中。
霍爾蓋特成功挺過了訓(xùn)練,現(xiàn)在她正利用機(jī)器學(xué)習(xí)工具開發(fā)一項(xiàng)Android通訊功能,幫助谷歌員工交流。她正在調(diào)試超參數(shù),清理輸入數(shù)據(jù)。
開弓沒有回頭箭,因?yàn)樗靼譇I技術(shù)就是谷歌的現(xiàn)在和未來,甚至可能是一切技術(shù)和東西的未來。
機(jī)器學(xué)習(xí)時代已經(jīng)來臨,前景無比廣闊!