謝爾蓋布林:谷歌不敢用 Transformer,作者剩一人了,現(xiàn)在我每天都在寫代碼
坐擁世界最大的搜索業(yè)務(wù),谷歌一直獨(dú)步于硅谷。搜索所帶來的豐厚廣告收入,讓兩位創(chuàng)始人謝爾蓋?布林 (Sergey Brin) 和拉里(Larry Page)可以退居二線,安心享受生活。
1997 年 9 月 15 日,謝爾蓋?布林和拉里·佩吉注冊(cè)了一個(gè)名為「谷歌」的網(wǎng)站
直到 2022 年底,ChatGPT 火遍全球,原本 AI 浪潮的引領(lǐng)者谷歌似乎才意識(shí)到地位發(fā)生了翻轉(zhuǎn)。最近一年以來,我們似乎習(xí)慣了這家科技巨頭作為「追趕者」出現(xiàn)。
從去年開始,就有媒體爆料,稱謝爾蓋?布林已經(jīng)重返一線,親自編寫代碼。前 CEO 埃里克?施密特(Eric Schmidt)更是在斯坦福大學(xué)的講座中直接向「每周只上一天班」的散漫制度開炮:「輸給 OpenAI,再下去要輸創(chuàng)業(yè)公司了」。
施密特在斯坦福演講
同時(shí),隨著谷歌的體量越來越大,一些「大公司病」的癥狀也越發(fā)明顯。許多谷歌的離職「小作文」顯示:谷歌問題的根源不是「技術(shù)」,而是在于「文化」,比如員工的使命感不足,公司為了避免風(fēng)險(xiǎn)設(shè)置了繁瑣的系統(tǒng)和流程。
AppSheet 創(chuàng)始人 Praveen Seshadri 宣布離開谷歌,他的博客稱,公司已迷失方向,員工被困在系統(tǒng)里。
谷歌到底出了什么問題?Alphabet 工人工會(huì)表示:「真正阻礙谷歌員工每天工作效率的是人員不足、優(yōu)先事項(xiàng)的不斷變化、頻繁的裁員、工資停滯不前以及管理層在項(xiàng)目跟進(jìn)上的不足?!?/p>
雖然谷歌在「ChatGPT 反擊戰(zhàn)」迎頭趕上,但和 OpenAI 評(píng)論區(qū)下期待 GPT-5 發(fā)布的畫風(fēng)有些不同,Gemini 亮相時(shí),總會(huì)在不經(jīng)意間「翻車」。首次發(fā)布就出現(xiàn)了 demo 造假,此后,Gemini 也因生成的人像圖片存在種族偏見,建議每個(gè)人一天吃一塊石頭、用膠水來黏合披薩上的芝士,挨了不少批評(píng)。
上個(gè)月,谷歌發(fā)布了加強(qiáng)版的 Gemini,還推出了對(duì)標(biāo) GPT-4o 的語音助手 Gemini Live,但在演示環(huán)節(jié),Gemini Live 還是出錯(cuò)了。
在 8 月舉辦的 Made by Google 活動(dòng)上,前兩次試用 Gemini Live 的拍照識(shí)圖功能都失敗了,直到第三次換手機(jī)才成功。
明明已經(jīng)財(cái)富自由,為什么還要重返技術(shù)一線?頻頻「翻車」的 Gemini,谷歌內(nèi)部如何看待?在科技巨頭的競爭中,谷歌存在什么問題?在這場競爭中又將扮演怎樣的角色?在昨天舉辦的 All-In 峰會(huì)現(xiàn)場,久未在媒體前露面的謝爾蓋?布林在一場訪談中聊了聊他的看法。
布林的主要觀點(diǎn)為:
- 決定重返技術(shù)前線,是因?yàn)?AI 領(lǐng)域的進(jìn)展太過激動(dòng)人心,作為計(jì)算機(jī)科學(xué)家,他不愿意錯(cuò)過這一波浪潮。
- AI 技術(shù)不只是搜索的延伸,它將觸及更廣泛的變革。
- 相比于專精于某個(gè)領(lǐng)域的「專家模型」,布林更看好通用模型,谷歌成功拿下 IMO 銀牌模型,這源于谷歌在之前開始將形式證明模型中的某些知識(shí)和能力融合到通用語言模型之中的嘗試。
- 目前對(duì)于算力的需求源源不斷,但很難出現(xiàn)「從 100 兆瓦到 1 吉瓦、10 吉瓦,甚至 100 吉瓦」的需求激增。
- 在人工智能應(yīng)用領(lǐng)域,布林認(rèn)為生物學(xué)已經(jīng)較好地實(shí)現(xiàn)了 AI 技術(shù)的落地應(yīng)用,而機(jī)器人領(lǐng)域還是看完演示覺得很神奇的階段,沒有達(dá)到日??梢允褂玫乃?。
- 雖然 AI 偶爾會(huì)犯大錯(cuò),但更應(yīng)及時(shí)發(fā)布。AI 不是那種你緊緊捂在懷里、隱藏起來、直到它變得完美無缺的技術(shù)。比 AI「犯蠢」更可怕的是,當(dāng)時(shí)谷歌太膽小,都不敢部署 Transformer,論文作者曾都離職了。
- 科技巨頭在 AI 領(lǐng)域的競爭實(shí)際是好事,不過布林還是會(huì)密切關(guān)注大模型排行榜。
以下是訪談全文:
布林:我本來以為我只是來參加一個(gè)播客,沒想到現(xiàn)場有這么多觀眾,恭喜你的事業(yè)這么成功,整得我都有點(diǎn)害羞了。
主持人:感謝您抽空和我聊天。當(dāng)今,AI 正處于改變世界的臨界點(diǎn)。1998 年,你和拉里(Larry Page)成立了谷歌。聽說最近你親自上陣,在谷歌研究 AI。大型語言模型和對(duì)話式 AI 工具對(duì)谷歌搜索來說是一種威脅,這是許多行業(yè)分析師和專家爭論的話題。所以你現(xiàn)在每天在谷歌坐多長時(shí)間的班?都在做什么?
布林:老實(shí)說,我?guī)缀趺刻於既ド习?,不過今天因?yàn)橐夏愕墓?jié)目,所以缺席一天。作為一名計(jì)算機(jī)科學(xué)家,我我從未見過像最近幾年 AI 領(lǐng)域這樣激動(dòng)人心的進(jìn)展。AI 的進(jìn)步實(shí)在是太震撼了!
回想 90 年代,我還是研究生時(shí),AI 在課程中幾乎無足輕重,充其量不過是教材中的一個(gè)腳注。課本里講的是,前人做了各種各樣的試驗(yàn),但是 AI 真的不起作用,搞 AI 就是「死路一條」。這就是關(guān)于 AI 你需要知道的一切。
然后不知怎的,奇跡般地,這些研究神經(jīng)網(wǎng)絡(luò)的人,讓在 60、70 年代被丟棄的 AI 方法開始取得進(jìn)展 —— 更多的計(jì)算,更多的數(shù)據(jù),更聰明的算法..... 過去的十年里發(fā)生的事情簡直令人驚嘆。如今的 AI 工具,幾乎每個(gè)月都能展現(xiàn)出全新的能力,而且這些能力很快就能翻倍。計(jì)算機(jī)展現(xiàn)出的能力著實(shí)令人驚嘆。因此,我決定重返技術(shù)前線,因?yàn)槲也辉稿e(cuò)過作為計(jì)算機(jī)科學(xué)家所能體驗(yàn)到的這一切。
主持人:你覺得 AI 是搜索的延伸,還是它將重新定義人們檢索信息的方式?
布林:我認(rèn)為 AI 觸及著日常生活的方方面面,搜索是其中之一。AI 的影響力幾乎無所不包,例如編程。我現(xiàn)在對(duì) AI 編程有所改觀。從頭開始編寫代碼,真的很難,特別是和指揮 AI 編程對(duì)比起來,對(duì)吧?
主持人:你都用 AI 編寫了什么呢?
布林:事實(shí)上,我自己也寫了一點(diǎn)代碼,不過只是為了找點(diǎn)樂子。我有時(shí)也讓 AI 為我寫代碼,體驗(yàn)很有趣。舉個(gè)例子來說,我想知道谷歌的 AI 模型玩數(shù)獨(dú)(Sudoku)玩得怎么樣。于是,我讓 AI 模型自己寫了很多代碼,可以自動(dòng)生成數(shù)獨(dú)謎題,然后再把這些題喂給 AI,拿去評(píng)分。AI 完全能夠勝任編寫這些代碼的任務(wù)。
但當(dāng)我和工程師們談?wù)撨@件事的時(shí)候,來回辯論了幾輪,結(jié)果我半小時(shí)后回來,發(fā)現(xiàn) AI 已經(jīng)完成了。他們很震撼,很顯然,他們并不像我所認(rèn)為的那樣,經(jīng)常使用 AI 工具來輔助編碼。
數(shù)獨(dú)游戲(Sudoku)
主持人:這太好笑了。有的模型擅長解數(shù)獨(dú)題,有的模型可以回答我世界中的事實(shí)信息,有的模型專用于設(shè)計(jì)房子。同時(shí),眾多研究者正致力于開發(fā)通用的大型語言模型。你認(rèn)為未來將會(huì)朝著哪個(gè)路線發(fā)展呢?
我也不知道這種說法從何而起,說將會(huì)有一個(gè)「上帝模型」。這就是為什么投資人都在往 AI 里砸錢,一旦「上帝模型」被研發(fā)出來,那你就能「一步登天」了,當(dāng)你擁有 AGI,你可以統(tǒng)治所有事物?;蛘哂泻芏嗷谔囟☉?yīng)用的小模型,在智能體中協(xié)作。你認(rèn)為未來的模型開發(fā)與應(yīng)用將會(huì)如何演變呢?
布林:如果你回顧 10 到 15 年前,那時(shí),不同的 AI 技術(shù)被用于解決完全不同的問題。比如,下棋的 AI 與圖像生成技術(shù)就非常不同,它們各自有著很大的差異。
主持人:就像最近谷歌發(fā)了一個(gè) GNN 模型,它的表現(xiàn)優(yōu)于所有物理預(yù)測模型。我不確定你知不知道,但是確實(shí)是谷歌發(fā)的。
布林:太棒了,但我不知道(尷尬)。
主持人:這個(gè)模型就是一個(gè)完全不同的架構(gòu)。
布林:以歷史的眼光來看,AI 確實(shí)存在著多種不同的系統(tǒng)。以最近舉行的國際數(shù)學(xué)奧林匹克競賽(IMO)為例,谷歌的模型獲得了銀牌,離金牌就差一分(詳情可以參考機(jī)器之心之前的報(bào)道:谷歌 AI 拿下 IMO 奧數(shù)銀牌,數(shù)學(xué)推理模型 AlphaProof 面世,強(qiáng)化學(xué)習(xí) is so back)。
實(shí)際上,我們采用了三種 AI 模型:一種負(fù)責(zé)定理證明,一種專注于幾何問題,還有一種是通用的語言模型。然而,就在幾個(gè)月前,我們開始嘗試從之前的工作中吸取經(jīng)驗(yàn),開始將形式證明模型中的某些知識(shí)和能力融合到通用語言模型之中。
這項(xiàng)工作還在進(jìn)行,但我認(rèn)為趨勢將朝著構(gòu)建一個(gè)更加統(tǒng)一的模型方向發(fā)展。我不確定它就是所謂的「上帝模型」,但可以肯定的是,我們正在朝著某種共享架構(gòu),甚至是共享模型的方向發(fā)展。
主持人:如果這就是未來的方向,那么為了訓(xùn)練和完善那個(gè)超大模型,勢必需要?jiǎng)佑谬嫶蟮挠?jì)算資源。
布林:算力不可或缺。我讀過一些文章,它們預(yù)測算力需求將激增,從 100 兆瓦到 1 吉瓦、10 吉瓦,甚至 100 吉瓦。我對(duì)此持保留意見。近年來,算法的創(chuàng)新和優(yōu)化,已帶來比增加硬件算力更顯著的性能提升。
主持人:那么,當(dāng)前對(duì)算力的大量投入不合理嗎?每個(gè)人都在談?wù)撚ミ_(dá)的收益、利潤、市值。它支持了超大規(guī)模計(jì)算和基礎(chǔ)設(shè)施的增長,使得構(gòu)建這些龐大的模型成為可能。這種趨勢真的沒有道理嗎?或許它確實(shí)有道理,要不然為什么英偉達(dá)能賺這么多?
布林:首先聲明,我并非經(jīng)濟(jì)學(xué)家或市場分析師,我的觀點(diǎn)僅基于計(jì)算機(jī)科學(xué)家的視角。對(duì)我們來說,因?yàn)槊鎸?duì)巨大的需求,我們正在盡可能快地構(gòu)建算力集群。比如,谷歌云的客戶只想要大量的 PPU、GPU,應(yīng)有盡有。我們不得不拒絕客戶,因?yàn)槲覀冏约嚎ú粔蛴?,我們?nèi)部也依賴這些資源來訓(xùn)練和部署我們自己的模型。因此,我認(rèn)為各大公司目前都在積極擴(kuò)充算力,這都很合理。我只是覺得,很難直接從現(xiàn)狀做出未來算力需求會(huì)從「100 兆瓦增長到 1 吉瓦、10 吉瓦,甚至 100 吉瓦」這種推斷。
主持人:但企業(yè)需求就擺在那里。
布林:我明白,客戶們有著廣泛的需求,他們希望在各種 AI 模型上執(zhí)行推理任務(wù),并將這些模型應(yīng)用于層出不窮的新場景中。他們的這些需求暫時(shí)是沒有上限的。
主持人:在 AI 的應(yīng)用領(lǐng)域,無論是機(jī)器人學(xué)還是生物學(xué),您認(rèn)為哪些方面取得了最顯著的成就?有沒有用例讓你覺得「哇,這太有用了」?又有哪些領(lǐng)域挑戰(zhàn)較大,應(yīng)用落地可能比預(yù)期更久?
布林:我的答案是生物學(xué)。Alphafold 已經(jīng)推出一段時(shí)間了。它已經(jīng)推出一段時(shí)間,而且我與生物學(xué)家交流時(shí)發(fā)現(xiàn),幾乎人人都在使用它。Alphafold 的最新版本,Alphafold 3,代表了一種新型的 AI 技術(shù)。正如我之前提到的,我相信未來的趨勢是模型的統(tǒng)一化。
對(duì)于機(jī)器人,我處于一個(gè)「wow 階段」,比如,「哇,機(jī)器人竟然可以做家務(wù)了!」但你要知道,它背后可能只是一個(gè)微調(diào)了一下的通用語言模型,雖然它很神奇,但大多數(shù)情況下,它們還沒有達(dá)到日常可以使用的水平。
主持人:你看到機(jī)器人的前景了嗎?
布林:可能吧...... 但是我沒有看到具體的......
主持人:但你們谷歌不是也有機(jī)器人業(yè)務(wù)嗎?雖然后來被拆出去了,還被賣了。
布林:谷歌曾在做機(jī)器人的生意。
主持人:可能只是時(shí)機(jī)不對(duì)。
布林:坦白說,那可能是我們過于超前了。波士頓動(dòng)力公司有那么多明星產(chǎn)品,但我甚至不記得谷歌做出過什么。無論如何,我們有過五六個(gè)令人尷尬的產(chǎn)品,但它們很酷,能給人留下深刻的印象。只是看到現(xiàn)在的通用語言模型有多能干,多模態(tài)技術(shù)能讓機(jī)器人理解場景,想想當(dāng)年還是有點(diǎn)傻。當(dāng)時(shí)還沒有這些 AI 技術(shù),我們就像是在跑步機(jī)上原地踏步,難以向前邁進(jìn)。
谷歌開發(fā)機(jī)器人的計(jì)劃曾有一手好牌:「Android 之父」安迪?魯賓(Andy Rubin),大名鼎鼎的機(jī)器人制造商波士頓動(dòng)力,名動(dòng)一時(shí)的人形機(jī)器人 Atlas…… 不過,就在短短五年時(shí)間里,計(jì)劃解散重組,再解散再重組。高管相繼離職,銷售計(jì)劃叫停,幾大王牌公司各自賣身...
主持人:你在核心技術(shù)的研發(fā)上投入了大量時(shí)間。在產(chǎn)品方面,你是否也投入了相當(dāng)?shù)木??在一個(gè) AI 無處不在的未來世界中,人機(jī)交互的方式將如何演進(jìn),我們的日常生活又將發(fā)生怎樣的變化呢?
布林:這好像在茶水間和同事聊天的話題。
主持人:介意和我們分享一下嗎?
布林:不介意,我在回想一些不會(huì)令人尷尬的事情,掙扎 ing。
主持人:講「你有一個(gè)朋友」的故事也行。
布林:未來會(huì)怎么樣,真的很難講。AI 的技術(shù)是實(shí)現(xiàn)應(yīng)用的基礎(chǔ)。比如有人放出了一個(gè)炸裂的 demo,特別驚艷,但從演示到真正在生產(chǎn)中實(shí)現(xiàn),這需要時(shí)間。我不知道你是否嘗試過 Astra 模型,你可以與它打?qū)崟r(shí)視頻,它能說出你身邊環(huán)境中發(fā)生的事情。
主持人:你可以用對(duì)吧。
布林:我肯定會(huì)拿到訪問權(quán)限的。有時(shí)候,我可能是最后一批獲得權(quán)限的人。目前,我們已經(jīng)來到了一個(gè)這樣的階段,體驗(yàn)了 AI 之后,人們可能會(huì)驚嘆:「哦,我的天,這真是太神奇了?!谷缓竽銜?huì)思考,「好吧,它 90% 的情況下都能正確運(yùn)行?!沟又憧赡軙?huì)質(zhì)疑,「如果還有 10% 的情況下會(huì)出現(xiàn)錯(cuò)誤或反應(yīng)遲緩,這樣的技術(shù)真的夠好嗎?」于是,我們必須努力去完善這些細(xì)節(jié),確保它既迅速又可靠,等等。當(dāng)這一切真正實(shí)現(xiàn)時(shí),那確實(shí)是一種令人驚嘆的成就。
主持人:我聽說了一個(gè)故事,應(yīng)該在上臺(tái)之前和你通一下氣的。在一次發(fā)布會(huì)之前,一群工程師向你展示了 AI 可以用來編寫代碼,他們說:「我們尚未在 Gemini 中部署它,因?yàn)槲覀兿氪_保它不會(huì)出錯(cuò)。」谷歌有一些這樣「猶豫不決」的企業(yè)文化。當(dāng)時(shí)你說:「不,既然它能寫代碼,那就應(yīng)該推出?!购芏嗳硕冀o我講過這個(gè)故事。因?yàn)樗麄冋J(rèn)為,「從你這位創(chuàng)始人口中聽到這樣的言論極為重要,這表明保守主義還沒有完全占領(lǐng)谷歌,我們期待看到谷歌繼續(xù)引領(lǐng)創(chuàng)新。」這樣的描述準(zhǔn)確嗎?你真的這樣說過嗎?
布林:我不記得具體細(xì)節(jié)了。老實(shí)說,這確實(shí)很像我會(huì)做的事。
主持人:對(duì)我來說,這就會(huì)成為一個(gè)問題,因?yàn)楣雀璧囊?guī)模已經(jīng)如此之大,一旦出現(xiàn)失誤,就會(huì)損失慘重。
布林:那我還是有害怕的事的?,F(xiàn)在語言模型的起點(diǎn),要追溯到 6 年前還是 8 年前哪篇 Transformer 論文。但是這些論文作者中 Noam 回谷歌了。當(dāng)時(shí)我們太膽小,都不敢部署 Transformer。
布林:而且無論 AI 的能力有多強(qiáng)大,它們有時(shí)仍會(huì)犯錯(cuò)誤,仍會(huì)說出一些令人尷尬的話。但同時(shí),AI 已經(jīng)可以幫助我們從未做過的事情。比如我和我的孩子們一起編程,處理一些極其復(fù)雜的問題。
僅僅通過向 AI 咨詢,他們就能直接上手編程,學(xué)會(huì)那些通常需要花費(fèi)一個(gè)月時(shí)間去學(xué)習(xí)的各種復(fù)雜 API 和工具。這種能力近乎神奇。我們需要準(zhǔn)備好面對(duì)一些錯(cuò)誤,并勇于承擔(dān)風(fēng)險(xiǎn)。我相信我們?cè)谶@方面的應(yīng)對(duì)已經(jīng)有所改進(jìn)。當(dāng)然,你們可能已經(jīng)見過很多 AI「犯蠢」的時(shí)刻了,但......
主持人:這是可以接受的。畢竟,你早已財(cái)富自由,坐擁巨額股票。我的意思是,你愿意接受這些尷尬,因?yàn)樵谶@個(gè)階段這么做非常重要。
布林:我這么做不是因?yàn)槲业墓善保脝??但是想想我真能接受這些錯(cuò)誤嗎?這就是我們呈現(xiàn)給世界的神奇之物嗎?我覺得我們所需要傳達(dá)的是,「看,這個(gè)東西很神奇」。AI 偶爾會(huì)犯大錯(cuò),但我認(rèn)為我們應(yīng)該及時(shí)發(fā)布,讓人們?nèi)?shí)驗(yàn),看看能找到什么新應(yīng)用。AI 不是那種你緊緊捂在懷里、隱藏起來、直到它變得完美無缺的技術(shù)。
主持人:您是否認(rèn)為人工智能對(duì)世界的影響力如此深遠(yuǎn),創(chuàng)造的價(jià)值如此巨大,以至于這不再是谷歌、Meta 和亞馬遜之間的一場簡單競爭?大家都把它看作是一場商戰(zhàn),但是有沒有這種可能,AI 做出的蛋糕如此大,你們正在探索的領(lǐng)域如此廣泛,遠(yuǎn)不止于誰打造了得分最高的模型,誰的 LLM 性能最出色?你如何看待如何看待 AI 帶來的廣闊前景,谷歌在其中將扮演怎樣的角色?
布林:我認(rèn)為競爭在某種程度上是非常有幫助的,因?yàn)樗锌萍即髲S都在爭奪,順便說一下,幾周前在某個(gè)排行榜上,谷歌是第一名,并且我上次檢查時(shí),我們?nèi)匀粨魯×隧敿?jí)模型。只是......
主持人:有幾個(gè)指標(biāo)不好。所以你確實(shí)是在乎模型評(píng)分的!
布林:我沒說我不在乎啊。ChatGPT 問世時(shí),谷歌確實(shí)落后了一大截,現(xiàn)在我們已經(jīng)取得了長足的進(jìn)步。我對(duì)谷歌現(xiàn)在取得的所有進(jìn)步非常滿意。因此,我們肯定會(huì)密切關(guān)注模型排行榜。我認(rèn)為有這么多 AI 公司存在是好事,無論是 OpenAI、Anthropic,還有 Mistral,這代表著 AI 領(lǐng)域正在迅速擴(kuò)張,充滿活力。
對(duì)于你的問題,我認(rèn)為 AI 對(duì)人類來說有巨大的價(jià)值。如果回想一下我的大學(xué)時(shí)代,那時(shí)還沒有我們今天所熟知的互聯(lián)網(wǎng),想要獲取基本信息、與人溝通都需要付出巨大的努力。在手機(jī)普及之前,我們已經(jīng)在全球范圍內(nèi)獲得了巨大的能力提升,而如今的 AI 技術(shù),無疑是另一項(xiàng)重大的能力飛躍?,F(xiàn)在,幾乎每個(gè)人都能以某種方式接觸到 AI。我認(rèn)為這是非常令人興奮的,真是太棒了。