谷歌DeepMind核心大佬被曝離職創(chuàng)業(yè),瞄準(zhǔn)AI智能體!曾是Gemini關(guān)鍵負(fù)責(zé)人
谷歌又被曝出有核心員工離職了!
這次跑路的竟是DeepMind的核心技術(shù)大佬,Gemini項(xiàng)目的四位主要開發(fā)者之一,Ioannis Antonoglou。
上圖左半部分列出了Gemini項(xiàng)目的36位領(lǐng)導(dǎo)者,自去年九月以來,包括Ioannis Antonoglou在內(nèi),已有四位主要成員離開。
Ioannis Antonoglou
在OpenAI以及背后微軟的擠壓之下,谷歌的日子貌似不太好過。
去年裁員12000多人,光遣散費(fèi)就花了幾十億美元,劈柴還宣布今年要持續(xù)裁員一整年,而一邊的OpenAI也在花心思挖角谷歌的高級(jí)人才。
另一方面,AI行業(yè)的大佬們?cè)诖竽P蛶淼淖兏镏邪l(fā)現(xiàn)了新的風(fēng)口,——比如AI智能體(Agent)。
越來越多的初創(chuàng)公司試圖在這個(gè)領(lǐng)域嶄露頭角,Antonoglou這次離職的目標(biāo)就是創(chuàng)辦自己的人工智能公司,并瞄準(zhǔn)Agent這個(gè)市場(chǎng)。
Antonoglou目前的兩位合伙人,Sherjil Ozair和Misha Laskin,也是之前一起參與Gemini項(xiàng)目的同事。據(jù)一位知情人士透露,他們已經(jīng)開始為自己的初創(chuàng)企業(yè)籌集資金。
——谷歌的科技帝國(guó)開枝散葉......也未嘗不是一件好事?
當(dāng)然,如果這家新公司決定涉足智能體領(lǐng)域,也將面臨眾多競(jìng)爭(zhēng)對(duì)手。
近期的初創(chuàng)公司,包括獲得General Catalyst支持的Adept(已籌集4.3億美元)和獲得Nvidia支持的Imbue(已籌集超過2億美元),都在從事智能體的研發(fā)。
其他的初創(chuàng)公司還包括HyperWrite和Lindy,而大公司沒準(zhǔn)也會(huì)來插一腳。
Antonoglou于2012年加入DeepMind。
2013年,Antonoglou作為七位作者之一,發(fā)表了一篇關(guān)于深度強(qiáng)化學(xué)習(xí)的論文,能夠在無需人類干預(yù)的情況下學(xué)習(xí),并掌握Atari視頻游戲。
這篇工作在NIPS 2013的Deep Learning Workshop中展示,而這一突破也引起了谷歌和Facebook領(lǐng)導(dǎo)層的注意,他們認(rèn)識(shí)到這可以用于增強(qiáng)自己的廣告業(yè)務(wù)。
2014年,谷歌以超過5億美元的價(jià)格收購(gòu)了只有約有75名員工的DeepMind。之后Antonoglou參與開發(fā)了擊敗圍棋頂尖人類選手的 AI。
有趣的是,OpenAI的團(tuán)隊(duì)也受此影響,采用類似技術(shù)開發(fā)了一個(gè)能玩Dota 2的AI系統(tǒng)。
還有上面提到的Antonoglou的合伙人Sherjil Ozair也是業(yè)內(nèi)的大佬。
Ozair去年夏天離開DeepMind加入Tesla,他之前也同Antonoglou 合作發(fā)表過一些文章,比如下面這篇來自PMLR'2021。
而他更加有名的一篇工作是我們大部人都非常熟悉的「GAN」(生成對(duì)抗網(wǎng)絡(luò))。
這篇開創(chuàng)性的工作為后續(xù)生成式AI模型的發(fā)展奠定了基礎(chǔ)。
「開枝散葉」
除了上面介紹的大佬,在過去兩年里,DeepMind和Google Brain的一些員工紛紛離職,開創(chuàng)了自己的新公司。
包括開發(fā)開源AI模型的Mistral AI,以及同樣致力于生成式AI模型的Sakana AI和Reka AI。
最近,又有三位在谷歌負(fù)責(zé)圖像和音樂方向的AI研究人員離職,據(jù)知情人士透露,他們成立了自己的AI初創(chuàng)公司Uncharted Labs。
這也揭示了谷歌內(nèi)部可能存在的結(jié)構(gòu)性問題,推出的AI產(chǎn)品錯(cuò)失良機(jī),而頂尖的研究人員則決定抓住外部機(jī)遇,抓住風(fēng)險(xiǎn)投資者對(duì)AI領(lǐng)域新公司的熱情。
文件顯示,這三位創(chuàng)始人已經(jīng)籌集了850萬美元,最近幾個(gè)月,他們還會(huì)見了包括Andreessen Horowitz在內(nèi)的潛在投資者。
三人團(tuán)隊(duì)的總裁是David Ding,他此前是Google DeepMind的技術(shù)負(fù)責(zé)人。
而另外兩位Charlie Nash和Yaroslav Ganin,是Ding之前在DeepMind的團(tuán)隊(duì)成員。Ding和Ganin在谷歌工作了五年以上。
Ding之前的團(tuán)隊(duì)還有一名成員Conor Durkan也在去年離職了。
在DeepMind,這四個(gè)人參與了一個(gè)項(xiàng)目,使AI能夠根據(jù)用戶的簡(jiǎn)單描述創(chuàng)造出原創(chuàng)的圖像和音樂。
去年11月,DeepMind公開了音樂生成模型Lyria,能夠從頭開始創(chuàng)作歌曲,包括利用Charlie Puth和John Legend等藝術(shù)家的人聲。
這幾個(gè)人還參與了Imagen 2的開發(fā),作為Midjourney和DALL·E 3(OpenAI )的競(jìng)品。
面對(duì)這不容樂觀的水土流失,谷歌被逼無奈,只好咬牙提高頂尖AI研究人才的待遇,使用特別的股獎(jiǎng)勵(lì)措施。
然而,對(duì)于那些致力于生成式AI的初創(chuàng)公司來說,輕松獲得風(fēng)險(xiǎn)投資的吸引力極大。
根據(jù)PitchBook和National Venture Capital Association的數(shù)據(jù)顯示,2023年在美國(guó),超過三分之一的風(fēng)險(xiǎn)投資涌向了AI領(lǐng)域。
AI 智能體未達(dá)預(yù)期
AI智能體的概念隨著生成式AI大模型的發(fā)展而開始流行,Agent可以自動(dòng)幫助人類處理線上購(gòu)物、訂票、會(huì)議等。
比如AutoGPT和BabyAGI,承諾能做到從預(yù)訂機(jī)票到回復(fù)短信等一切自動(dòng)化操作。然而,它們很快就暴露出了技術(shù)上的限制。
包括OpenAI推出的相關(guān)產(chǎn)品,目前也沒有什么實(shí)質(zhì)性的進(jìn)展。
現(xiàn)有的Agent執(zhí)行任務(wù)的能力參差不齊,還容易重復(fù)相同的行為模式,研究人員正也嘗試新的方法解決這些問題,比如開發(fā)更適合智能體任務(wù)的專用軟件,而不是依賴現(xiàn)成的模型。
HyperWrite的聯(lián)合創(chuàng)始人兼CEO Matt Shumer表示,AI智能體之所以未能如預(yù)期般發(fā)展,有幾個(gè)原因。
目前的智能體雖然能夠規(guī)劃并將目標(biāo)分解成子任務(wù)(比如將競(jìng)爭(zhēng)對(duì)手研究,分解為評(píng)估管理層、預(yù)測(cè)銷售額和成本計(jì)算),但是在執(zhí)行這些子任務(wù)時(shí)往往遇到困難。
同自動(dòng)駕駛一樣,智能體經(jīng)常會(huì)被從未遇到過的「邊緣情況」所困擾,這種失敗可能會(huì)削弱消費(fèi)者的信任。
另外,這個(gè)行業(yè)似乎面臨著與大型語(yǔ)言模型開發(fā)商同樣的問題:他們正試圖用風(fēng)險(xiǎn)資本解決一個(gè)長(zhǎng)期的研究問題,而投資者卻希望盡早看到成品和投資回報(bào)。
解決方案
傳統(tǒng)的AI智能體通常由三部分構(gòu)成:
一是像GPT-4這樣的大語(yǔ)言模型,負(fù)責(zé)規(guī)劃完成目標(biāo)所需的任務(wù);二是向量數(shù)據(jù)庫(kù),幫助智能體記住以往的行動(dòng)和目標(biāo)相關(guān)的重要背景信息;三是LangChain等工具,負(fù)責(zé)將這些組件連接起來。
而HyperWrite正在嘗試一種截然不同的結(jié)構(gòu)。根據(jù)請(qǐng)求的復(fù)雜程度,HyperWrite能將客戶的請(qǐng)求分配給不同的模型處理。
Shumer表示,GPT等傳統(tǒng)大語(yǔ)言模型僅能處理簡(jiǎn)單的網(wǎng)絡(luò)搜索,而HyperWrite的定制模型則更擅長(zhǎng)分析網(wǎng)頁(yè)內(nèi)容并與之交互,如點(diǎn)擊不同的按鈕。HyperWrite目前已有數(shù)千名付費(fèi)用戶。
與此類似,Imbue也在開發(fā)多種模型,包括大語(yǔ)言模型和多模態(tài)模型,以幫助AI智能體解決軟件編碼等問題。
為此,Imbue團(tuán)隊(duì)特別標(biāo)注訓(xùn)練數(shù)據(jù),使模型能夠理解博客文章或軟件代碼背后的邏輯。
Imbue的開發(fā)者會(huì)對(duì)模型訓(xùn)練數(shù)據(jù)中的代碼行進(jìn)行注釋,說明它們是如何為更大的軟件項(xiàng)目貢獻(xiàn)的。這樣一來,模型便能學(xué)會(huì)單行代碼如何協(xié)同工作,共同實(shí)現(xiàn)一個(gè)更廣泛的目標(biāo)。
另一種智能體的發(fā)展方向是專注于特定的任務(wù)。
比如,Imbue使用了多個(gè)專門解決特定問題的智能體,從修正代碼格式錯(cuò)誤到分析AI政策趨勢(shì)。這種專注于特定領(lǐng)域的方法減少了智能體遇到的問題邊緣情況。
Shumer認(rèn)為,隨著時(shí)間的推移,通用型模型將最終超越專用于特定任務(wù)的模型,但CRV的Vivian Cheng認(rèn)為,由于技術(shù)還處于初期階段,短期到中期內(nèi)很難開發(fā)出一個(gè)可靠的通用型智能體。
——也許「通用」和「專用」會(huì)在未來的某個(gè)時(shí)間點(diǎn)相遇吧,讓我們拭目以待。