谷歌創(chuàng)始人正式回歸,加入LLM大戰(zhàn)!指導Gemini研發(fā),與OpenAI、Meta混戰(zhàn)一觸即發(fā)
已辭職四年的谷歌聯(lián)合創(chuàng)始人,終于回歸了!
根據(jù)華爾街日報報道,謝爾蓋·布林(Sergey Brin)已經重返工作崗位,協(xié)助谷歌的AI研究人員建立強大的Gemini系統(tǒng)。
圖片
聯(lián)合創(chuàng)始人,重返大模型戰(zhàn)場
最近幾個月,身家過億萬的謝爾蓋·布林每周三到四天都會到訪加州山景城的谷歌辦公室,與研究人員一起推動谷歌的下一個大型AI系統(tǒng)。
圖片
在2019年,謝爾蓋·布林辭去了谷歌母公司Alphabet的職務后,幾乎徹底放權,很少干涉公司業(yè)務。
但從去年底開始,他開始多次參加谷歌舉辦的關于AI的會議,頻率明顯變高。
據(jù)報道,關于谷歌期待已久的AI模型Gemini,他在和研究人員密切合作,研究AI程序「損失曲線」之類的問題。
知情人士表示,謝爾蓋·布林甚至還干預了人事問題,會關心搶人大戰(zhàn),督促谷歌雇傭最熱門的研究人員。
開發(fā)者大會后,股價一路上漲
谷歌雖然做了許多AI的開創(chuàng)性技術,但是轉化為新產品的速度比競爭對手慢。
AI研究的競爭正在加劇,Meta最近推出的Llama 2 ,更是大顯風頭。
谷歌計劃建立通用的AI程序Gemini,據(jù)說可以和GPT-4一戰(zhàn)。
圖片
負責Gemini項目的谷歌高管Demis Hassabis曾在最近的全公司會議上告訴員工,Gemini會在今年晚些時候推出。
1998年,還是斯坦福大學博士生的謝爾蓋·布林和拉里·佩奇在研究網(wǎng)絡搜索,基于這項研究,他們一起創(chuàng)立了谷歌。
從斯坦福大學讀博開始,兩人就一直在一起工作
根據(jù)S&P Capital IQ的數(shù)據(jù),他是谷歌母公司Alphabet僅次于拉里·佩奇的第二大個人股東,其股份價值接近900億美元。
辭職后,謝爾蓋·布林的注意力主要集中在公益(比如新形式的救災援助)和飛艇上。
自從谷歌在五月的開發(fā)者大會宣布一系列注入AI的產品(比如新版本的搜索引擎),母公司Alphabet的股價已經上漲了10%以上。
圖片
這個股價漲幅和老對手微軟的股價以及納斯達克綜合指數(shù)都保持一致。
四年前,謝爾蓋·布林和拉里·佩奇退出了日常工作,把劈柴提拔為谷歌的CEO后,會定期和他交談,為他提供建議和鼓勵,但并不會每天都嘮叨他。
當然,他們仍然控制著谷歌的大部分投票權,并且和劈柴一起擔任執(zhí)行委員會的成員。
據(jù)說,劈柴對于謝爾蓋·布林的回歸表現(xiàn)得十分興奮,并且鼓勵他多多貢獻。
谷歌大腦和DeepMind合體
早在2011年,谷歌大腦就成立了,研究如何使用深度學習來構建可廣泛應用的AI程序。
而今年,劈柴決定將谷歌大腦和DeepMind合并,合并后,DeepMind的CEO Hassabis成為了新集團谷歌DeepMind的CEO。
圖片
Hassabis和谷歌DeepMind的許多高管都在倫敦工作,這使得倫敦辦公室成為新機構事實上的權力中心。
而現(xiàn)在,謝爾蓋·布林的回歸,可以視為對谷歌AI團隊過渡時期的一種有益干預。
許多谷歌員工表示,研究者們非常歡迎謝爾蓋·布林的參與,認為這是對自己工作的一種認可。
Gemini或成為GPT-4最強對手
此前,Hassabis曾對媒體爆料,Gemini合并了AlphaGo和類GPT-4大模型的Gemini,在數(shù)月后就會發(fā)布
一個是用強化學習擊敗人類圍棋冠軍、創(chuàng)造歷史的AI系統(tǒng),一個是目前霸榜幾乎所有大模型榜單、一騎絕塵的最強多模態(tài)大模型,谷歌要將這兩個AI合體。
為此,谷歌DeepMind已經準備砸進數(shù)千萬美元,甚至數(shù)億。
圖片
將AlphaGo與GPT-4等大模型的語言功能合并后,Gemini系統(tǒng)解決問題和規(guī)劃的能力將大大增強。
而由于Gemini整合使用了強化學習和樹搜索的AlphaGO,也會有很多升級。
比如強化學習允許AI通過從反復嘗試和反饋中學習,解決挑戰(zhàn)性難題;樹搜索方法有助于探索和記住場景中可能的移動,比如在游戲場景中。
2017年,AlphaGo Zero沒有使用人類數(shù)據(jù),就迅速超越了AlphaGo
另外,其他領域技術(如機器人和神經科學)也會整合到Gemini中。
Hassabis表示,「可以這么說,Gemini把AlphaGo系統(tǒng)的一些優(yōu)勢,和大語言模型驚人的語言能力結合在一起了。并且,我們還有一些其他有趣的創(chuàng)新?!?/span>
據(jù)說,Gemini具有以前模型中沒有的多模態(tài)功能,在集成工具和API方面非常高效。
而且,Gemini將提供多種規(guī)模,旨在支持未來內存和規(guī)劃上的創(chuàng)新。
在三月份,曾經有這樣一個說法:Gemini會像GPT-4一樣,具有一萬億個參數(shù)。而且,據(jù)說Gemini將使用數(shù)以萬計的谷歌TPU AI芯片進行訓練。
圖片
在上個月的谷歌開發(fā)者I/O大會上,谷歌就曾提到,從一開始,Gemini的目標就是多模態(tài)、高效集成工具、API。
而當時谷歌的預告是:「雖然還在早期,但我們已經在Gemini中,看到了在之前的模型中從未見過的多模態(tài)能力,這讓人印象太深刻了?!?/span>
比如像LeCun這樣的AI大佬就表示,Transformer將語言模型的能力過度限制在了文本的范圍之內。
像人類和動物?樣,從世界的物理經驗中學習可能才是發(fā)展人工智能的最優(yōu)解。
圖片
也許在Gemini身上,人工智能將展示出其他方向的潛力。
很明顯,Gemini是谷歌的背水一戰(zhàn)。