谷歌逆風(fēng)翻盤暴擊OpenAI,90天王者歸來!44頁報(bào)告押注25年三大技術(shù)前沿
逆襲之戰(zhàn)開啟,谷歌用90天重回巔峰!
短短90天,谷歌就從業(yè)內(nèi)笑柄,逆襲成突破最大、產(chǎn)品最顛覆的科技大公司。
用AI初創(chuàng)創(chuàng)始人Ole Lehmann的話說,「我們正在見證2024年最大的科技轉(zhuǎn)變」。
圖片
如今,前方是捷報(bào)頻傳。
根據(jù)OpenRouterAI的數(shù)據(jù),Google Gemini在開發(fā)者中的市場(chǎng)份額從9月份的約5%,上升到了上周的>50%市場(chǎng)份額。
圖片
Google Gemini系列在OpenRouterAI的趨勢(shì)排行中獨(dú)占鰲頭,遠(yuǎn)超其他模型。
圖片
在被公認(rèn)是下一個(gè)AI前沿的智能體領(lǐng)域,谷歌的Project Mariner,可以直接讓Gemini控制我們的瀏覽器,自行執(zhí)行任務(wù)!直接一步跨越到人機(jī)交互的未來。
圖片
驚人之處在于,Mariner是一個(gè)真正可以在瀏覽器上完成復(fù)雜任務(wù)而不會(huì)失敗的AI。預(yù)定航班、定餐館,它都可以通過在屏幕上看到的內(nèi)容完成操作。
此外,谷歌的Project Astra的早期測(cè)試報(bào)告結(jié)果也令人興奮不已。
圖片
受邀參加項(xiàng)目測(cè)試的Linus Ekenstam表示,這一天很快就會(huì)到來:人手一個(gè)AI私人助理,而且它們無所不在。
我們會(huì)嚴(yán)重依賴這些AI助手,甚至在2025年,人類發(fā)展格局都會(huì)被帶來重大改變。
圖片
更不用說,就在昨天放出的AI視頻模型Veo 2.0,無論是在物理學(xué)、質(zhì)量還是指令遵循上,效果都妥妥吊打Sora,全網(wǎng)測(cè)試,為之瘋狂。
有人實(shí)測(cè)Veo 2和Sora后直言:這是自行車和宇宙飛船的區(qū)別
現(xiàn)在,市場(chǎng)已經(jīng)給出了反應(yīng),在過去一個(gè)月內(nèi),谷歌的市值直接上漲了14%。
不再追逐頭條,而是集中精力做產(chǎn)品、注重實(shí)用性的谷歌,已經(jīng)成為了OpenAI真正的可怕對(duì)手。
圖片
突然逆襲,重拳反擊OpenAI
曾被認(rèn)為遙遙領(lǐng)先的OpenAI,正面臨著來自谷歌的迎頭痛擊。
網(wǎng)友Chubby做了一篇長(zhǎng)文分析,指出兩個(gè)AI巨頭的對(duì)戰(zhàn)潮流正在轉(zhuǎn)向。
聲明:目前一切都還未定論,我的分析僅是對(duì)現(xiàn)狀的一瞥
早在2017年,Sam Altman在一次郵件交流中就明確表示,谷歌DeepMind是在AGI競(jìng)爭(zhēng)中最大的對(duì)手。
當(dāng)時(shí),他還未能預(yù)見其他玩家會(huì)加入這場(chǎng)競(jìng)爭(zhēng)。不過,估值180億美金Anthropic的崛起,證明了新玩家也能翻身成巨頭。
Meta通過「開源」(雖然并非真正的開源)另辟蹊徑,避免了與谷歌占據(jù)主導(dǎo)地位路線的直接競(jìng)爭(zhēng)。
ChatGPT如同一匹黑馬,自2022年橫空出世以來,OpenAI一直牢牢掌握著AI的話語權(quán)。與此同時(shí),ChatGPT成為了「AI」的代名詞。
憑借此,奧特曼帶領(lǐng)著團(tuán)隊(duì)迅速征服消費(fèi)市場(chǎng),甚至直接帶飛了微軟。
然而,谷歌卻在這場(chǎng)競(jìng)賽中措手不及,連連敗北。
最初的幾輪交鋒中,谷歌試圖通過Gemini去挽救落下的成績(jī),并期望以此獲得市場(chǎng)青睞,但總是未能如意。
此前,AI Overview總結(jié)能力大翻車,遭到網(wǎng)友連連的吐槽。
比如,建議孕婦吸煙、建議自殺跳橋、建議用膠水將膠水和披薩固定在一起....
各種荒謬的建議,簡(jiǎn)直震碎三觀。
圖片
上半場(chǎng)的比賽中,谷歌徹底輸?shù)袅恕?/span>
更耐人尋味的是,OpenAI幾乎毫不費(fèi)力,每次都能在谷歌發(fā)布新產(chǎn)品前后搶盡風(fēng)頭。即便在模型推理能力上,到目前為止,OpenAI也一直是遙遙領(lǐng)先。
人們不理解的是,谷歌DeepMind擁有世界上最好的資源,為什么會(huì)在這場(chǎng)競(jìng)爭(zhēng)中略顯得倉促和被動(dòng)?
與OpenAI不同,他們有大量用于訓(xùn)練推理的TPU、更多的訓(xùn)練數(shù)據(jù)(比如YouTube),以及DeepMind這個(gè)世界級(jí)研究機(jī)構(gòu)和頂尖人才。
DeepMind團(tuán)隊(duì)也在努力用實(shí)力,去證明這一切。在科學(xué)領(lǐng)域,AlphaFold、GenCast等等,取得了難以置信的成就。
但這些研究成果,在消費(fèi)市場(chǎng)上并沒有給谷歌帶去任何實(shí)質(zhì)性的幫助。
甚至,就連Anthropic這樣后來者,也贏得了AI社區(qū)更多關(guān)注和支持。
然而,這種局勢(shì)在12月發(fā)生了戲劇性的逆轉(zhuǎn)。突然間,谷歌發(fā)力給OpenAI來了當(dāng)頭一棒。
就在OpenAI接連獻(xiàn)上12天產(chǎn)品秀之際,谷歌推出了兩款驚艷的模型——Gemini 2.0 Flash和Veo 2。
Gemini 2.0 Flash在所有基準(zhǔn)測(cè)試中,超越了GPT-4。
圖片
AI視頻模型Veo 2直接吊打Sora,展現(xiàn)出令人驚嘆的物理世界理解能力。
它還能根據(jù)提示中的方程式2x-1=0,直接生成出得到解答x=1/2的視頻。
圖片
相較之下,Sora的生成簡(jiǎn)直一言難盡。
圖片
關(guān)于新模型的亮相,谷歌并沒有做任何事先的炒作和預(yù)熱,用低調(diào)有力的方式做出了反擊。
而對(duì)于,過去一年總結(jié),和未來一年技術(shù)預(yù)測(cè),谷歌也有話要說。
谷歌AI年,2025年三大技術(shù)向
今天,Google Cloud發(fā)布的一份44頁「2024 數(shù)據(jù)和AI趨勢(shì)報(bào)告」,直指AI智能體、多模態(tài)AI,企業(yè)搜索將成為2025年三大主導(dǎo)技術(shù)。
圖片
報(bào)告地址:https://services.google.com/fh/files/misc/data_ai_trends_report.pdf
多智能體將催生出一個(gè)巨大的市場(chǎng)機(jī)會(huì)
當(dāng)前,智能體已經(jīng)能夠獨(dú)立完成多步驟任務(wù),而只有約10%的大公司已經(jīng)采用,另外82%公司計(jì)劃三年內(nèi)將智能體整合到工作流中。
谷歌云全球GenAI副總Oliver Parker表示,「不久的將來,你會(huì)看到不同智能體之間相互頻繁地交流協(xié)作」。
在谷歌,他們將智能體劃分為六個(gè)類:
- 面向客戶的智能體:用于了解客戶需求、回答與解決問題并推薦相應(yīng)的產(chǎn)品和服務(wù)。它們支持跨多模態(tài)工作,可以分析語音與視頻內(nèi)容
- 員工智能體:有助于簡(jiǎn)化流程、管理重復(fù)性任務(wù)、解答問題和文檔編輯與翻譯。
- 創(chuàng)意智能體:生成有助于設(shè)計(jì)、營(yíng)銷、文案等項(xiàng)目的內(nèi)容、圖像,提供靈感
- 數(shù)據(jù)智能體:可以在確保準(zhǔn)確性的基礎(chǔ)上,通過檢索與數(shù)據(jù)處理來協(xié)助研究和數(shù)據(jù)分析。
- 代碼智能體:支持代碼生成與提供輔助編碼
- 安全智能體:降低網(wǎng)絡(luò)攻擊的危害,或者加快安全漏洞的篩查速度
然而,Parker指出,過多的智能體同時(shí)處理多個(gè)流程,可能會(huì)導(dǎo)致系統(tǒng)的混亂。
他看到了這一現(xiàn)象背后蘊(yùn)藏著巨大的機(jī)遇,這將催生出全新的平臺(tái)——智能體治理。
圖片
「我們認(rèn)為一個(gè)巨大的機(jī)會(huì)即將到來,那就是一個(gè)能夠管理協(xié)調(diào)你各種智能體的平臺(tái)」,他講道,這將會(huì)催動(dòng)「智能體管理」或者需要一個(gè)支持 「在不同系統(tǒng)中的任何地方都能提供不同服務(wù)的智能體層」。
人工智能發(fā)展的五大趨勢(shì)
多模態(tài)AI將會(huì)帶來千億美元市場(chǎng)
全球多模態(tài)人工智能市場(chǎng)在2025年估值為24億美元,預(yù)計(jì)到2037年底將達(dá)到989億美元。
多模態(tài)人工智能將人工智能的理解能力提升到一個(gè)新的水平,使模型能夠解讀和處理一系列數(shù)據(jù)源,不僅包括文本,還包括圖像、視頻和音頻。
目前一些主要的供應(yīng)商和前沿的初創(chuàng)公司已經(jīng)發(fā)布了許多功能強(qiáng)大的多模態(tài)工具,例如谷歌自己的Gemini 2.0 Flash、Mistral的Pixtral 12B或Cohere的Embed 3。谷歌預(yù)測(cè),多模態(tài)人工智能的爆發(fā)將支持復(fù)雜的數(shù)據(jù)分析,并為人們帶來對(duì)于事物更深刻的基本認(rèn)識(shí)和更個(gè)性化的見解。
Parker指出,在過去的12個(gè)月里,企業(yè)已經(jīng)從單一模型轉(zhuǎn)變?yōu)獒槍?duì)不同的場(chǎng)景去部署多個(gè)模型,如Gemini、Anthropic、Mistral、Cohere、Llama等,而不僅僅是OpenAI模型。
雖然當(dāng)前谷歌云的重點(diǎn)依然大多在開發(fā)上,但2025年的目標(biāo)則是讓企業(yè)級(jí)用戶自己掌握生成式人工智能能力。
目前企業(yè)已經(jīng)不僅僅只是關(guān)注模型本身,而且開始分析不同的部署平臺(tái)并制定人工智能和智能體的規(guī)劃發(fā)展路線圖。Parker對(duì)此表示,這些通常是幾年內(nèi)才能看到的趨勢(shì),但在12個(gè)月內(nèi)就快速呈現(xiàn)了,令人驚嘆。
企業(yè)級(jí)搜索大幅提高信息獲取效率
你是否還在苦惱于查詢工作文檔卻因忘記對(duì)應(yīng)關(guān)鍵詞而無法入手項(xiàng)目?
現(xiàn)在結(jié)合了生成式人工智能的企業(yè)搜索,再也不用局限于僅基于關(guān)鍵詞的查詢了。
你可以使用圖像、音頻、視頻或者是對(duì)話提示來快速查詢?cè)L問企業(yè)內(nèi)部數(shù)據(jù)。毫無疑問,這將讓搜索變得極其絲滑。
在實(shí)際工作中,人們往往是搜尋到相應(yīng)信息并將其整合以獲得見解,做出相應(yīng)決策,進(jìn)而采取行動(dòng)。由于許多組織的不同信息通常分散在不同的應(yīng)用程序中,而人工智能搜索可以快速跨越這些應(yīng)用程序?qū)?shù)據(jù)整合在一起,這就彰顯了結(jié)合生成式人工智能的企業(yè)搜索的巨大優(yōu)勢(shì)。
Gemini 2.0加持編碼助手,一鍵打通軟件開發(fā)全流程
上周,谷歌發(fā)布的Gemini 2.0 Flash在編程基準(zhǔn)SWE-bench Verified上,刷新了SOTA。
圖片
它的性能完全碾壓滿血版o1、Claude 3.5 Sonnet,成為公認(rèn)的最強(qiáng)編碼AI。
就在今天,谷歌宣布在Gemini Code Assist中,集成最新模型Gemini 2.0 Flash,并推出了一系列工具。
圖片
由此,開發(fā)者們可以將外部系統(tǒng)加入IDE,直接與GitHub、GitLab、Sentry、Google Chrome和Atlassian交互。
圖片
在此之前,Gemini Code Assist已經(jīng)接入了VS Code和JetBrains。
谷歌云產(chǎn)品管理高級(jí)總監(jiān)Ryan J. Salva表示,這個(gè)想法是為編碼任務(wù)擴(kuò)展更多的上下文,而不中斷工作流程。
開發(fā)者只需進(jìn)入Code Assist聊天頁面,說明需要處理的數(shù)據(jù),然后LLM可以自動(dòng)從數(shù)據(jù)源查詢并對(duì)其分析。
圖片
為了給開發(fā)者們提供便捷,谷歌計(jì)劃未來還將更多工具,直接集成到Gemini Code Assist中,比如可觀察性工具、安全軟件以及數(shù)據(jù)庫。
從ChatGPT可以協(xié)助編碼之后,人工智能編碼助手是GenAI的首批重要用例。GitHub、甲骨文、Harness紛紛推出了以企業(yè)為重點(diǎn)的編碼助手。
與此同時(shí),OpenAI和Anthropic對(duì)外提供API接口,讓程序員直接在聊天平臺(tái)上編程。
比如,我們可以直接在ChatGPT中的Canvas運(yùn)行Python代碼,還能進(jìn)行交互性的編輯生成。
圖片
Anthropic推出的Claude Artifacts,與Canvas產(chǎn)品理念相同,皆是便于開發(fā)者們生成、編輯和運(yùn)行代碼。
另外,OpenAI還在ChatGPT MacOS桌面應(yīng)用程序中添加了與VS Code、XCode、Terminal和iTerm 2等工具的集成。
圖片
據(jù)Gartner估計(jì),「截止2028年,90%的企業(yè)軟件工程師將使用AI編碼助手,這一比例在2024年初還不到14%」。
谷歌宣稱,Gemini Code Assist企業(yè)版已超越了IDE中的AI編碼輔助功能,不僅可以理解本地代碼庫,還可以定制代碼,提供代碼建議。
它的定制功能可索引來自GitHub和GitLab的repos,并將于2025年初支持其他源碼控制系統(tǒng)和自托管的內(nèi)部repos。
同時(shí),它還能完成復(fù)雜的任務(wù),如在整個(gè)軟件包中升級(jí)Java版本。此外,企業(yè)版提供了企業(yè)級(jí)安全以及法律賠償條款。
在推出Gemini 2.0時(shí), 谷歌同步發(fā)布了編碼工具 Jules。
Salva表示Code Assist與其完全隔離,Code Assist仍是唯一由Gemini支持的通用企業(yè)級(jí)編碼工具。
圖片
參考資料:
https://venturebeat.com/ai/google-ai-agents-multimodal-ai-enterprise-search-will-dominate-in-2025/