?對(duì)標(biāo)DeepSeek,Gemini 2.0輕量模型開(kāi)卷“極致性?xún)r(jià)比”!谷歌守住多模態(tài)陣地應(yīng)用們都要開(kāi)始做推理了! 原創(chuàng)
編輯 | 伊風(fēng)
出品 | 51CTO技術(shù)棧(微信號(hào):blog51cto)
DeepSeek的火熱,讓Google坐不住了!
深夜,Google推出了Gemini 2.0全家桶,一口氣推出了三個(gè)模型型號(hào):Gemini 2.0 Flash、Gemini 2.0 Flash-LiteGemini 2.0 Pro。
圖片
看技術(shù)報(bào)告,2.0系列的三個(gè)模型在通用、代碼、推理、事實(shí)性、多語(yǔ)言等方面指標(biāo)如下。比起此前Gemini 1.5系列著實(shí)有了多維度的進(jìn)化,但明顯沒(méi)有性能的斷層式飛躍。
圖片
再來(lái)看最近AI圈關(guān)注的重中之重——推理。谷歌也在Gemini 2.0的技術(shù)報(bào)告里強(qiáng)調(diào)了一把,Gemini 2.0 Flash Thinking全面上線(xiàn)了!
圖片
外媒TechCruch,在報(bào)道中明說(shuō)了谷歌不甘自家推理模型受冷落,想借2.0更新的檔口加一把火的意思:“Google 和 DeepSeek 都在去年 12 月發(fā)布了 AI 推理模型,但 DeepSeek 的 R1 模型受到了更多關(guān)注。如今,Google 可能希望通過(guò)廣受歡迎的 Gemini 應(yīng)用,讓更多用戶(hù)接觸到其 Gemini 2.0 Flash Thinking 模型?!?/p>
其中最大的亮點(diǎn),就是谷歌直接把推理放到了YouTube、Maps 和 Search里!也就是說(shuō),你可以直接讓Gemini 2.0 Flash Thinking幫你推理下油管近期的爆款視頻元素。
這點(diǎn)還是很讓人振奮的,感覺(jué)谷歌終于聰明了一把,應(yīng)用們集體做推理的時(shí)代已經(jīng)不遠(yuǎn)了!
還有一個(gè)與DeepSeek相關(guān)的趣事,在AI界“拼多多”的影響下,谷歌也開(kāi)始玩極致性?xún)r(jià)比了。
帶隊(duì)Gemini 2.0的大佬Logan都出來(lái)打了個(gè)廣告,稱(chēng)Gemini 2.0 Flash是最“劃算”的大模型了,抓緊用吧!
圖片
Logan說(shuō)得不錯(cuò),尤其是輕量的Gemini 2.0 Flash-Lite模型,其定價(jià)更低:
輸入:$0.075/百萬(wàn) tokens
輸出:$0.30/百萬(wàn) tokens
相比之下,市場(chǎng)上的其他 LLM:
OpenAI 4o-mini:$0.15(輸入) / $0.6(輸出)
Anthropic Claude:$0.8(輸入) / $4(輸出)
DeepSeek V3:$0.14(輸入) / $0.28(輸出)
看來(lái)AI圈的又一波降價(jià)促銷(xiāo)即將到來(lái),不過(guò),Gemini 2.0 與 DeepSeek-R1、OpenAI o3的推理還是有相當(dāng)大的區(qū)別,就像是把“蘋(píng)果與橙子”放在一起比較。
1.多模態(tài)仍是谷歌核心優(yōu)勢(shì),多應(yīng)用接入未來(lái)可期
從這張時(shí)間表來(lái)看,Google 的核心優(yōu)勢(shì)仍然在多模態(tài)能力上。
圖片
此前,Google DeepMind 的 CTO Koray Kavukcuoglu 在公司博客中寫(xiě)道:“這些模型在發(fā)布時(shí)將支持多模態(tài)輸入(文本輸出),并將在未來(lái)幾個(gè)月內(nèi)開(kāi)放更多模態(tài)的全面使用。”
在谷歌生態(tài)里,多模態(tài)能力發(fā)揮的空間很大。推特博主@Paul Couvert說(shuō),作為首個(gè)能夠訪(fǎng)問(wèn) YouTube 的推理模型,AI已經(jīng)能幫你量身寫(xiě)作短視頻腳本了,tips 如下:
- 搜索與您的主題相關(guān)的視頻
- 讓 Gemini 對(duì)視頻進(jìn)行思考
- 您將在 10 秒內(nèi)得到一個(gè)量身定制的結(jié)果!
而在map里,Gemini 2.0的支持讓地圖化身“地球探索器”,可以通過(guò)推理為用戶(hù)提供更多有趣的地方。
當(dāng)用戶(hù)說(shuō):帶我去一個(gè)自然風(fēng)光優(yōu)美、綠意盎然的地方。
AI回復(fù)道:去也門(mén)的索科特拉群島怎么樣?這里獨(dú)特得仿佛踏上另一個(gè)星球。由于長(zhǎng)期的與世隔絕,這里孕育出了奇特而美麗的植物,如龍血樹(shù)和多肉瓶樹(shù)。
圖片
相較而言,DeepSeek 和 OpenAI 等競(jìng)爭(zhēng)對(duì)手專(zhuān)注在單一模態(tài)的大模型中,DeepSeek-R1 和 OpenAI 的 o3-mini 仍無(wú)法直接處理多模態(tài)輸入(即無(wú)法解析圖片、文件上傳或附件)。雖然 DeepSeek-R1 在其網(wǎng)站和移動(dòng)端支持圖片上傳,但它僅使用 光學(xué)字符識(shí)別(OCR) 來(lái)提取圖片中的文本內(nèi)容,而不是真正理解或分析圖片的其他信息。
不過(guò),谷歌能否將應(yīng)用中的AI推理做得真正實(shí)用,還需要時(shí)間的檢驗(yàn)。
2.Gemini 2.0 Pro 秀肌肉:2百萬(wàn) token 超長(zhǎng)上下文、最強(qiáng)大的編碼模型
Google 堅(jiān)持走長(zhǎng)上下文路線(xiàn)。Gemini 2.0 Pro 的實(shí)驗(yàn)版本,更是達(dá)到了2百萬(wàn) tokens之大。
Google DeepMind 將其描述為最強(qiáng)大的編碼模型,可處理復(fù)雜提示詞,其特性如下:
- 2百萬(wàn) tokens 上下文窗口(比 Flash 和 Flash-Lite 翻倍);
- 改進(jìn)的推理能力;
- 集成 Google Search 和代碼執(zhí)行能力。
DeepMind首席科學(xué)家盛贊說(shuō),“它能寫(xiě)出完整的代碼,包括所有正確的數(shù)據(jù)結(jié)構(gòu)和搜索算法,根據(jù)一個(gè)相對(duì)簡(jiǎn)單的提示,在 Boggle 棋盤(pán)上找到所有有效的單詞,這真是令人匪夷所思!”
圖片
此外, Gemini 2.0 Pro的編輯功能也大受好評(píng),網(wǎng)友直接讓AI使用 Three.js,手搓了一個(gè)太陽(yáng)系模擬。
圖片
對(duì)標(biāo)DeepSeek,Gemini 2.0輕量模型開(kāi)卷“極致性?xún)r(jià)比”!谷歌守住多模態(tài)陣地,油管、地圖應(yīng)用們都要開(kāi)始做推理了!
觀看更多轉(zhuǎn)載,對(duì)標(biāo)DeepSeek,Gemini 2.0輕量模型開(kāi)卷“極致性?xún)r(jià)比”!谷歌守住多模態(tài)陣地,油管、地圖應(yīng)用們都要開(kāi)始做推理了!51CTO技術(shù)棧已關(guān)注分享點(diǎn)贊在看已同步到看一看寫(xiě)下你的評(píng)論 視頻詳情
3.寫(xiě)在最后
這邊,Gemini 2.0 正在迎來(lái)高光時(shí)刻。
然而, OpenAI 卻突然放出大招,谷歌一夜醒來(lái)發(fā)現(xiàn)被偷家了。
ChatGPT正式開(kāi)放了搜索功能,免注冊(cè)免費(fèi)用,網(wǎng)友在評(píng)論中驚呼:“谷歌一下”可能要變成“AI 一下”了。
圖片
有了亮眼的Gemini 2.0,谷歌仍然不能喘一口氣:2025 年的 AI 之戰(zhàn)注定不會(huì)輕松。連 CEO 桑達(dá)爾·皮查伊都坦言:“今年將是一場(chǎng)硬仗?!?/p>
參考鏈接:
1.??https://developers.googleblog.com/en/gemini-2-family-expands/?linkId=12807127??
2.??https://techcrunch.com/2025/02/05/google-launches-new-ai-models-and-brings-thinking-to-gemini/??
本文轉(zhuǎn)載自5??1CTO技術(shù)棧??,作者:伊風(fēng)
