自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺

51CTO學(xué)堂

IT職業(yè)在線教育平臺

數(shù)值怪物VS編碼之王：Gemini 2.5與DeepSeek雙雄爭霸！

發(fā)布于 2025-3-28 00:05

瀏覽

0收藏

嘿，大家好！這里是一個(gè)專注于前沿AI和智能體的頻道~

DeepSeek-V3-0324前天悄然發(fā)布，沒有任何預(yù)告和宣傳，卻因其極強(qiáng)的編碼能力，迅速火遍全網(wǎng)。

或許，它已成為目前最優(yōu)秀的"非推理"模型。

編碼性能直追目前基本唯一可用的Claude Sonnet 3.7。

到昨天晚上，官方終于發(fā)布公告，在LiveCodeBench編碼測試中，性能指標(biāo)已超越Claude Sonnet 3.7。官網(wǎng)已更新至最新版模型，不開啟深度推理時(shí)，即使用的是這一最新版本。

數(shù)值怪物VS編碼之王：Gemini 2.5與DeepSeek雙雄爭霸！-AI.x社區(qū)

昨晚上，Google發(fā)布了Gemini的重大版本更新，儼然一個(gè)"數(shù)值怪物"，在推理能力、編碼能力和復(fù)雜任務(wù)處理能力上均實(shí)現(xiàn)大幅提升。延續(xù)Google一貫特色，該版本可在Google AI Studio上免費(fèi)使用。

數(shù)值怪物VS編碼之王：Gemini 2.5與DeepSeek雙雄爭霸！-AI.x社區(qū)

在由人類投票的LMSYS大模型競技場上，Gemini 2.5 Pro已徹底領(lǐng)先一個(gè)身位（當(dāng)然，刷這個(gè)榜單一直是Google的強(qiáng)項(xiàng)）。

數(shù)值怪物VS編碼之王：Gemini 2.5與DeepSeek雙雄爭霸！-AI.x社區(qū)

deepseek免費(fèi)試玩地址：https://aistudio.google.com/prompts/new_chat
Gemini 2.5 pro免費(fèi)試玩地址：https://aistudio.google.com/prompts/new_chat

需要注意的是，Gemini 2.5 Pro是一個(gè)名字不帶thinking的推理模型

數(shù)值怪物VS編碼之王：Gemini 2.5與DeepSeek雙雄爭霸！-AI.x社區(qū)

本來想對比一些用戶場景的效果，如海報(bào)、封面設(shè)計(jì)、Agent規(guī)劃等，但目前DeepSeek官網(wǎng)只能使用思考模型，而Chat模型總是提示??服務(wù)器繁忙，請稍后再試??，尷尬~

審美能力

封面

下圖輸入是本段前的文章內(nèi)容。從左到右分別對應(yīng)DeepSeek-R1、Gemini 2.5 Pro thinking、Claude Sonnet 3.7 thinking。不得不說，在審美方面，DeepSeek和Gemini 2.5仍落后Claude一大截。

數(shù)值怪物VS編碼之王：Gemini 2.5與DeepSeek雙雄爭霸！-AI.x社區(qū)

天氣卡片

Gemini生成的效果只能說一般般：

數(shù)值怪物VS編碼之王：Gemini 2.5與DeepSeek雙雄爭霸！-AI.x社區(qū)

任務(wù)規(guī)劃

任務(wù)規(guī)劃能力測試可以大致評估其是否適用于通用Agent的規(guī)劃模型。

我測試了一個(gè)簡單的prompt，下圖黑色部分是Gemini 2.5 Pro的結(jié)果，右側(cè)白色部分是Claude 3.7 Sonnet的結(jié)果?？傮w而言，Gemini對需求理解更為透徹，內(nèi)容規(guī)劃更加完善全面，而Claude則提供了更詳細(xì)的網(wǎng)頁制作細(xì)節(jié)。

考慮到Google自家已有眾多領(lǐng)域Agent，而前置的TODOLIST基本是最前端的環(huán)節(jié)，因此即便簡單的prompt也能獲得非常好的效果。相比之下，目前DeepSeek-R1的反饋較為隨意，故未展示。

數(shù)值怪物VS編碼之王：Gemini 2.5與DeepSeek雙雄爭霸！-AI.x社區(qū)

文筆

這里引用昨天DeepSeek官方賬號的例子，盡管Gemini使用繁體字，但在文筆上，我更傾向于DeepSeek。

數(shù)值怪物VS編碼之王：Gemini 2.5與DeepSeek雙雄爭霸！-AI.x社區(qū)

最后總結(jié)一下，因?yàn)橐恍﹩栴}，沒法測試DeepSeek新版模型。

Gemini 2.5新版本展現(xiàn)出優(yōu)秀的前置規(guī)劃能力，證明并非所有規(guī)劃任務(wù)都必須依賴Claude
DeepSeek的代碼能力據(jù)稱極為強(qiáng)大，且作為非推理模型，為國產(chǎn)AI應(yīng)用帶來更多想象空間
DeepSeek新版模型主要優(yōu)化了后訓(xùn)練環(huán)節(jié)，而R系列模型是基于base模型，兩者的技術(shù)路線傳導(dǎo)不一定順暢，但R2版本值得期待
Gemini 2.5 Pro首token生成延遲明顯增加，但開始生成后速度依舊很快（可能與排隊(duì)機(jī)制有關(guān)），推理速度仍是Google的強(qiáng)項(xiàng)
對于普通用戶而言，Gemini Pro 2.5雖然性能強(qiáng)勁，但實(shí)際獲得的收益可能有限，繼續(xù)使用2.0 Flash版本仍是合理選擇

本文轉(zhuǎn)載自探索AGI，作者：獼猴桃

標(biāo)簽

數(shù)值怪物

贊

收藏

回復(fù)

舉報(bào)

回復(fù)

相關(guān)推薦

谷歌Gemini vs ChatGPT：Gemini比ChatGPT更勝一籌嗎？

51CTO內(nèi)容精選 ? 6682瀏覽 ? 0回復(fù)
Meta 新作：FlashAttention 的數(shù)值偏差有多大？

amei2000go ? 4065瀏覽 ? 0回復(fù)
Qwen2.5：13個(gè)新模型來襲！開源通用、編碼、數(shù)學(xué)模型全解讀，72B超越Llama 405B - 本地安裝測試

老蛀蟲 ? 4818瀏覽 ? 0回復(fù)
DeepSeek AI發(fā)布DeepSeek-V2.5-1210：DeepSeek-V2.5的更新版本，模型性能顯著提升

Halo咯咯 ? 1.4w瀏覽 ? 0回復(fù)
Transformer編碼器與解碼器和神經(jīng)網(wǎng)絡(luò)之間的關(guān)系

AI探索時(shí)代 ? 1912瀏覽 ? 0回復(fù)
谷歌AI發(fā)布Gemini 2.0 Flash：比Gemini 1.5 Pro快2倍的新AI模型

Halo咯咯 ? 5635瀏覽 ? 0回復(fù)
2025年大模型與Transformer架構(gòu)：技術(shù)前沿與未來趨勢報(bào)告

歐米伽未來研究所 ? 6064瀏覽 ? 0回復(fù)
DeepSeek R1 Vs OpenAI o1！全球頂級推理模型訓(xùn)練技術(shù)對比大解密！

51CTO技術(shù)棧 ? 4725瀏覽 ? 0回復(fù)
DeepSeek如何選滿血版vs蒸餾版哪個(gè)一體機(jī)性價(jià)比更高

數(shù)字化助推器 ? 5174瀏覽 ? 0回復(fù)
深入解析變分自編碼器（VAE）：理論、數(shù)學(xué)原理、實(shí)現(xiàn)與應(yīng)用

唐克 ? 3274瀏覽 ? 0回復(fù)
Google Gemini Code Assist：一個(gè)免費(fèi)的AI編碼助手

Halo咯咯 ? 1807瀏覽 ? 0回復(fù)
DeepSeek vs. OpenAI：2025年，哪家AI更適合小企業(yè)的編程需求？

Halo咯咯 ? 1550瀏覽 ? 0回復(fù)
Qwen2.5-VL-32B 更小更聰明！與grok、gemini同臺打造“治愈老奶奶”，誰更強(qiáng)？

Syrupup ? 1279瀏覽 ? 0回復(fù)
Gemini2.5 Pro測試，代碼能力飆升，但多模態(tài)表格解析依舊不理想

NLP工作站 ? 1206瀏覽 ? 0回復(fù)
Google Gemini 2.5 Pro：AI界的“全能王”來了！

Halo咯咯 ? 1038瀏覽 ? 0回復(fù)
實(shí)測AI大模型：騰訊混元T1 vs DeepSeek 哪家強(qiáng)？

云中江樹 ? 893瀏覽 ? 0回復(fù)
智能體“語言”爭霸: MCP vs A2A，再現(xiàn)K8s vs Docker？

云原生AI百寶箱 ? 745瀏覽 ? 0回復(fù)
智能體“語言”爭霸: MMP vs A2A，再現(xiàn)K8s vs Docken？

A2A講解 ? 416瀏覽 ? 0回復(fù)
GPT-4o(多模態(tài)版)、Claude3.7、Gemini2.5最新系統(tǒng)提示詞！

云中江樹 ? 313瀏覽 ? 0回復(fù)

這個(gè)用戶很懶，還沒有個(gè)人簡介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

Anthropic開源Agentic Coding最佳實(shí)踐！ 8天前發(fā)布
英偉達(dá)押注Agent新基建！AI專屬搜索引擎問世 2025-04-10 06:40:23發(fā)布

熱門推薦

大半精銳盡出！o1下線！滿血o3之后，模型本身就是Manus，最大賣點(diǎn)：替代人干真活！ 1回復(fù)

王炸！MCP 架構(gòu)設(shè)計(jì)深度剖析 & 使用 Spring AI + MCP 四步教你實(shí)現(xiàn) Agent 智能體開發(fā) 0回復(fù)

Dify從入門到高階系列二：手把手教學(xué)！超詳細(xì)的Dify知識庫配置全攻略 0回復(fù)

Crawl4AI：GitHub榜首40K星標(biāo)！LLM專屬極速開源爬蟲神器 0回復(fù)

只需5分鐘，教你用Python搭建MCP Server 0回復(fù)

上一篇：從Manus到Gemini，首輪Agent競賽中有哪些關(guān)鍵信號？

下一篇： OpenAI也妥協(xié)了，全面擁抱MCP!

社區(qū)精華內(nèi)容

目錄

<u id="wpc3n"></u>

<sub id="wpc3n"></sub>

<style id="wpc3n"><li id="wpc3n"></li></style><sup id="wpc3n"><rt id="wpc3n"></rt></sup><sub id="wpc3n"><p id="wpc3n"></p></sub>