剛剛,Gemini 2.5 Pro升級,成編程模型新王
你的默認(rèn)編程模型是什么?或許可以換一換了。
剛剛,Google DeepMind 發(fā)布了 Gemini 2.5 Pro 的最新更新版本:Gemini 2.5 Pro (I/O edition)。
其最大的進(jìn)步是編程能力大幅提升,不僅在 LMArena 編程排行榜上名列第一,同時也在 WebDev Arena 排行榜上更是以顯著優(yōu)勢超過了昔日霸主 Claude 3.7 Sonnet (20250219)!
不僅如此,現(xiàn)在用戶只需使用一個提示詞即可構(gòu)建 Web 應(yīng)用、游戲和模擬程序等,甚至用戶僅需提供一張手繪草圖 + 功能描述,就能得到一個帶有自己設(shè)計(jì)的 UI 的功能完備的應(yīng)用。
此外,下面的視頻還展示了 Gemini 2.5 Pro (I/O edition) 的另一項(xiàng)能力,可以根據(jù)自然圖像生成代碼,而這些代碼可以動態(tài)表示自然圖像中內(nèi)容。
自家模型更新,谷歌的多位大佬也紛紛出來站臺。
諾貝爾獎得主、DeepMind CEO Demis Hassabis 表示 Gemini 2.5 Pro (I/O edition) 已經(jīng)在 Gemini APP、Vertex AI 和 Google AI Studio 中開放,并且其尤其擅長構(gòu)建交互式 Web 應(yīng)用,下面的演示展示了該模型根據(jù)草圖構(gòu)建應(yīng)用的能力。
可以看到,只需一張描述畫板應(yīng)用的簡單草圖加上一句簡單的提示詞,Gemini 2.5 Pro (I/O edition) 就創(chuàng)建出了一個功能完備的 Web 應(yīng)用。
另外,谷歌母公司 Alphabet CEO、Google AI 負(fù)責(zé)人 Jeff Dean 也都各自發(fā)布了宣傳推文。
谷歌博客表示,他們原計(jì)劃在幾周后的 Google I/O 大會上發(fā)布 Gemini 2.5 Pro Preview (I/O edition),「但由于大家對這一模型的熱情高漲,我們希望盡快將其交付到大家手中,以便人們能夠立即開始構(gòu)建?!?/span>
「Gemini 2.5 Pro 的編程和多模態(tài)推理功能獲得了廣泛好評,此次更新正是基于此。除了專注于 UI 的開發(fā)之外,這些提升還擴(kuò)展到了其他編程任務(wù),例如代碼轉(zhuǎn)換、代碼編輯和開發(fā)復(fù)雜的智能體工作流?!?/span>
這些增強(qiáng)能力讓 Gemini 2.5 Pro 在 WebDev Arena 中的 Elo 分?jǐn)?shù)大幅提升:比上一版本高出 147 分!WebDev Arena 排行榜衡量的是人類對模型構(gòu)建美觀且功能強(qiáng)大的 Web 應(yīng)用能力的偏好。
此外,新版 Gemini 2.5 Pro 在原生多模態(tài)和長上下文方面依然強(qiáng)勢;它在視頻理解方面表現(xiàn)一流 —— 在 VideoMME 基準(zhǔn)測試中獲得了 84.8% 的分?jǐn)?shù)。
以下視頻展示了 Gemini 2.5 Pro 根據(jù)單條 YouTube 視頻生成交互式學(xué)習(xí)應(yīng)用的示例,同時還給出了新舊 Gemini 2.5 Pro 的對比。
網(wǎng)友實(shí)測,新版 Gemini 2.5 Pro 真的行
既然是編程模型新王,網(wǎng)友們的測試熱情可以說被瞬間激發(fā)。隨便檢索一下互聯(lián)網(wǎng),我們就能找到大量網(wǎng)友們分享的測試案例。
比如網(wǎng)友 @thenomadevel 讓 Gemini 2.5 Pro Preview (I/O edition) 用 p5.js 編寫了一個直接可玩的記憶配對游戲。
https://x.com/thenomadevel/status/1919823630143213715
DeepMind 產(chǎn)品設(shè)計(jì)師 Tim Bettridge 則 Vibe Code(氛圍編程)了好幾個不同的游戲和應(yīng)用,比如這個看起來相當(dāng)不錯的星球飛行游戲:
https://x.com/TimBettridge/status/1919847724645789721
又比如這個功能完備的書架應(yīng)用:
還有一個支持 3D 瀏覽的虛擬版芝加哥藝術(shù)博物館。
更有網(wǎng)友用不到 20 分鐘的時間構(gòu)建了一個完整的城市交通模擬器。
https://x.com/WesRothMoney/status/1919887823257108941
機(jī)器之心也做了簡單的嘗試,將我們手繪的一張動物圖片變成了一個簡單的電子寵物游戲:
看起來,Vibe Coder 們又有新選擇了。