出品 | 51CTO技術(shù)棧(微信號:blog51cto)
AI 編碼模型的新王者登基了!今天,Google 旗下的 DeepMind AI 研究部門正式發(fā)布了 Gemini 2.5 Pro “I/O” 版,這是今年 3 月推出的 Gemini 2.5 Pro 多模態(tài)大語言模型(LLM)的更新版本。
DeepMind CEO Demis Hassabis 在 X 上表示:“這是我們迄今為止打造的最佳編碼模型!”
在 WebDev Arena 榜單(一個基于人類偏好、評估模型生成美觀且實用 Web 應(yīng)用能力的第三方指標(biāo))上,Gemini 2.5 Pro Preview(05-06)現(xiàn)已超越 Anthropic 的 Claude 3.7 Sonnet,登頂?shù)谝弧?/p>
此次更新的最大亮點,在于模型能僅通過一句提示生成完整、可交互的 Web 應(yīng)用或模擬項目,根據(jù)草圖完成應(yīng)用的編程等等。這正符合 DeepMind 一貫強(qiáng)調(diào)的“簡化原型開發(fā)流程”的愿景。
新版本模型進(jìn)一步助力應(yīng)用中的功能開發(fā),能夠自動匹配組件的視覺風(fēng)格,還能實現(xiàn)如將 YouTube 視頻轉(zhuǎn)換為功能齊全的學(xué)習(xí)應(yīng)用、或用極少甚至無需 CSS 手動編輯就創(chuàng)建出響應(yīng)式視頻播放器或動態(tài)語音 UI 等工作流。
這款新版本標(biāo)識為 “gemini-2.5-pro-preview-05-06”,取代了之前的 03-25 版本,現(xiàn)在已面向獨立開發(fā)者開放(通過 Google AI Studio),也面向企業(yè)客戶上線(通過 Vertex AI 云平臺),同時普通用戶可在 Gemini App 中體驗。Google 在博客中指出,新模型還為 Gemini 移動端的 Canvas 畫布功能及其他組件提供支持。
該模型為閉源專有模式,企業(yè)需要付費使用,僅可通過 Google 的 Web 服務(wù)訪問。不過它并未改變價格或速率限制,當(dāng)前 Gemini 2.5 Pro 用戶將自動切換至新版本。價格為每百萬輸入/輸出 token 分別為 $1.25 / $10(上下文長度為 200,000 token),而 Claude 3.7 Sonnet 的對應(yīng)價格為 $3 / $15。