自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會(huì)

公眾號矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺(tái)

51CTO學(xué)堂

IT職業(yè)在線教育平臺(tái)

Gemini2.5 Pro測試，代碼能力飆升，但多模態(tài)表格解析依舊不理想

發(fā)布于 2025-3-27 07:57

瀏覽

0收藏

國內(nèi)Qwen是汪峰，國外Google是汪峰，昨天Google更新，放出新模型Gemini 2.5 Pro，凌晨OpenAI更新GPT4-o，上新圖像生成功能，難受住了。

GPT4-o沒測，但是網(wǎng)上的效果也太好了吧，倒影啥的都太自然了吧。。

Gemini2.5 Pro測試，代碼能力飆升，但多模態(tài)表格解析依舊不理想-AI.x社區(qū)

這篇主要測試Gemini2.5 Pro的能力，整體測試通過Google的AI Studio上測試，每天免費(fèi)50次，正常使用夠了，爽玩還是不夠的。

https://aistudio.google.com/

Gemini2.5 Pro測試，代碼能力飆升，但多模態(tài)表格解析依舊不理想-AI.x社區(qū)

Gemini2.5 Pro在Benchmark上效果還是很好的，甚至在lmsys的對戰(zhàn)榜單上，現(xiàn)在是第一，當(dāng)然現(xiàn)在投票還不夠多。

Gemini2.5 Pro測試，代碼能力飆升，但多模態(tài)表格解析依舊不理想-AI.x社區(qū)

先說一下整體的測試體驗(yàn)：

文本效果很不錯(cuò)，整體體驗(yàn)很絲滑，速度也很快；
代碼也很強(qiáng)，貪吃蛇、彈球游戲、UI設(shè)計(jì)都很強(qiáng)，堪比Claude；
但多模態(tài)理解的表格解析任務(wù)依然不理想；
think的內(nèi)容英文為主，即使問題是中文-回答是中文，但think大部分是英文；

正式測試開始：

常規(guī)測試

將“I love Gemini 2.5 Pro”這句話的所有字母反過來寫 Gemini2.5 Pro測試，代碼能力飆升，但多模態(tài)表格解析依舊不理想-AI.x社區(qū)

什么東西，我剛要開噴，發(fā)現(xiàn)它回答的確實(shí)沒有問題，僅修改字母，空格、數(shù)字和標(biāo)點(diǎn)符號不修改，我才意識(shí)到這題我出的有bug。
修改問法，“字母”換成“內(nèi)容”，是我想要的，也沒問題！
依舊弱智吧
生蠔煮熟了叫什么？
說明：沒問題，只要沒回答熟蠔，我是可以接受的！
用水來兌水，得到的是濃水還是稀水
說明：沒問題，是水，是水
依舊小紅，依舊老鷹
小紅有2個(gè)兄弟，3個(gè)姐妹，那么小紅的兄弟有幾個(gè)姐妹

未來的某天，李同學(xué)在實(shí)驗(yàn)室制作超導(dǎo)磁懸浮材料時(shí)，意外發(fā)現(xiàn)實(shí)驗(yàn)室的老鼠在空中飛，分析發(fā)現(xiàn)，是因?yàn)槔鲜蟛恍⌒某粤舜艖腋〔牧?。第二天，李同學(xué)又發(fā)現(xiàn)實(shí)驗(yàn)室的蛇也在空中飛，分析發(fā)現(xiàn)，是因?yàn)樯叱粤死鲜?。第三天，李同學(xué)又發(fā)現(xiàn)實(shí)驗(yàn)室的老鷹也在空中飛，你認(rèn)為其原因是 Gemini2.5 Pro測試，代碼能力飆升，但多模態(tài)表格解析依舊不理想-AI.x社區(qū)

說明：這題確實(shí)難，老鷹反正不會(huì)飛！
數(shù)學(xué)
2024年高考全國甲卷數(shù)學(xué)（理）試題

R1滿血測試題：在平面四邊形ABCD中，AB = AC = CD = 1,\angle ADC = 30^{\circ},\angle DAB = 120^{\circ}。將\triangle ACD沿AC翻折至\triangle ACP，其中P為動(dòng)點(diǎn)。求二面角A - CP - B的余弦值的最小值。 Gemini2.5 Pro測試，代碼能力飆升，但多模態(tài)表格解析依舊不理想-AI.x社區(qū)

說明：沒對。
大數(shù)計(jì)算：178939247893 * 299281748617等于多少？
說明：沒對，答案是53553251005627872913981。但側(cè)面有個(gè)code execution，開了之后會(huì)調(diào)用工具，可以計(jì)算對，所以大數(shù)計(jì)算，感覺還是要依賴工具。

Gemini2.5 Pro測試，代碼能力飆升，但多模態(tài)表格解析依舊不理想-AI.x社區(qū)

倫理、數(shù)學(xué)、生物終極測試：有一天，一個(gè)女孩參加數(shù)學(xué)考試只得了 38 分。她心里對父親的懲罰充滿恐懼，于是偷偷把分?jǐn)?shù)改成了 88 分。她的父親看到試卷后，怒發(fā)沖冠，狠狠地給了她一巴掌，怒吼道：“你這 8 怎么一半是綠的一半是紅的，你以為我是傻子嗎？”女孩被打后，委屈地哭了起來，什么也沒說。過了一會(huì)兒，父親突然崩潰了。請問這位父親為什么過一會(huì)崩潰了？ Gemini2.5 Pro測試，代碼能力飆升，但多模態(tài)表格解析依舊不理想-AI.x社區(qū)

說明：沒對，女兒紅綠色盲，并且不是親生。
代碼
貪吃蛇（來自@洛小山，雖然本人不擅長，但是本人會(huì)抄）
彈球（來自@洛小山和@卡茲克，雖然本人不擅長，但是本人會(huì)抄）
卡片：生成一個(gè)打工人時(shí)鐘的html頁面
多模態(tài)表格解析
中等表格
說明：上為原表，下為識(shí)別，表格結(jié)果有問題。
復(fù)雜表格
說明：上為原表，下為識(shí)別，表格結(jié)果有問題。

本文轉(zhuǎn)載自??NLP工作站??，作者：NLP工作站

標(biāo)簽

多模態(tài)

贊

收藏

回復(fù)

舉報(bào)

回復(fù)

相關(guān)推薦

使用 Gemini Pro 高效開發(fā)應(yīng)用

mb5f8eba9bdb0af ? 3267瀏覽 ? 0回復(fù)
谷歌重磅發(fā)布Gemini 1.5 Pro：能自動(dòng)寫影評，理解視頻！

Aceryt ? 4222瀏覽 ? 0回復(fù)
14 項(xiàng)任務(wù)測下來，GPT4V、Gemini等多模態(tài)大模型竟都沒什么視覺感知能力？

輕薄滴假象 ? 2422瀏覽 ? 0回復(fù)
沒有等來Qwen2.5，但等來了Qwen2-Math

NLP工作站 ? 2354瀏覽 ? 0回復(fù)
kotaemon核心GraphRAG、Agent、多模態(tài)代碼解讀！

PaperAgent ? 2991瀏覽 ? 0回復(fù)
輕松解析本地PDF表格，基于LlamaIndex和UnstructuredIO打造RAG

小虎哦哦 ? 4677瀏覽 ? 0回復(fù)
Gemini技術(shù)報(bào)告解讀：從Google多模態(tài)大模型看后續(xù)大模型應(yīng)該具備哪些能力

arnoldzhw ? 3916瀏覽 ? 0回復(fù)
一次多模態(tài)大模型表格識(shí)別解析探索小實(shí)踐記錄

大模型自然語言處理 ? 2186瀏覽 ? 0回復(fù)
探秘大語言模型數(shù)據(jù)合成能力：AgoraBench基準(zhǔn)測試全解析

十一月雨_55 ? 2177瀏覽 ? 0回復(fù)
基于谷歌Gemini多模態(tài)模型實(shí)現(xiàn)PDF文檔自動(dòng)化處理

51CTO內(nèi)容精選 ? 2288瀏覽 ? 0回復(fù)
谷歌AI發(fā)布Gemini 2.0 Flash：比Gemini 1.5 Pro快2倍的新AI模型

Halo咯咯 ? 5635瀏覽 ? 0回復(fù)
多模態(tài)大模型在表格解析任務(wù)上效果如何？親身經(jīng)歷全是淚！

NLP工作站 ? 1551瀏覽 ? 0回復(fù)
基于 Gemini AI 實(shí)現(xiàn)音頻和視頻解析

丟翅膀的魚 ? 2480瀏覽 ? 0回復(fù)
基于BLIP-2和Gemini開發(fā)多模態(tài)搜索引擎代理

51CTO內(nèi)容精選 ? 1662瀏覽 ? 0回復(fù)
解析DeepSeek Janus Pro論文：多模態(tài)AI領(lǐng)域的革命性突破

Baihai_IDP ? 1772瀏覽 ? 0回復(fù)
DeepSeek-R1的風(fēng)吹到了多模態(tài)，Visual-RFT發(fā)布，視覺任務(wù)性能飆升20%

PaperAgent ? 1611瀏覽 ? 0回復(fù)
IBM提出多模式圖像文本到文本模型SmolDocling，可實(shí)現(xiàn)代碼 | 公示 | 圖表 | 表格 | 標(biāo)題高效轉(zhuǎn)換！

AIGCStudio ? 1165瀏覽 ? 0回復(fù)
Google Gemini 2.5 Pro：AI界的“全能王”來了！

Halo咯咯 ? 1038瀏覽 ? 0回復(fù)
GPT-4o(多模態(tài)版)、Claude3.7、Gemini2.5最新系統(tǒng)提示詞！

云中江樹 ? 313瀏覽 ? 0回復(fù)

這個(gè)用戶很懶，還沒有個(gè)人簡介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

LLM實(shí)戰(zhàn)系列 | 大模型的多Lora部署，將顯存節(jié)省到極致 8天前發(fā)布
Llama4 模型細(xì)節(jié) & 效果實(shí)測 2025-04-09 07:07:26發(fā)布

熱門推薦

大半精銳盡出！o1下線！滿血o3之后，模型本身就是Manus，最大賣點(diǎn)：替代人干真活！ 1回復(fù)

王炸！MCP 架構(gòu)設(shè)計(jì)深度剖析 & 使用 Spring AI + MCP 四步教你實(shí)現(xiàn) Agent 智能體開發(fā) 0回復(fù)

Dify從入門到高階系列二：手把手教學(xué)！超詳細(xì)的Dify知識(shí)庫配置全攻略 0回復(fù)

Crawl4AI：GitHub榜首40K星標(biāo)！LLM專屬極速開源爬蟲神器 0回復(fù)

只需5分鐘，教你用Python搭建MCP Server 0回復(fù)

上一篇：文心一言4.5和X1免費(fèi)，馬上安排實(shí)測，來看看效果如何！

下一篇： Llama4 模型細(xì)節(jié) & 效果實(shí)測

社區(qū)精華內(nèi)容

目錄

<cite id="f6ss9"><rp id="f6ss9"><form id="f6ss9"></form></rp></cite>

<cite id="f6ss9"><rp id="f6ss9"><pre id="f6ss9"></pre></rp></cite>