重大新聞(lmsys.org):Gemini 1.5 Flash/Advanced逼近GPT-4o,排名第二!
重大新聞——Gemini 1.5 Flash、Pro和Advanced版本的結(jié)果出來(lái)了!??
- Gemini 1.5 Pro/Advanced 排名第二,正在逼近GPT-4o
- Gemini 1.5 Flash排名第九,性能超越了Llama-3-70b,幾乎達(dá)到了GPT-4-0125
- Pro版本比4月份的版本有了顯著的提升。Flash的成本、能力和無(wú)與倫比的上下文長(zhǎng)度使其成為市場(chǎng)的變革者!?
??https://x.com/lmsysorg/status/1795512202465845686??
更令人興奮的是,在中文領(lǐng)域,Gemini 1.5 Pro和Advanced現(xiàn)在是世界上最好的排名第一的模型。Flash變得更加強(qiáng)大!
也看到新的Gemini家族在的新“Hard Prompts”類(lèi)別中保持領(lǐng)先,這個(gè)類(lèi)別包含了更具挑戰(zhàn)性、需要解決問(wèn)題的用戶(hù)查詢(xún)。
Hard Prompts的信息:
https://lmsys.org/blog/2024-05-17-category-hard/
模型強(qiáng)度的置信區(qū)間和鏈接
- 全部排行榜在:http://leaderboard.lmsys.org
- 與新的Gemini家族聊天:??https://arena.lmsys.org/??
??https://x.com/huybery/status/1795432194460340708??
本文轉(zhuǎn)載自 ??PaperAgent??,作者: PaperAgent
贊
收藏
回復(fù)
分享
微博
QQ
微信
舉報(bào)

回復(fù)
相關(guān)推薦