自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

谷歌Gemini突發(fā)試驗版模型,重回競技榜第一!新版GPT-4o只領先了1天

人工智能
在新版GPT-4o剛登頂競技榜后1天,立馬發(fā)布最新試驗版模型Gemini-Exp-1121奪回冠軍寶座。

谷歌和OpenAI又杠上了。

在新版GPT-4o剛登頂競技榜后1天,立馬發(fā)布最新試驗版模型Gemini-Exp-1121奪回冠軍寶座。

圖片圖片

要知道,一周前上一版模型Gemini-Exp-1114才發(fā)布。

這怕不是拿準了OpenAI會來爭擂臺,故意留了一手。

這就是引誘OpenAI發(fā)新版GPT-4o,然后再用更好的模型來狙擊它。

圖片圖片

谷歌的研究人員們顯然很得意。

谷歌DeepMind首席科學家Jack Rae,稱這是一場有趣的后訓練“閃電戰(zhàn)”。暗示post-training的迭代速度要比預訓練快得多。

圖片圖片

DeepMind研究副總裁Oriol Vinyals還隔空發(fā)問奧特曼:最近還有提交計劃嗎?

圖片圖片

火藥味很足,也很自信啊。

所以“1121”有多強?來看具體性能。

代碼/推理/視覺理解全提升

按照官方說法,Gemni-Exp-1121重點提升了三方面性能。

  • 代碼能力顯著提升
  • 更強推理能力
  • 更強視覺理解能力

圖片圖片

除了風格控制外,其他方面目前都位于第一。

圖片圖片

在視覺能力方面,Gemini-Exp-1121比上一版還有提升。

圖片圖片

風格控制下的復雜提示詞方面,Gemini-Exp-1121和o1-preview、New Sonnet 3.5水平相當。

圖片圖片

競技場中的實際勝率如下。

圖片圖片

現(xiàn)在也能直接上手體驗。

比如針對同一張漫畫,讓Gemini-Exp-1121和GPT-4o-lastest-1120給出理解。

圖片圖片

Gemini-Exp-1121的回答更加全面且詳細,并且善用小標題、重點加粗。

圖片圖片

新版4o的回復就比較簡短和籠統(tǒng)。

圖片圖片

在經(jīng)典的動物過河邏輯推理題上,Gemini-Exp-1121回答完全正確,新版4o出現(xiàn)了一些失誤,把第三次過河和第四次過河合并了,因此回答有誤。

問題:農(nóng)夫需要把狼、羊和白菜都帶過河,但每次只能帶一樣物品,而且狼和羊不能單獨相處,羊和白菜也不能單獨相處,問農(nóng)夫該如何過河。

圖片圖片

One More Thing

值得一提的是,OpenAI這邊也有新消息。

有人在ChatGPT最新測試版本中首次發(fā)現(xiàn)了“實時攝像”(Live Camera)視頻功能的代碼。

圖片圖片

它具體包括實時錄像、實時處理、語音模式集成以及視覺識別能力。

在高級語音模式推出時,一些用戶有體驗到這一能力。

圖片圖片

這意味著OpenAI已經(jīng)做好了上線這一功能的準備。

另一邊谷歌也演示過類似的demo,還沒上線。按照OpenAI的調性,很可能會搶在谷歌前全量鋪開。

圖片圖片

或許等到明年,和Chatbot的主要交流方式,就要從文字對話轉為語音和agent了。Live Camera可能就是開始,你覺得呢?

圖片圖片

參考鏈接:
[1]https://x.com/OfficialLoganK/status/1859667244688736419
[2]https://x.com/adonis_singh/status/1859682100569571399
[3]https://x.com/OriolVinyalsML/status/1859730969600852222
[4]https://x.com/rowancheung/status/1859301345993556277


責任編輯:武曉燕 來源: 量子位
相關推薦

2024-11-22 15:00:00

模型數(shù)據(jù)

2024-05-15 09:58:06

谷歌大模型

2025-02-17 12:24:43

2024-08-02 14:58:00

2024-12-18 13:24:30

谷歌AI大語言模型

2024-05-21 12:23:17

2024-07-24 12:40:44

2025-04-15 09:03:00

2024-10-16 15:07:57

2024-08-02 13:14:51

2024-05-20 08:20:00

OpenAI模型

2024-06-05 08:29:35

2025-02-17 09:35:00

ChatGPT模型AI

2024-11-15 13:30:00

2024-09-02 08:30:00

大模型AI

2024-06-05 13:09:26

2024-05-15 17:34:15

2024-10-17 13:30:00

2024-10-17 14:05:34

2024-05-14 11:29:15

點贊
收藏

51CTO技術棧公眾號