自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓

鴻蒙開發(fā)者社區(qū)

WOT技術大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設置退出

谷歌終于贏了OpenAI一回：實驗版本Gemini 1.5 Pro超越GPT-4o

作者：機器之心 2024-08-02 14:58:00

人工智能新聞

當我們問 Gemini 1.5 Pro (0801) 9.9 和 9.11 哪個數(shù)大時，模型一次就能回答正確，并給出了理由。

近兩日，谷歌在不斷發(fā)布最新研究。繼昨日放出最強端側 Gemma 2 2B 小模型后，剛剛，Gemini 1.5 Pro 實驗版本 (0801) 已經(jīng)推出。

用戶可以通過 Google AI Studio 和 Gemini API 進行測試和反饋。

既然免費，那我們幫大家測試一下最近比較火的比大小問題。當我們問 Gemini 1.5 Pro (0801) 9.9 和 9.11 哪個數(shù)大時，模型一次就能回答正確，并給出了理由。

當我們繼續(xù)追問「Strawberry 單詞里面有多少個 r」時，然而 Gemini 1.5 Pro (0801) 卻翻車了。在提示語中施加「咒語」一步一步來，模型分析到第四步就出錯了。

Google AI Studio 測試地址：https://aistudio.google.com/app/prompts/new_chat

不過，從官方評測來看，Gemini 1.5 Pro (0801) 各項指標還是很能打的。新模型迅速奪得著名的 LMSYS Chatbot Arena 排行榜榜首，并擁有令人印象深刻的 ELO 分數(shù)，得分為 1300。

這一成就使 Gemini 1.5 Pro (0801) 領先于 OpenAI 的 GPT-4o（ELO：1286）和 Anthropic 的 Claude-3.5 Sonnet（ELO：1271）等強大競爭對手，這或許預示著人工智能格局的轉變。

Gemini 團隊關鍵成員 Simon Tokumine 稱 Gemini 1.5 Pro (0801) 是谷歌迄今為止制造的最強大、最智能的 Gemini （模型）。

除了拿到 Chatbot Arena 榜首，Gemini 1.5 Pro (0801) 在多語言任務、數(shù)學、Hard Prompt 和編碼等領域也表現(xiàn)相當出色。

具體而言，Gemini 1.5 Pro (0801) 在中文、日語、德語、俄語方面均表現(xiàn)第一。

但在編碼、Hard Prompt 領域，Claude 3.5 Sonnet、GPT-4o、Llama 405B 仍然處于領先地位。

在 win-rate 熱圖上：Gemini 1.5 Pro (0801) 對陣 GPT-4o 的勝率為 54%，對陣 Claude-3.5-Sonnet 的勝率為 59%。

Gemini 1.5 Pro (0801) 在 Vision 排行榜上也第一！

網(wǎng)友紛紛表示，谷歌這次真是出乎所有人的預料，沒有提前官宣就突然開放測試最強模型，這次壓力給到了 OpenAI。

雖然 Gemini 1.5 Pro (0801) 取得了很高的成績，但它仍處于實驗階段。這意味著該模型在廣泛使用之前可能會進行進一步的修改。

網(wǎng)友評測

有網(wǎng)友對 Gemini 1.5 Pro (0801) 的內容提取能力、代碼生成能力、推理能力等進行了測試，我們來看下他的測試結果。

來源：https://x.com/omarsar0/status/1819162249593840110

首先，Gemini 1.5 Pro (0801) 的圖像信息提取功能很強，例如輸入一張發(fā)票圖像，將發(fā)票細節(jié)用 JSON 格式編寫出來：

再來看下 Gemini 1.5 Pro (0801) 的 PDF 文檔內容提取功能，以經(jīng)典論文《Attention Is All You Need》為例，提取論文章節(jié)目錄：

讓 Gemini 1.5 Pro (0801) 生成一個幫助學習大型語言模型（LLM）知識的 Python 游戲，該模型直接生成了一整段代碼：

值得一提的是，Gemini 1.5 Pro (0801) 還給出了詳細的代碼解釋，包括代碼中函數(shù)的作用、該 Python 游戲的玩法等等。

這段程序可以直接在 Google AI Studio 中運行，并且可以試玩，例如做道關于 Tokenization 定義的選擇題：

如果覺得選擇題太簡單無聊，可以進一步讓 Gemini 1.5 Pro (0801) 生成一個更復雜的游戲：

得到一個 LLM 專業(yè)知識句子填空游戲：

為了測試 Gemini 1.5 Pro (0801) 的推理能力，網(wǎng)友提問了一個「吹蠟燭」問題，但模型回答錯誤：

盡管有一些瑕疵，但 Gemini 1.5 Pro (0801) 的確表現(xiàn)出接近 GPT-4o 的視覺能力，以及接近 Claude 3.5 Sonnet 的代碼生成和 PDF 理解、推理能力，值得期待。

責任編輯：張燕妮來源：機器之心

51CTO技術棧公眾號

業(yè)務
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學堂精培企業(yè)培訓 CTO訓練營

<abbr id="usx6s"></abbr>

<abbr id="usx6s"></abbr>

<sub id="usx6s"></sub>

<blockquote id="usx6s"></blockquote>