自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<blockquote id="sgikd"><p id="sgikd"></p></blockquote>

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項目管理免費題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設(shè)置退出

谷歌Gemini 1.5技術(shù)報告：輕松證明奧數(shù)題，F(xiàn)lash版比GPT-4 Turbo快5倍

作者：機(jī)器之心 2024-05-20 07:50:00

人工智能新聞

谷歌表示，Gemini 1.5 相比 Claude 3.0 和 GPT-4 Turbo 實現(xiàn)了代際提升。

今年 2 月，谷歌上線了多模態(tài)大模型 Gemini1.5，通過工程和基礎(chǔ)設(shè)施優(yōu)化、MoE 架構(gòu)等策略大幅提升了性能和速度。擁有更長的上下文，更強(qiáng)推理能力，可以更好地處理跨模態(tài)內(nèi)容。

本周五，Google DeepMind 正式發(fā)布了 Gemini 1.5 的技術(shù)報告，內(nèi)容覆蓋 Flash 版等最近升級，該文檔長達(dá) 153 頁。

技術(shù)報告鏈接：https://storage.googleapis.com/deepmind-media/gemini/gemini_v1_5_report.pdf

在本報告中，谷歌介紹了 Gemini 1.5 系列模型，它是代表了下一代高計算效率的多模態(tài)大模型，能夠從數(shù)百萬 token 上下文中調(diào)用細(xì)粒度信息并進(jìn)行推理，包括多個長文檔、數(shù)小時的視頻。

該系列包括兩個新型號：

更新的 Gemini 1.5 Pro，其大部分功能和基準(zhǔn)都超過了 2 月份的版本
Gemini 1.5 Flash，一種更輕量級的變體，專為提高效率而設(shè)計，并且在性能方面的減益很小。

有關(guān)本周谷歌 I/O 大會上提到的 Flash 版，報告中表示，Gemini 1.5 Flash 是一個 Transformer 解碼器模型，具有與 Gemini 1.5 Pro 相同的 2M+ 上下文和多模態(tài)功能，旨在高效利用張量處理單元 (TPU)，并具有較低的模型服務(wù)延遲。例如，Gemini 1.5 Flash 可以并行計算注意力和前饋分量，并且也是擁有更大網(wǎng)絡(luò)在線提取能力的 Gemini 1.5 Pro 模型。它使用高階預(yù)處理方法進(jìn)行訓(xùn)練以提高質(zhì)量。

報告評估了從 Gemini 1.5 和 Vertex AI 流 API 中獲取的英語、中文、日語和法語查詢的每個輸出字符的平均時間。

英語、中文、日語和法語響應(yīng)的每個輸出字符的時間（毫秒），在輸入 1 萬個字符的情況下，Gemini 1.5 Flash 在所有測試的語言中實現(xiàn)了最快生成速度。

Gemini 1.5 Pro、1.5 Flash 和 Gemini 1.0 模型在標(biāo)準(zhǔn)編碼、多語言以及數(shù)學(xué)、科學(xué)和推理基準(zhǔn)上的評估結(jié)果。1.5 Pro 和 1.5 Flash 的所有數(shù)字都是在指令調(diào)整后獲得的。

Gemini 1.5 Pro 與 Gemini 1.0 Pro 和 Ultra 在視頻理解基準(zhǔn)上的比較。

Gemini 1.5 Pro 與 USM、Whisper、Gemini 1.0 Pro 和 Gemini 1.0 Ultra 在音頻理解任務(wù)上的比較。

Gemini 1.5 模型在跨模態(tài)的長上下文檢索任務(wù)上實現(xiàn)了近乎完美的召回，提高了長文檔 QA、長視頻 QA 和長上下文 ASR 的最優(yōu)水平，并匹配或超越 Gemini 1.0 Ultra 在一系列廣泛的基準(zhǔn)測試中表現(xiàn)出最先進(jìn)的性能。此外，谷歌也表示，到今年 5 月，Gemini 1.5 的性能相比 2 月份已有明顯提升。

Gemini 1.5 Pro（5 月）與初始版本（2 月）在多個基準(zhǔn)測試中的比較。最新的 Gemini 1.5 Pro 在所有推理、編碼、視覺和視頻基準(zhǔn)測試中進(jìn)行了改進(jìn)，而音頻和翻譯性能保持不變。注意，對于 FLEURS，分?jǐn)?shù)越低越好。

Google DeepMind 副總裁，Gemini 項目聯(lián)合負(fù)責(zé)人 Oriol Vinyals 總結(jié)道，Gemini 1.5 Pro > 1.0 Ultra、1.5 Flash（目前最快型號） ~= 1.0 Ultra。

通過研究 Gemini 1.5 的長上下文能力的極限，我們可以看到在下一個 token 預(yù)測和近乎完美的檢索（>99%）方面持續(xù)改進(jìn)。相比 Claude 3.0 (200k) 和 GPT-4 Turbo (128k) 等現(xiàn)有模型實現(xiàn)了一代的飛躍。

在報告的第七章節(jié)，谷歌介紹了 Gemini 1.5 Pro 數(shù)學(xué)增強(qiáng)版本的跑分，它在競賽級數(shù)學(xué)問題上表現(xiàn)出色，包括在未使用工具的情況下在 Hendryck 的 MATH 基準(zhǔn)測試中取得了 91.1% 的突破級性能。

以下是該模型解決亞太數(shù)學(xué)奧林匹克（APMO）題目的一些示例，這些問題是此前模型顯然無法解決的。Oriol Vinyals 表示，這個回答相當(dāng)棒，因為它是一個證明（而不是計算），解決方案切中要害，而且「很漂亮」。

最后，谷歌重點介紹了大模型在現(xiàn)實世界的用例，例如 Gemini 1.5 與專業(yè)人士合作完成任務(wù)并實現(xiàn)目標(biāo)，在 10 個不同的工作類別中可節(jié)省 26-75% 的時間。

這種前沿大語言模型也展示出了一些令人驚訝的新功能。當(dāng)給定 Kalamang（一種巴布亞新幾內(nèi)亞西部不到 200 人使用的語言）的語法手冊時，該模型可以學(xué)會將英語翻譯成 Kalamang，與從相同內(nèi)容中學(xué)習(xí)的人類處于相似的水平。

責(zé)任編輯：張燕妮來源：機(jī)器之心

51CTO技術(shù)棧公眾號

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營

<cite id="n533f"><track id="n533f"><sub id="n533f"></sub></track></cite>