自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<wbr id="gvw15"><sup id="gvw15"></sup></wbr>

<sub id="gvw15"><rt id="gvw15"></rt></sub>

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓

鴻蒙開發(fā)者社區(qū)

WOT技術大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設置退出

力壓GPT-4o！新王Claude 3.5 Sonnet來了，直接免費可用

2024-06-21 09:58:38

Claude 3.5 Sonnet 是 Anthropic 即將推出的 Claude 3.5 系列的首個版本。該模型提高了整個領域的智能水平，在絕大多數(shù)基準評估中都超越了競品大模型和自家前代最強 Claude 3 Opus。與此同時，運行速度、成本與自家前代 Claude 3 Sonnet 相當。

如今，大模型領域更卷了！

前腳 OpenAI 發(fā)布 GPT4o，硬控全場，后腳就被最大的競爭對手 Anthropic 超越了。

剛剛，Anthropic 發(fā)布了全新大模型 Claude 3.5 Sonnet，號稱是迄今為止最智能的模型。

據(jù)介紹，Claude 3.5 Sonnet 是 Anthropic 即將推出的 Claude 3.5 系列的首個版本。該模型提高了整個領域的智能水平，在絕大多數(shù)基準評估中都超越了競品大模型和自家前代最強 Claude 3 Opus。與此同時，運行速度、成本與自家前代 Claude 3 Sonnet 相當。

地址：https://claude.ai/

目前，Claude 3.5 Sonnet 已經(jīng)在 Claude.ai 和 Claude iOS 應用程序上免費提供，而 Claude Pro 和 Team 計劃訂戶能夠以更高的速率訪問它。

此外，Claude 3.5 Sonnet 已經(jīng)可以直接通過 Anthropic API、亞馬遜云科技 Bedrock 等渠道使用。每百萬個輸入 token 的價格為 3 美元，每百萬個輸出 token 的價格為 15 美元，上下文窗口為 200k token。

Claude、GPT、Gemini三個模型迭代發(fā)布時間線。

Anthropic 稱其目標是每隔幾個月大幅度改進性能、速度和成本之間的權衡曲線。今年晚些時候將發(fā)布 Claude 3.5 Haiku 和 Claude 3.5 Opus。

除了開發(fā)下一代大模型之外，Anthropic 正在開發(fā)新的模式和功能，以支持更多企業(yè)用例，包括與企業(yè)應用程序的集成。團隊還在探索諸如 Memory 之類的功能，使得模型能夠記住用戶的偏好和指定的交互歷史，從而實現(xiàn)更加個性化和高效的體驗。

比 GPT-4o 更智能

比 Claude 3 Opus 快兩倍

Claude 3.5 Sonnet 為研究生水平推理 (GPQA)、本科生水平知識 (MMLU) 和編碼能力 (HumanEval) 設定了新的行業(yè)基準。它在理解細微差別、幽默和復雜指令方面表現(xiàn)出顯著的進步，并且擅長以自然、親切的語氣撰寫高質量的內容。

Claude 3.5 Sonnet 的運行速度是 Claude 3 Opus 的兩倍。這種性能的提升加上實惠的價格，使 Claude 3.5 Sonnet 成為復雜任務的理想選擇。

在內部代理編碼評估中，Claude 3.5 Sonnet 解決了 64% 的問題，優(yōu)于 Claude 3 Opus（解決了 38%）。Anthropic 評估測試了 Claude 3.5 Sonnet 根據(jù)自然語言描述的需求，修復錯誤或增加功能到開源代碼庫中的能力。

在獲得指導和相關工具后，Claude 3.5 Sonnet 可以獨立編寫、編輯和執(zhí)行代碼，并具有復雜的推理和故障排除功能。Claude 3.5 Sonnet 可以輕松處理代碼轉換，這對于更新舊版應用程序和遷移代碼庫特別有效。

下表為 Claude 3.5 Sonnet 與其他模型的比較，評估基準包括推理、閱讀理解、數(shù)學、科學和編碼。在所有這些基準測試中，Claude 3.5 Sonnet 的表現(xiàn)均優(yōu)于之前的前沿模型 Claude 3 Opus。

我們也可以看到表中 Claude3.5 與 GPT-4o 的對比數(shù)據(jù)，除了數(shù)學方面，得分都比 GPT-4o 高或者逼近。

迄今為止最強視覺模型

Anthropic 表示，Claude 3.5 Sonnet 是其最強的視覺模型，在所有標準視覺基準測試中都超越了前代 Claude 3 Opus。

尤其是在需要視覺推理的任務中表現(xiàn)更為明顯，例如解釋圖表、圖形或者從不完美的圖像中轉錄文本，這是零售、物流和金融服務行業(yè)的核心功能。在這些領域，人工智能可以從圖像、圖形或插圖中收集到比單獨文本中更多的見解。

下圖為 Claude 3.5 Sonnet 與 Claude 3 Opus、GPT-4o、Gemini 1.5 Pro 在視覺數(shù)學推理、科學圖表、視覺問答、圖表 QA、文件視覺 QA 任務中的性能比較。

Artifacts—— 使用 Claude 的新方式

Anthropic 還在 Claude.ai 上推出了 Artifacts，這是一項擴展用戶與 Claude 交互方式的新功能。當用戶要求 Claude 生成代碼片段、文本文檔或網(wǎng)站設計等內容時，這些工件會出現(xiàn)在他們的對話旁邊的專用窗口中。這創(chuàng)建了一個動態(tài)工作空間，他們可以在其中實時查看、編輯和構建 Claude 的創(chuàng)作，將人工智能生成的內容無縫集成到他們的項目和工作流程中。

Artifacts 預覽功能標志著 Claude 從對話式 AI 向協(xié)作工作環(huán)境的演變，并將很快擴展到支持團隊協(xié)作。在不久的將來，團隊將能夠安全地將他們的知識、文檔和正在進行的工作集中在一個共享空間中，而 Claude 則按需充當隊友。

最后，Anthropic 表示他們對模型進行了嚴格的測試，并致力于減少其被濫用的可能性。

Anthropic 安全團隊對 Claude 3.5 Sonnet 在化學、生物、放射性和核（CBRN）風險、網(wǎng)絡安全和自主能力領域進行了一系列的評估，最后將 Claude 3.5 Sonnet 分類為 AI 安全等級 2（ASL-2）模型，表明它不會構成災難性傷害的風險。

此外，作為對安全和透明度承諾的一部分，Anthropic 還與外部專家合作測試和完善這一最新模型中的安全機制。

官博地址：https://www.anthropic.com/news/claude-3-5-sonnet

責任編輯：姜華來源：機器之心

Claude 3.5 Anthropic 人工智能

51CTO技術棧公眾號

業(yè)務
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學堂精培企業(yè)培訓 CTO訓練營

<p id="hua1m"></p>

<sub id="hua1m"></sub>