自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<sub id="smqdz"><p id="smqdz"><li id="smqdz"></li></p></sub>

<style id="smqdz"></style>

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開(kāi)發(fā)者社區(qū)

WOT技術(shù)大會(huì)

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線學(xué)習(xí)

文章資源問(wèn)答課堂專(zhuān)欄直播

51CTO

鴻蒙開(kāi)發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開(kāi)發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開(kāi)發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

賬號(hào)設(shè)置退出

馬斯克大模型Grok1.5來(lái)了：推理能力大升級(jí)，支持128k上下文

作者：機(jī)器之心 2024-03-29 14:04:00

人工智能新聞

本周五早上，馬斯克旗下的人工智能公司 xAI 正式推出了 Gork 大模型的最新版本 Grok-1.5。新一代模型實(shí)現(xiàn)了長(zhǎng)上下文理解和高級(jí)推理能力，計(jì)劃將在未來(lái)幾天內(nèi)向早期測(cè)試人員和 X 平臺(tái)（前 Twitter）上的現(xiàn)有 Grok 用戶提供。

Grok 1 開(kāi)源才剛有 10 天，Grok 1.5 就來(lái)了。

本周五早上，馬斯克旗下的人工智能公司 xAI 正式推出了 Gork 大模型的最新版本 Grok-1.5。新一代模型實(shí)現(xiàn)了長(zhǎng)上下文理解和高級(jí)推理能力，計(jì)劃將在未來(lái)幾天內(nèi)向早期測(cè)試人員和 X 平臺(tái)（前 Twitter）上的現(xiàn)有 Grok 用戶提供。

上周一，馬斯克剛剛開(kāi)源了 3140 億參數(shù)的混合專(zhuān)家（MoE）模型 Grok-1。通過(guò)開(kāi)源 Grok-1 的模型權(quán)重和網(wǎng)絡(luò)架構(gòu)，Gork 項(xiàng)目已展示了 xAI 截至去年 11 月所取得的進(jìn)展。在最新模型 Grok-1.5 中，Gork 又有了進(jìn)一步提高。

能力與推理

Grok-1.5 最明顯的改進(jìn)之一是其在代碼和數(shù)學(xué)相關(guān)任務(wù)中的性能。在 xAI 的測(cè)試中，Grok-1.5 在 MATH 基準(zhǔn)上取得了 50.6% 的成績(jī)，在 GSM8K 基準(zhǔn)上取得了 90% 的成績(jī)，這兩個(gè)數(shù)學(xué)基準(zhǔn)涵蓋了廣泛的小學(xué)到高中的競(jìng)賽問(wèn)題。

此外，它在評(píng)估代碼生成和解決問(wèn)題能力的 HumanEval 基準(zhǔn)測(cè)試中得分為 74.1%。

還記得昨天 Databricks 開(kāi)源的通用大模型 DBRX 嗎？當(dāng)時(shí)的對(duì)比圖表如下所示，看起來(lái)新版本 Grok 的提升是顯著的。

就是不知這個(gè)大幅升級(jí)的 1.5 版會(huì)在什么時(shí)候開(kāi)源？

長(zhǎng)上下文理解

Grok-1.5 中的另一個(gè)重要升級(jí)是在其上下文窗口內(nèi)可以處理多達(dá) 128K token 的長(zhǎng)上下文。這使得 Grok 的容量增加到之前上下文長(zhǎng)度的 16 倍，從而能夠利用更長(zhǎng)文檔中的信息。

此外，該模型可以處理更長(zhǎng)、更復(fù)雜的提示（prompt），同時(shí)在上下文窗口擴(kuò)展時(shí)仍然能保持其指令跟蹤能力。在大海撈針（NIAH）評(píng)估中，Grok-1.5 展示了強(qiáng)大的檢索能力，可以在長(zhǎng)度高達(dá) 128K token 的上下文中嵌入文本，實(shí)現(xiàn)完美的檢索結(jié)果。

訓(xùn)練 Grok-1.5 的基礎(chǔ)設(shè)施

xAI 進(jìn)一步介紹了用于訓(xùn)練模型的算力設(shè)施。在大規(guī)模 GPU 集群上運(yùn)行的先進(jìn)大型語(yǔ)言模型（LLM）研究需要強(qiáng)大而靈活的基礎(chǔ)設(shè)施。Grok-1.5 構(gòu)建在基于 JAX、Rust 和 Kubernetes 的自定義分布式訓(xùn)練框架之上。該訓(xùn)練堆棧允許開(kāi)發(fā)團(tuán)隊(duì)能夠以最小的精力構(gòu)建想法原型并大規(guī)模訓(xùn)練新架構(gòu)。

在大型計(jì)算集群上訓(xùn)練 LLM 的主要挑戰(zhàn)是最大限度提高訓(xùn)練作業(yè)的可靠性和正常運(yùn)行時(shí)間。xAI 提出的自定義訓(xùn)練協(xié)調(diào)器可確保自動(dòng)檢測(cè)到有問(wèn)題的節(jié)點(diǎn)，并將其從訓(xùn)練作業(yè)中剔除。工程師還優(yōu)化了檢查點(diǎn)、數(shù)據(jù)加載和訓(xùn)練作業(yè)重新啟動(dòng)等問(wèn)題，以最大限度地減少發(fā)生故障時(shí)的停機(jī)時(shí)間。

展望

為了尋求替代微軟支持的 OpenAI 和 Google 大模型的解決方案，馬斯克去年推推動(dòng)了 AI 創(chuàng)業(yè)公司 xAI，以創(chuàng)建他所說(shuō)的「最大程度尋求真相的人工智能」。去年 12 月，這家初創(chuàng)公司為 X 的 Premium+ 訂閱者推出了 Grok。

xAI 表示，Grok-1.5 很快就會(huì)向早期測(cè)試者開(kāi)放，其團(tuán)隊(duì)將繼續(xù)改進(jìn) Grok。隨著新版本推向公眾，在未來(lái)幾天 X 上的大模型將陸續(xù)推出一些新功能。

責(zé)任編輯：張燕妮來(lái)源：機(jī)器之心

模型訓(xùn)練

點(diǎn)贊

51CTO技術(shù)棧公眾號(hào)

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開(kāi)發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營(yíng)

^{<blockquote id="ynl1p"></blockquote>}

<sup id="ynl1p"></sup>