自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<tt id="wnjxn"><thead id="wnjxn"></thead></tt>

<blockquote id="wnjxn"><p id="wnjxn"></p></blockquote>

<abbr id="wnjxn"></abbr>

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開(kāi)發(fā)者社區(qū)

WOT技術(shù)大會(huì)

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線學(xué)習(xí)

文章資源問(wèn)答課堂專欄直播

51CTO

鴻蒙開(kāi)發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開(kāi)發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開(kāi)發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

賬號(hào)設(shè)置退出

馬斯克推出Grok-1.5，接近GPT-4級(jí)別的性能

作者：Shubham Sharma 2024-04-01 13:06:52

定于下周發(fā)布的Grok-1.5帶來(lái)了增強(qiáng)的推理和解決問(wèn)題的能力，并接近于已知的開(kāi)源和閉源的LLM的性能，包括OpenAI的GPT-4和Anthropic的Claude 3。

馬斯克指出，Grok-1.5將為xAI在X平臺(tái)上的ChatGPT挑戰(zhàn)者聊天機(jī)器人提供支持，而Grok-2(新模型的繼任者)仍在訓(xùn)練階段。他表示，下一個(gè)版本應(yīng)該能夠“在所有指標(biāo)上超越當(dāng)前的AI”，但沒(méi)有分享它可能何時(shí)變得可用的具體細(xì)節(jié)。

Grok-1.5帶來(lái)了什么?

xAI去年11月宣布了Grok-1，稱這個(gè)AI是以《銀河系漫游指南》為模型，幾乎可以回答任何問(wèn)題，以幫助人類在尋求理解和知識(shí)的征途中——無(wú)論背景或政治觀點(diǎn)如何。在GSM8K、HumanEval和MMLU等基準(zhǔn)測(cè)試中，由xAI分享的數(shù)據(jù)顯示，Grok-1的表現(xiàn)超過(guò)了Llama-2-70B和GPT-3.5。

現(xiàn)在，隨著Grok-1.5的發(fā)布，該公司在先前模型的基礎(chǔ)上取得了顯著改進(jìn)，在所有主要基準(zhǔn)測(cè)試中，包括與編碼和數(shù)學(xué)相關(guān)的任務(wù)，都實(shí)現(xiàn)了顯著提升。

xAI在博客文章中指出：“在我們的測(cè)試中，Grok-1.5在MATH基準(zhǔn)測(cè)試中達(dá)到了50.6%的分?jǐn)?shù)，在GSM8K基準(zhǔn)測(cè)試中達(dá)到了90%的分?jǐn)?shù)，這兩個(gè)數(shù)學(xué)基準(zhǔn)測(cè)試涵蓋了從小學(xué)到高中競(jìng)賽問(wèn)題的廣泛范圍。此外，它在評(píng)估代碼生成和問(wèn)題解決能力的HumanEval基準(zhǔn)測(cè)試中得分為74.1%。”

在MMLU基準(zhǔn)測(cè)試上，評(píng)估AI模型在不同任務(wù)上的語(yǔ)言理解能力，新模型得分為81.3%，比Grok-1的73%高出顯著幅度。

此外，xAI還確認(rèn)，Grok-1.5的上下文窗口可達(dá)128,000個(gè)標(biāo)記(標(biāo)記是單詞、圖像、視頻、音頻或代碼的整個(gè)部分或子部分)。這使得模型能夠一次性處理和處理大量信息，比Grok-1多16倍，使其更適合分析、總結(jié)和提取長(zhǎng)文檔中的信息。它甚至可以處理更長(zhǎng)、更復(fù)雜的提示，同時(shí)仍然保持遵循指令的能力。

接近OpenAI和Anthropic

憑借增強(qiáng)的推理和解決問(wèn)題的能力，Grok-1.5不僅在基準(zhǔn)測(cè)試中勝過(guò)其前身，而且還接近流行的開(kāi)放和封閉源模型，包括Gemini 1.5 Pro、GPT-4和Claude 3。

例如，在MMLU上，Grok-1.5的81.3%得分超過(guò)了最近推出的Mistral Large，但落后于Gemini 1.5 Pro(83.7%)、GPT-4(86.4%，

截至2023年3月)和Claude 3 Opus(86.8%)。在GSM8K基準(zhǔn)測(cè)試上也注意到了類似的差距，xAI模型僅落后于Google、OpenAI和Anthropic的產(chǎn)品。

值得注意的是，Grok-1.5唯一看起來(lái)有優(yōu)勢(shì)的基準(zhǔn)是HumanEval，在那里它的表現(xiàn)超過(guò)了所有模型，除了Claude 3 Opus。xAI希望繼續(xù)這些改進(jìn)，并通過(guò)Grok-2提供進(jìn)一步的性能提升，據(jù)馬斯克稱，應(yīng)該在所有指標(biāo)上超越當(dāng)前的AI。該模型目前正在訓(xùn)練中。

技術(shù)顧問(wèn)Brian Roemmele表示，根據(jù)他與Grok-1的工作，Grok-2“在發(fā)布時(shí)將成為最強(qiáng)大的LLM AI平臺(tái)之一。它將在幾乎所有指標(biāo)上超越OpenAI。”

Grok-1.5的可用性

至于Grok-1.5，xAI計(jì)劃下周開(kāi)始部署。公司表示，該模型最初將提供給早期測(cè)試者和那些已經(jīng)在X平臺(tái)(Twitter)上使用Grok聊天機(jī)器人的用戶——實(shí)時(shí)訪問(wèn)平臺(tái)上的所有帖子。推出將分階段進(jìn)行，公司將改進(jìn)模型并引入幾個(gè)新功能——可能包括一種新的不受限制的有趣模式——同時(shí)逐步使其對(duì)更廣泛的用戶群體可用。

當(dāng)馬斯克在X上推出Grok時(shí)，被視為推動(dòng)Grok和X的采用。他首先將AI作為平臺(tái)的“高級(jí)+”訂閱的一部分，價(jià)格為每月16美元。然而，就在幾天前，這位億萬(wàn)富翁分享說(shuō)，聊天機(jī)器人也將為支付8美元每月的高級(jí)訂閱者啟用。在另一個(gè)更新中，他還確認(rèn)，擁有一定級(jí)別的驗(yàn)證訂閱者的關(guān)注者將免費(fèi)獲得高級(jí)和高級(jí)+訂閱的好處，包括Grok。

責(zé)任編輯：龐桂玉來(lái)源：企業(yè)網(wǎng)D1Net

Grok-1.5 GPT-4 人工智能

點(diǎn)贊

51CTO技術(shù)棧公眾號(hào)

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開(kāi)發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營(yíng)