自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<tfoot id="j5wlb"></tfoot>

<style id="j5wlb"></style>

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開(kāi)發(fā)者社區(qū)

WOT技術(shù)大會(huì)

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線學(xué)習(xí)

文章資源問(wèn)答課堂專(zhuān)欄直播

51CTO

鴻蒙開(kāi)發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開(kāi)發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開(kāi)發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

賬號(hào)設(shè)置退出

第一個(gè)超越ChatGPT的開(kāi)源模型來(lái)了？網(wǎng)友并不買(mǎi)賬

作者：機(jī)器之心 2023-07-04 10:18:25

人工智能新聞

開(kāi)源模型真的超過(guò) ChatGPT了嗎？

大模型火了起來(lái)，每天我們都能看到各種「大」新聞。

圖片

今天，又來(lái)了個(gè) Big News：新開(kāi)源的一個(gè)大模型超越了 ChatGPT。

具體是什么呢？

OpenLLM 是一系列在極小、多樣且高質(zhì)量的多輪對(duì)話數(shù)據(jù)集上進(jìn)行微調(diào)的開(kāi)源語(yǔ)言模型。

這兩日，作者們更新了該系列模型，并宣稱：OpenChat 模型在 AlpacaEval 上獲得 80.9% 的勝率；在 Vicuna GPT-4 評(píng)估上，性能達(dá)到 ChatGPT 的 105%。

圖片

也就是上面推特截圖中，兩位博主宣稱的開(kāi)源模型超越 ChatGPT/GPT-3.5。

OpenLLM 的特色是基于 LLaMA 開(kāi)源模型，在只有 6,000 個(gè) GPT4 對(duì)話的數(shù)據(jù)集上進(jìn)行微調(diào)，從而達(dá)到非常好的效果。

此次更新的模型型號(hào)與評(píng)審結(jié)果如下：

OpenChat：基于 LLaMA-13B，上下文長(zhǎng)度為 2048。
在Vicuna GPT-4 評(píng)估中達(dá)到 ChatGPT 分?jǐn)?shù)的 105.7% 。
在 AlpacaEval 上達(dá)到 80.9% 的勝率。
OpenChat-8192：基于 LLaMA-13B，擴(kuò)展上下文長(zhǎng)度為 8192。
在 Vicuna GPT-4 評(píng)估中達(dá)到 ChatGPT 分?jǐn)?shù)的 106.6% 。
在 AlpacaEval 上實(shí)現(xiàn) 79.5% 的勝率。

也就是說(shuō)，兩個(gè)模型在 Vicuna GPT-4 評(píng)估榜單上結(jié)果都超越了 ChatGPT。

但這種評(píng)審 + 宣傳的方式似乎并不被大家認(rèn)可。

網(wǎng)友：夸張

在 Twitter 討論中，有網(wǎng)友表明，這就是夸張的說(shuō)法。

圖片

在此「大」新聞公布后，Vicuna 官方也迅速做出了回應(yīng)。

實(shí)際上，Vicuna 的測(cè)試基準(zhǔn)已被棄用，現(xiàn)在使用的是更高級(jí)的 MT-bench 基準(zhǔn)。該基準(zhǔn)的測(cè)試，有著更加具有挑戰(zhàn)性的任務(wù)，并且解決了 gpt4 評(píng)估中的偏差以及限制。

在 MT-bench 上，OpenChat 性能表現(xiàn)與 wizardlm-13b 相似。也就是說(shuō)，開(kāi)源模型與 GPT-3.5 仍然有著一定差距。這也正是 MT-bench 所強(qiáng)調(diào)的內(nèi)容 —— 開(kāi)源模型不是完美無(wú)缺的，但是這將邁向更好的聊天機(jī)器人評(píng)估。

圖片

圖片

前幾日，機(jī)器之心報(bào)道內(nèi)容《「羊駝」們走到哪一步了？研究表明：最好的能達(dá)到 GPT-4 性能的 68%》，也對(duì)開(kāi)源模型的性能進(jìn)行了評(píng)估。

評(píng)估還表明，在任何給定的評(píng)估中，最佳模型的平均性能達(dá)到 ChatGPT 的 83%、GPT-4 的 68%，這表明需要進(jìn)一步構(gòu)建更好的基礎(chǔ)模型和指令調(diào)優(yōu)數(shù)據(jù)以縮小差距。

感興趣的讀者可以查看原文。

責(zé)任編輯：張燕妮來(lái)源：機(jī)器之心

開(kāi)源模型

點(diǎn)贊

51CTO技術(shù)棧公眾號(hào)

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開(kāi)發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營(yíng)

<cite id="ggdrd"></cite>