自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺

51CTO學(xué)堂

IT職業(yè)在線教育平臺

清華唐杰團(tuán)隊新作：一口氣生成2萬字，大模型開卷長輸出精華

發(fā)布于 2024-8-15 13:04

瀏覽

0收藏

一口氣生成2萬字，大模型輸出也卷起來了！

清華&智譜AI最新研究，成功讓GLM-4、Llama-3.1輸出長度都暴增。

相同問題下，輸出結(jié)果直接從1800字增加到7800字，翻4倍。

要知道，目前大模型的生成長度普遍在2k以下。這對于內(nèi)容創(chuàng)作、問題回答等都存在影響，可能導(dǎo)致模型回答問題不全面、創(chuàng)造性降低等。

該研究由智譜AI創(chuàng)始人、清華大學(xué)教授李涓子和唐杰共同領(lǐng)銜。

清華唐杰團(tuán)隊新作：一口氣生成2萬字，大模型開卷長輸出-AI.x社區(qū)

論文及代碼都已放在GitHub上開源。

有網(wǎng)友已經(jīng)搶先體驗(yàn)。LongWriter-llama3.1-8b可生成萬字長文《羅馬帝國衰落史》，在MacBook Pro 2018（32GB）上就能運(yùn)行。

輸出內(nèi)容很準(zhǔn)確，可以得A++。

清華唐杰團(tuán)隊新作：一口氣生成2萬字，大模型開卷長輸出-AI.x社區(qū)

9B模型搞定萬字輸出

本項研究主要包括3方面工作。

分析文本生成長度限制因素
提出AgentWrite
擴(kuò)展LLM輸出窗口大小

首先，研究人員構(gòu)建了一個測試工具LongWrite-Ruler。通過測試多個大模型，他們發(fā)現(xiàn)所有模型在生成超過2000字的文本時都遇到了困難。

進(jìn)一步分析用戶和大模型的交互日志，研究人員發(fā)現(xiàn)只有超過1%的用戶請求明確提到要生成超過2000字的文本。

為此，他們改變了模型在監(jiān)督式微調(diào)（SFT）階段使用的數(shù)據(jù)集的最大輸出長度。

結(jié)果發(fā)現(xiàn)，模型的最大輸出長度與SFT數(shù)據(jù)集中的最大輸出長度呈顯著正相關(guān)。

所以得出結(jié)論，現(xiàn)有模型在輸出長度上受限主要是因?yàn)?strong>SFT數(shù)據(jù)集中缺少長輸出樣本。

即使模型在預(yù)訓(xùn)練階段見過更長的序列，但是SFT階段缺乏長文本樣本，還是會影響輸出長度。

清華唐杰團(tuán)隊新作：一口氣生成2萬字，大模型開卷長輸出-AI.x社區(qū)

為了克服這個限制，研究人員提出了AgentWrite。

這是一個基于Agent的pipline。

清華唐杰團(tuán)隊新作：一口氣生成2萬字，大模型開卷長輸出-AI.x社區(qū)

它允許將超長文本生成任務(wù)分解為多個子任務(wù)，每個子任務(wù)處理其中的一段。

具體流程是AgentWrite先根據(jù)用戶指令制定出一個詳細(xì)的寫作計劃，計劃包括每個段落的主要內(nèi)容點(diǎn)和目標(biāo)詞數(shù)。根據(jù)計劃，AgentWrite依次提示模型生成每個段落的內(nèi)容。

清華唐杰團(tuán)隊新作：一口氣生成2萬字，大模型開卷長輸出-AI.x社區(qū)

在AgentWrite基礎(chǔ)上，團(tuán)隊利用GPT-4o生成了6000個長輸出SFT數(shù)據(jù)，輸出長度在2k到32k詞之間，構(gòu)成了數(shù)據(jù)集LongWriter-6k。并將這些數(shù)據(jù)添加到訓(xùn)練過程中。

為了驗(yàn)證方法的有效性，團(tuán)隊還提出了一個LongBench-Write。其中包含了多樣化的用戶寫作指令，輸出長度規(guī)格分別為0-500詞、500-2000詞、2000-4000詞以及4000詞以上。

評估結(jié)果顯示，使用AgentWrite后模型輸出長度明顯增加。

清華唐杰團(tuán)隊新作：一口氣生成2萬字，大模型開卷長輸出-AI.x社區(qū)

通過直接偏好優(yōu)化（DPO），GLM-4-9B在一眾模型中實(shí)現(xiàn)了最佳性能。

清華唐杰團(tuán)隊新作：一口氣生成2萬字，大模型開卷長輸出-AI.x社區(qū)

手速快的網(wǎng)友已經(jīng)搶先實(shí)測。

Reddit上一位網(wǎng)友讓LongWriter-llama3.1-8b生成羅馬帝國衰敗史，整體需要22分鐘（與硬件有關(guān)），平均每秒生成3.34個token。

清華唐杰團(tuán)隊新作：一口氣生成2萬字，大模型開卷長輸出-AI.x社區(qū)

生成內(nèi)容比較公式化，回答不同問題的結(jié)構(gòu)、節(jié)奏相似。

無論如何這是個好的開始，帶來的提升很明顯。

清華唐杰團(tuán)隊新作：一口氣生成2萬字，大模型開卷長輸出-AI.x社區(qū)

研究團(tuán)隊也表示未來將進(jìn)一步擴(kuò)展模型的輸出長度和輸出質(zhì)量，同時也會開始研究如何在不犧牲生成質(zhì)量的情況下提高效率。

本文轉(zhuǎn)自量子位，作者：量子位

原文鏈接:??https://mp.weixin.qq.com/s/rdeBsGZDgMWz-5PzfaTlzA??

標(biāo)簽

贊

收藏

回復(fù)

舉報

回復(fù)

相關(guān)推薦

萬字長文解析：大模型需要怎樣的硬件算力

pangguiyu ? 1.6w瀏覽 ? 0回復(fù)
從API到Agent：萬字長文洞悉LangChain工程化設(shè)計

wx5bbef785639a1 ? 4642瀏覽 ? 0回復(fù)
萬字長文解析：2024年的機(jī)器消除學(xué)習(xí)

AIGC最前線 ? 2925瀏覽 ? 0回復(fù)
極佳、中科院等9機(jī)構(gòu)聯(lián)合首發(fā) | 3萬字長文全面解析世界模型(內(nèi)容生成/自動駕駛等)

angel ? 5449瀏覽 ? 0回復(fù)
Hinton萬字訪談：用更大模型「預(yù)測下一個詞」值得全力以赴

輕薄滴假象 ? 2222瀏覽 ? 0回復(fù)
老黃一口氣解密三代GPU！粉碎摩爾定律打造AI帝國，量產(chǎn)Blackwell解決ChatGPT全球耗電難題

duhorse ? 2652瀏覽 ? 0回復(fù)
AI首次實(shí)時生成視頻！尤洋團(tuán)隊新作，網(wǎng)友：這是新紀(jì)元

angel ? 2635瀏覽 ? 0回復(fù)
大語言模型的前世今生：萬字長文完整梳理所有里程碑式大語言模型（LLMs）

angel ? 6907瀏覽 ? 0回復(fù)
萬字綜述：全面梳理 FP8 訓(xùn)練和推理技術(shù)

amei2000go ? 1.1w瀏覽 ? 0回復(fù)
今天一口氣開源3個重磅！壓軸戲期待拉滿，R2、V4、被提名

51CTO技術(shù)棧 ? 1857瀏覽 ? 0回復(fù)
DeepSeek一口氣開源3個項目，還有梁文鋒親自參與，昨晚API大降價

輕薄滴假象 ? 2113瀏覽 ? 0回復(fù)
【萬字長文】深度剖析：RAG、AI Agent與Agentic RAG的融合發(fā)展|值得收藏

Halo咯咯 ? 3711瀏覽 ? 0回復(fù)
AI挑西瓜：每一口都是甜蜜暴擊

InfonityAI智推星 ? 1833瀏覽 ? 0回復(fù)
如何高效地為「推理模型」編寫最佳提示詞？萬字長文介紹

Baihai_IDP ? 2124瀏覽 ? 0回復(fù)
百度一口氣上線文心4.5和X1!實(shí)力震驚硅谷！API價格又打下來了，R1還得對半砍！

51CTO技術(shù)棧 ? 1377瀏覽 ? 0回復(fù)
萬字解析非結(jié)構(gòu)化文檔中的隱藏價值：多模態(tài)檢索增強(qiáng)生成（RAG）的前景

柏企閱文 ? 918瀏覽 ? 0回復(fù)
萬字綜述 LLM 訓(xùn)練中的 Overlap 優(yōu)化：字節(jié) Flux 等7種方案

amei2000go ? 1219瀏覽 ? 0回復(fù)
萬字長文深度剖析基于 MCP 實(shí)現(xiàn) AI 應(yīng)用架構(gòu)設(shè)計新范式的落地實(shí)踐

玄姐聊AGI ? 2597瀏覽 ? 0回復(fù)
百度的底氣，李彥宏的決心：3萬卡國產(chǎn)自研集群；一口氣九個重磅發(fā)布，全方位支持MCP

51CTO技術(shù)棧 ? 671瀏覽 ? 0回復(fù)

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

何愷明開辟分形圖像生成新范式！計算效率提高4000倍，首次實(shí)現(xiàn)高分辨率逐像素生成 2025-02-26 11:59:41發(fā)布
達(dá)摩院開源VideoLLaMA3：僅7B大小，視頻理解拿下SOTA | 在線可玩 2025-02-14 13:02:21發(fā)布

熱門推薦

大半精銳盡出！o1下線！滿血o3之后，模型本身就是Manus，最大賣點(diǎn)：替代人干真活！ 1回復(fù)

王炸！MCP 架構(gòu)設(shè)計深度剖析 & 使用 Spring AI + MCP 四步教你實(shí)現(xiàn) Agent 智能體開發(fā) 0回復(fù)

Dify從入門到高階系列二：手把手教學(xué)！超詳細(xì)的Dify知識庫配置全攻略 0回復(fù)

Crawl4AI：GitHub榜首40K星標(biāo)！LLM專屬極速開源爬蟲神器 0回復(fù)

只需5分鐘，教你用Python搭建MCP Server 0回復(fù)

上一篇： AI斗圖神器：普通視頻秒變meme，手繪動畫輕松融入，了解一下？

下一篇：蜘蛛俠妖嬈起舞，下一代ControlNet來了！賈佳亞團(tuán)隊推出，即插即用，還能控制視頻生成

社區(qū)精華內(nèi)容

目錄