自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<blockquote id="zljny"><tt id="zljny"></tt></blockquote>

<sub id="zljny"><p id="zljny"><li id="zljny"></li></p></sub>

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓

鴻蒙開發(fā)者社區(qū)

WOT技術大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質的IT技術網站

51CTO博客

專業(yè)IT技術創(chuàng)作平臺

51CTO學堂

IT職業(yè)在線教育平臺

論文解讀：《大語言模型推理算法：從解碼到元生成》

智能交互引擎

發(fā)布于 2024-9-12 17:15

瀏覽

0收藏

一、引言
現(xiàn)代研究發(fā)現(xiàn)，訓練大語言模型（LLMs）時增加計算量會帶來更好的結果，但在推理時增加計算量的好處卻較少被關注。本文聚焦于推理時的方法，探討了令牌級生成算法、元生成算法和高效生成這三個主題。

二、相關概念及背景
1、用戶目標在生成中的作用：用戶使用語言模型生成輸出時，可能希望獲得高質量、多樣化的輸出，例如解決數(shù)學問題的正確答案或符合事實且寫得好的總結。為了形式化這個目標，我們引入了“可接受性”的概念，即用戶對輸出的滿意度，并將生成輸出的過程看作是從語言模型的分布中采樣，以盡可能接近用戶的滿意度分布。
2、語言模型的建模問題：語言模型是對序列的概率建模，通常采用自回歸的方式，即根據前面的令牌預測下一個令牌的概率分布。生成模型與語言模型相關聯(lián)，它將輸入、語言模型和其他參數(shù)映射到輸出的概率分布。計算這個概率分布在大多數(shù)情況下是分析上難以處理的，通常需要使用生成算法來獲得樣本。我們將生成方法分為最大化、采樣和從指定目標分布采樣三類。

三、令牌級生成算法
1、MAP解碼算法：選擇語言模型定義的分布中最有可能的序列，如貪心解碼，但貪心解碼可能會導致結果不完美，如重復序列或短序列偏好等問題。
2、采樣和適配器：直接從語言模型的分布中采樣，如祖先采樣，同時為了平衡多樣性和連貫性，引入了一些采樣適配器，如溫度采樣、核采樣等。
3、令牌級采樣適配器：許多令牌級采樣方法可以看作是調整每個下一個令牌分布的采樣適配器，還包括一些使用其他模型輸出重加權令牌的方法，以及為了控制統(tǒng)計和信息論性質的自適應和前瞻適配器，還有使用另一個語言模型調整下一個令牌分布的方法。
4、受控生成：許多場景可以被框架為從語言模型的分布中采樣，該分布由序列級標準調制，例如通過分類器、指示器或獎勵來實現(xiàn)。

四、元生成算法
1、鏈式元生成器：通過將多個生成器鏈接在一起，例如在提示語言模型中，通過組合不同的操作和生成器來完成任務，如解決數(shù)學問題或生成故事。
2、并行元生成器：包括reranking算法（如Best-of-N）、transformation算法（如Majorityvoting、Self-consistency等）和sequence-levelstatisticalrejectionsampling。
3、步級搜索算法：通過調用生成器來實現(xiàn)經典搜索算法，如greedydecoding、beamsearch、stepwisebeamsearch、Tree-of-thoughts等，用于解決數(shù)學問題或定理證明等任務。
4、細化算法：由初始生成器、信息源和細化器組成，通過接收信息和細化輸出，直到滿足停止條件，如Self-correction和Promptedrefiners等。

五、引入外部信息
1、多個模型：許多生成算法結合了多個模型，如使用小語言模型調整大模型的分布或加速生成，學習驗證器模型來選擇輸出，以及通過提示參數(shù)化不同模型。
2、外部環(huán)境信息：生成算法可以結合外部環(huán)境信息，如調用外部工具進行計算或驗證，接收環(huán)境觀察結果，例如在代碼生成中使用執(zhí)行結果或在數(shù)字代理中結合環(huán)境信息。

六、令牌成本和性能分析
1、令牌預算：元生成器的成本包括輸入令牌、輸出令牌和外部信息的成本，不同的元生成算法在成本上有所不同，例如step-levelsearch和sequence-levelsearch在成本上的差異，以及refinement與sequence-levelsearch的成本比較。
2、增加令牌預算以提高性能：在許多推理相關任務中，生成多個序列并從中選擇的算法（如Best-of-N、Majorityvoting等）通常比生成單個序列的算法（如貪心解碼）性能更好，隨著生成預算的增加，這些算法的性能可以單調提高。
3、最小化令牌預算：一方面可以通過將生成路由到成本逐漸降低的模型來減少令牌預算，另一方面可以利用特定元生成算法的性質來減少調用次數(shù)，從而降低成本。
4、對底層生成器的依賴：元生成器的性能依賴于底層的生成算法，例如采樣參數(shù)的選擇會影響性能，不同的元生成算法對底層生成器的依賴程度不同。

七、加速生成
1、背景：加速生成需要平衡延遲、吞吐量和質量三個指標，硬件是加速生成的關鍵考慮因素，不同的硬件環(huán)境對性能有重要影響。
2、加速生成器：可以通過修改模型架構、壓縮模型、進行硬件感知的實現(xiàn)或并行化來加速單個生成的時間，例如使用更高效的注意力機制、量化模型權重或激活、利用硬件特性進行優(yōu)化或采用并行解碼策略。
3、加速元生成算法：利用共享前綴來節(jié)省計算并提高生成吞吐量，通過壓縮或優(yōu)化計算圖來進一步加速，例如緩存模型狀態(tài)、壓縮KVCache、優(yōu)化批處理或針對特定算法進行優(yōu)化。
4、庫和工具：介紹了一些用于快速生成的庫和工具，如vLLM、TensorRTLLM、GPT-Fast等，以及一些在CPU上實現(xiàn)快速解碼的庫。

八、討論與結論
當前，生成算法在多個方面發(fā)揮著重要作用。一方面，令牌級截斷算法等生成算法可避免模型分布中的錯誤，如祖先采樣可能導致的不連貫序列以及MAP解碼算法可能導致的重復序列，盡管未來模型或許能減少這些不完美之處，但現(xiàn)階段仍需生成算法來修正。同時，語言模型的學習分布與期望的生成分布可能不一致，生成算法能通過重加權或抽樣調整分布使其符合期望，雖未來可能通過微調模型實現(xiàn)，但目前其調整分布的作用依然重要。生成算法還可看作是在輸出空間中搜索期望序列的過程，增加計算量能提高搜索效果，即便未來某些任務可能不再需要生成算法，但在一些具有挑戰(zhàn)性的情況下仍有用武之地。此外，生成算法能夠結合外部信息，如其他模型的預測、提示中的指令或外部工具的結果，在許多具有挑戰(zhàn)性的場景中十分必要，未來也可能會有更多結合外部信息的生成算法出現(xiàn)。而且，無論未來序列生成器的形式如何，加速生成始終是必要的，開發(fā)新的加速方法有望帶來顯著收益?？傊疚膶φZ言模型的生成算法進行了綜述，統(tǒng)一了來自解碼、LLM推理和機器學習系統(tǒng)社區(qū)的過去研究，并確定了未來工作的方向。大家對這篇論文有什么看法呢？歡迎來智能交互引擎搜索工業(yè)知識，展開相關討論。

標簽

大語言模型

贊

收藏

回復

舉報

回復

相關推薦

從構思到成稿：全網最全的論文流程和指令

數(shù)師兄 ? 5181瀏覽 ? 0回復
大模型高效微調Prompt Tuning論文解讀

AIRoobt ? 4450瀏覽 ? 0回復
解讀AI大模型，從了解token開始

ermulong ? 2845瀏覽 ? 0回復
解讀AI大模型，從了解token開始

ermulong ? 1885瀏覽 ? 0回復
【人工智能】10分鐘解讀-深入淺出大語言模型（LLM）——從ChatGPT到未來AI的演進

唐克 ? 4998瀏覽 ? 0回復
從“聰明工具”到“萬能助手”：全景解讀AI Agents生態(tài)版圖

云原生AI百寶箱 ? 2599瀏覽 ? 0回復
使用 LlamaFactory 結合開源大語言模型實現(xiàn)文本分類：從數(shù)據集構建到 LoRA 微調與推理評估

AI悠閑區(qū) ? 5108瀏覽 ? 0回復
Python語言openAI庫詳解：從入門到精通（從0到1手把手教程）

唐克 ? 4366瀏覽 ? 0回復
一文講清楚視覺大模型！CLIP模型論文解讀

石映飛云 ? 5389瀏覽 ? 0回復
深入探究編碼器 - 解碼器架構：從RNN到Transformer的自然語言處理模型

AI論文解讀 ? 3637瀏覽 ? 0回復
大推理模型DeepSeek-R1深度解讀：成本降低95%，推動語言模型推理效率新高度

風云2002_1 ? 1.1w瀏覽 ? 0回復
為什么大語言模型難以處理長上下文？從 Transformer 到 Mamba

Baihai_IDP ? 2574瀏覽 ? 0回復
如何利用 DeepSeek-R1 本地部署強大的推理模型：從 ChatGPT 風格界面到 API 集成

Halo咯咯 ? 2755瀏覽 ? 0回復
從PPO到GRPO：算力減半的大模型推理能力訓練革命

Baihai_IDP ? 3709瀏覽 ? 0回復
從語言到認知：LLM如何超越人類語言網絡

頓數(shù)AI ? 1402瀏覽 ? 0回復
從詞語到概念：大概念模型如何重新定義語言理解與生成

51CTO內容精選 ? 933瀏覽 ? 0回復
你了解大模型的生態(tài)體系嗎？大模型從技術到應用的內容梳理

AI探索時代 ? 1014瀏覽 ? 0回復
大語言模型增強的文本到 SQL 生成：綜述

AIGC前沿技術追蹤 ? 1214瀏覽 ? 0回復
從零到一構建Agent系統(tǒng)：四大模塊 + 框架生態(tài)詳解

PyTorch研習社 ? 791瀏覽 ? 0回復

智能交互引擎

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關注

最近發(fā)布

論文解讀：Expressive Whole-Body 3D Gaussian Avatar 2024-12-02 14:10:35發(fā)布
《解讀論文：A Simple Framework for Contrastive Learning of Visual Representations》 2024-11-08 17:27:06發(fā)布

熱門推薦

大半精銳盡出！o1下線！滿血o3之后，模型本身就是Manus，最大賣點：替代人干真活！ 1回復

王炸！MCP 架構設計深度剖析 & 使用 Spring AI + MCP 四步教你實現(xiàn) Agent 智能體開發(fā) 0回復

Dify從入門到高階系列二：手把手教學！超詳細的Dify知識庫配置全攻略 0回復

Crawl4AI：GitHub榜首40K星標！LLM專屬極速開源爬蟲神器 0回復

只需5分鐘，教你用Python搭建MCP Server 0回復

上一篇：解讀 “Flash Cache” ：減少輻射緩存反渲染偏差

下一篇： ChatGPT 與 AI 會議同行評審：大規(guī)模監(jiān)測 AI

社區(qū)精華內容

目錄

<cite id="f39iv"></cite>

<blockquote id="f39iv"><p id="f39iv"></p></blockquote>

^{<blockquote id="f39iv"></blockquote>}