自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<sub id="ze64r"></sub>

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會(huì)

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

AI.x社區(qū)

登錄/注冊(cè)
51CTO

中國(guó)優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺(tái)

51CTO學(xué)堂

IT職業(yè)在線教育平臺(tái)

ACL2024 |解釋引導(dǎo)的大語(yǔ)言模型主動(dòng)蒸餾：一種優(yōu)化知識(shí)轉(zhuǎn)移的創(chuàng)新框架 "ELAD"

發(fā)布于 2024-11-27 14:44

瀏覽

0收藏

大家好，我是HxShine

今天分享一篇ACL2024關(guān)于LLM蒸餾的文章，來自Emory University，題為“Explanation-Guided Large Language Models Active Distillation”（解釋引導(dǎo)的大型語(yǔ)言模型主動(dòng)蒸餾）。在大型語(yǔ)言模型（LLMs）的應(yīng)用中，由于其內(nèi)存效率低、計(jì)算需求高以及API推理成本高，限制了其廣泛部署。現(xiàn)有的知識(shí)蒸餾方法雖然能將LLMs的能力轉(zhuǎn)移到較小模型上，但無法確保知識(shí)充分轉(zhuǎn)移，可能導(dǎo)致高成本或蒸餾不完全。本文提出了一個(gè)簡(jiǎn)單卻高效的框架，稱之為ELAD（Explanation-Guided LLMs Active Distillation），其通過主動(dòng)學(xué)習(xí)策略來優(yōu)化注釋成本與模型性能之間的平衡。簡(jiǎn)單來說，ELAD采用了三個(gè)步驟來實(shí)現(xiàn)這一目標(biāo)：1. 解釋引導(dǎo)的樣本選擇：通過利用解釋步驟中的不確定性，識(shí)別對(duì)模型推理具有挑戰(zhàn)性的樣本。2. 定制化的LLM注釋解釋修正：教師模型檢測(cè)并糾正學(xué)生模型推理中的缺陷。3. 模型蒸餾：使用修正后的解釋對(duì)小模型進(jìn)行微調(diào)。在包括GSM8K、AQuA、ANLI、e-SNLI、CommonSenseQA和StrategyQA在內(nèi)的六個(gè)廣泛使用的推理基準(zhǔn)上進(jìn)行的廣泛實(shí)驗(yàn)，展示了顯著的性能提升。

ACL2024 |解釋引導(dǎo)的大語(yǔ)言模型主動(dòng)蒸餾：一種優(yōu)化知識(shí)轉(zhuǎn)移的創(chuàng)新框架 "ELAD"-AI.x社區(qū)

Title: ELAD: Explanation-Guided Large Language Models Active Distillation

URL:??https://arxiv.org/abs/2402.13098??

一、方法

1 整體框架

ELAD框架通過以下步驟優(yōu)化LLMs知識(shí)蒸餾的主動(dòng)學(xué)習(xí)：

樣本選擇：使用解釋引導(dǎo)的方法選擇高不確定性的樣本，對(duì)應(yīng)下圖(a)。
解釋修正：教師模型對(duì)學(xué)生模型的解釋進(jìn)行審核和修正，對(duì)應(yīng)下圖(b)。
模型蒸餾：使用修正后的解釋對(duì)小模型進(jìn)行微調(diào)，對(duì)應(yīng)下圖(c)。

ACL2024 |解釋引導(dǎo)的大語(yǔ)言模型主動(dòng)蒸餾：一種優(yōu)化知識(shí)轉(zhuǎn)移的創(chuàng)新框架 "ELAD"-AI.x社區(qū)

2 解釋引導(dǎo)的樣本選擇方法

文章作者提出了一種新穎的解釋引導(dǎo)樣本選擇方法，通過評(píng)估解釋步驟中的不確定性來選擇具有高不確定性的樣本。具體包括：

2.1 解釋內(nèi)不確定性解釋內(nèi)不確定性評(píng)估單個(gè)解釋步驟內(nèi)的不確定性。這是通過比較每一步推理步驟對(duì)最終答案的影響來實(shí)現(xiàn)的。具體方法如下：

1. 對(duì)于每個(gè)推理步驟，計(jì)算在不考慮該步驟的情況下生成的答案。
2. 比較包含和不包含該步驟的答案，如果答案變化，則該步驟具有高不確定性。

ACL2024 |解釋引導(dǎo)的大語(yǔ)言模型主動(dòng)蒸餾：一種優(yōu)化知識(shí)轉(zhuǎn)移的創(chuàng)新框架 "ELAD"-AI.x社區(qū)

2.2 解釋間不確定性解釋間不確定性評(píng)估不同推理路徑之間的不確定性。這是通過多次生成推理路徑，并計(jì)算不同答案的頻率來實(shí)現(xiàn)的。具體方法如下：

對(duì)每個(gè)問題進(jìn)行多次解碼，生成不同的推理路徑。
計(jì)算每個(gè)唯一答案的頻率，并使用Shannon熵來量化答案分布的不確定性。

3 定制化的LLM注釋解釋修正

在樣本選擇之后，教師模型（LLM）對(duì)學(xué)生模型的解釋進(jìn)行審核，并在需要時(shí)進(jìn)行修正。此過程包括：

?深度優(yōu)先搜索（DFS）策略：教師模型逐步驗(yàn)證并修正學(xué)生模型的推理步驟，直到生成最終答案（如下圖（a）和（b））,圖（c）展示了DFS的過程。具體方法如下：

對(duì)每個(gè)推理步驟，教師模型驗(yàn)證其合理性。如果合理，生成對(duì)應(yīng)的解釋步驟。

如果某一步推理不合理，教師模型生成剩余的推理步驟和最終答案。

? 解釋修正過程的流程圖

ACL2024 |解釋引導(dǎo)的大語(yǔ)言模型主動(dòng)蒸餾：一種優(yōu)化知識(shí)轉(zhuǎn)移的創(chuàng)新框架 "ELAD"-AI.x社區(qū)

? 解釋修正所使用的Prompt示例

ACL2024 |解釋引導(dǎo)的大語(yǔ)言模型主動(dòng)蒸餾：一種優(yōu)化知識(shí)轉(zhuǎn)移的創(chuàng)新框架 "ELAD"-AI.x社區(qū)

二、實(shí)驗(yàn)

作者在六個(gè)不同的推理數(shù)據(jù)集上進(jìn)行了廣泛的實(shí)驗(yàn)，包括GSM8K、AQuA、ANLI、e-SNLI、StrategyQA和CommonSenseQA。實(shí)驗(yàn)結(jié)果顯示，ELAD框架在各種推理任務(wù)上均顯著提高了注釋效率和模型性能。

1 數(shù)據(jù)集詳情

?GSM8K：包含大約8000個(gè)數(shù)學(xué)單詞問題，測(cè)試數(shù)學(xué)技能。

?AQuA：包含代數(shù)單詞問題，帶有多項(xiàng)選擇答案。

?ANLI：自然語(yǔ)言推理任務(wù)，包括對(duì)抗性示例。

?e-SNLI：提供自然語(yǔ)言推理決策的人工注釋解釋。

?CommonSenseQA：常識(shí)推理問答數(shù)據(jù)集，需要理解日常概念。

?StrategyQA：測(cè)試戰(zhàn)略性問答，特別是隱含策略的推理。

2 實(shí)驗(yàn)結(jié)果

本文在六個(gè)不同的推理數(shù)據(jù)集上評(píng)估了ELAD框架的性能，以下是具體結(jié)果：

數(shù)據(jù)集	基準(zhǔn)方法	ELAD方法	提升
GSM8K	28.42%	32.72%	+4.30%
AQuA	26.86%	28.43%	+1.57%
ANLI	54.22%	58.02%	+3.80%
e-SNLI	48.60%	54.44%	+5.84%
StrategyQA	48.76%	55.63%	+6.87%
CommonSenseQA	45.66%	53.53%	+7.87%

ACL2024 |解釋引導(dǎo)的大語(yǔ)言模型主動(dòng)蒸餾：一種優(yōu)化知識(shí)轉(zhuǎn)移的創(chuàng)新框架 "ELAD"-AI.x社區(qū)

結(jié)論：ELAD框架在所有數(shù)據(jù)集上都顯著優(yōu)于基準(zhǔn)方法，尤其是在CommonSenseQA數(shù)據(jù)集上，提升幅度達(dá)到7.87%。這一結(jié)果表明，ELAD框架能夠更有效地進(jìn)行知識(shí)轉(zhuǎn)移，提升小模型的推理性能。此外，ELAD在StrategyQA和e-SNLI數(shù)據(jù)集上分別取得了6.87%和5.84%的提升，進(jìn)一步驗(yàn)證了其在不同類型推理任務(wù)中的廣泛適用性。

3 消融研究

為了驗(yàn)證ELAD框架中每個(gè)組件的重要性，作者進(jìn)行了消融研究。結(jié)果顯示，完整的ELAD框架在所有任務(wù)中均優(yōu)于缺少解釋引導(dǎo)樣本選擇（w/o EGSS）和定制化LLM注釋解釋修正（w/o CLAER）的配置。

設(shè)置	GSM8K	AQuA	ANLI	e-SNLI	CommonSenseQA	StrategyQA
ELAD (Ours)	32.72%	28.43%	58.02%	54.44%	53.53%	55.63%
w/o EGSS	30.31%	27.05%	57.12%	48.56%	48.54%	50.89%
w/o CLAER	30.01%	26.91%	55.87%	51.16%	49.64%	50.32%

三、結(jié)論

本文提出的解釋引導(dǎo)的LLMs主動(dòng)蒸餾（ELAD）框架通過解釋引導(dǎo)的主動(dòng)學(xué)習(xí)方法，顯著提高了LLM知識(shí)蒸餾的效率。這為大規(guī)模語(yǔ)言模型的實(shí)際應(yīng)用提供了新的可能性。

本文轉(zhuǎn)載自 ??NLP PaperWeekly??，作者： NLP PaperWeekly

標(biāo)簽

主動(dòng)蒸餾

贊

收藏

回復(fù)

舉報(bào)

回復(fù)

相關(guān)推薦

未來人類只有母語(yǔ)一種語(yǔ)言

duhorse ? 2850瀏覽 ? 0回復(fù)
利用大語(yǔ)言模型增強(qiáng)網(wǎng)絡(luò)抓?。?em>一種現(xiàn)代化的方法

51CTO內(nèi)容精選 ? 4257瀏覽 ? 0回復(fù)
ACL2024：一個(gè)開源的通用語(yǔ)言代理訓(xùn)練框架LUMOS

AIGC最前線 ? 2570瀏覽 ? 0回復(fù)
編碼大模型系列：Meta創(chuàng)新的“代碼編譯優(yōu)化”的LLM

魯班模錘1 ? 3400瀏覽 ? 0回復(fù)
ACL2024 | NLP-KG：一個(gè)比Google Scholar更強(qiáng)大的NLP文獻(xiàn)搜索工具

Tang_Lan ? 3222瀏覽 ? 0回復(fù)
【創(chuàng)新一夏學(xué)習(xí)季】熱浪升溫，創(chuàng)新一夏，釋放開發(fā)潛能

AI.x社區(qū)官方賬號(hào) ? 52.8w瀏覽 ? 39回復(fù)
大型語(yǔ)言模型的知識(shí)融合（ICLR2024）

AIRoobt ? 2516瀏覽 ? 0回復(fù)
一款由知識(shí)圖譜引擎驅(qū)動(dòng)的創(chuàng)新Agent框架

探索AGI ? 2864瀏覽 ? 0回復(fù)
一種模塊化大模型Agent框架全棧技術(shù)綜述

PaperAgent ? 3642瀏覽 ? 0回復(fù)
一種支持4種多模態(tài)RAG技術(shù)的引擎：VARAG

PaperAgent ? 3113瀏覽 ? 0回復(fù)
一種將RAG、KG、VS、TF結(jié)合增強(qiáng)領(lǐng)域LLM性能的框架

PaperAgent ? 2685瀏覽 ? 0回復(fù)
COLM 2024：一種新的深度學(xué)習(xí)架構(gòu)——Monotone Deep Boltzmann Machines

AIGC最前線 ? 2509瀏覽 ? 0回復(fù)
TableRAG：一種增強(qiáng)大規(guī)模表格理解框架

大模型自然語(yǔ)言處理 ? 2434瀏覽 ? 0回復(fù)
一種基于學(xué)習(xí)的電池壽命預(yù)測(cè)（Python）

步驚云_32 ? 2158瀏覽 ? 0回復(fù)
圖上的推理：忠實(shí)且可解釋的大型語(yǔ)言模型推理（ICLR2024)

AIRoobt ? 2477瀏覽 ? 0回復(fù)
ACL2024 ｜利用GPT4構(gòu)建的多Agent系統(tǒng)自動(dòng)發(fā)現(xiàn)科學(xué)假設(shè)

arnoldzhw ? 2153瀏覽 ? 0回復(fù)
微軟人工智能研究院推出 OLA-VLM：一種以視覺為中心的優(yōu)化多模態(tài)大型語(yǔ)言模型的方法

Halo咯咯 ? 2328瀏覽 ? 0回復(fù)
LLMs的知識(shí)蒸餾：技術(shù)和應(yīng)用

柏企閱文 ? 2383瀏覽 ? 0回復(fù)
UB-Mesh：一種分層局部化的n維全互連數(shù)據(jù)中心網(wǎng)絡(luò)架構(gòu)

chengganfei ? 4409瀏覽 ? 0回復(fù)

這個(gè)用戶很懶，還沒有個(gè)人簡(jiǎn)介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

香港科技大學(xué)聯(lián)合DeepSeek-AI推出CODEI/O：讓AI學(xué)會(huì)“濃縮”推理模式 9天前發(fā)布
中國(guó)科大認(rèn)知全重實(shí)驗(yàn)室發(fā)布Agent-R1訓(xùn)練框架，支持自主思考與工具調(diào)用！ 2025-04-09 06:29:20發(fā)布

熱門推薦

大半精銳盡出！o1下線！滿血o3之后，模型本身就是Manus，最大賣點(diǎn)：替代人干真活！ 1回復(fù)

王炸！MCP 架構(gòu)設(shè)計(jì)深度剖析 & 使用 Spring AI + MCP 四步教你實(shí)現(xiàn) Agent 智能體開發(fā) 0回復(fù)

Dify從入門到高階系列二：手把手教學(xué)！超詳細(xì)的Dify知識(shí)庫(kù)配置全攻略 0回復(fù)

Crawl4AI：GitHub榜首40K星標(biāo)！LLM專屬極速開源爬蟲神器 0回復(fù)

只需5分鐘，教你用Python搭建MCP Server 0回復(fù)

上一篇：使用MCTS顯著提升LLM在復(fù)雜任務(wù)的推理能力

下一篇： Kaggle大模型競(jìng)賽優(yōu)勝方案總結(jié)與思考

社區(qū)精華內(nèi)容

目錄