自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

用暫停token重新訓(xùn)練大模型,AI學(xué)會三思而后行

人工智能 新聞
整個(gè)研究基于一個(gè)簡單的想法:在輸入序列后面追加一系列(暫停token),從而延遲模型輸出下一個(gè)token。這可以給模型額外的計(jì)算時(shí)間來處理更復(fù)雜的輸入。

讓ChatGPT給出答案之前多想想步驟,就能提高準(zhǔn)確率。

那么能不能省去提示詞,直接把這種能力內(nèi)化在大模型里呢?

CMU與谷歌團(tuán)隊(duì)的新研究,在訓(xùn)練大模型時(shí)加入暫停token來實(shí)現(xiàn)這一點(diǎn)。

圖片

實(shí)驗(yàn)中,8項(xiàng)評測成績提升,其中SQuAD的EM得分提高18%,CommonSenseQA提高8%,GSM8k中的推理任務(wù)也提高1%。

圖片

研究者Jack Hack表示,自己不久前就提出類似假設(shè),很高興看到它被驗(yàn)證。

圖片

英偉達(dá)工程師Aaron Erickson表示,是不是和人類說話時(shí)加入“嗯嗯啊啊”是一個(gè)道理?

圖片

預(yù)訓(xùn)練微調(diào)都加入暫停token

整個(gè)研究基于一個(gè)簡單的想法:

在輸入序列后面追加一系列(暫停token),從而延遲模型輸出下一個(gè)token。

這可以給模型額外的計(jì)算時(shí)間來處理更復(fù)雜的輸入。

圖片

作者不僅在下游任務(wù)微調(diào)時(shí)引入,還在預(yù)訓(xùn)練時(shí)就隨機(jī)在序列中插入,讓模型在兩階段都學(xué)習(xí)如何利用這種計(jì)算延遲。

圖片

預(yù)訓(xùn)練階段,在語料庫中隨機(jī)插入一定比例的暫停token到輸入序列,進(jìn)行標(biāo)準(zhǔn)的自回歸預(yù)訓(xùn)練。但計(jì)算損失時(shí)會跳過暫停token的預(yù)測。

下游任務(wù)微調(diào)時(shí),輸入中也追加一定數(shù)量的暫停 token,然后對目標(biāo)序列進(jìn)行自回歸預(yù)測,同時(shí)微調(diào)模型參數(shù)。

推理階段也追加相同數(shù)量的暫停token,但忽略模型輸出直到最后一個(gè)暫停token,然后開始提取答案。

實(shí)驗(yàn)使用了標(biāo)準(zhǔn)的Transformer純Decoder模型,分為130M參數(shù)和1B參數(shù)兩個(gè)版本。

其中暫停token只增加了1024個(gè)參數(shù),也就是它本身的embedding大小。

在9個(gè)不同任務(wù)上的實(shí)驗(yàn)表明,僅在微調(diào)階段引入暫停token的效果并不明顯,有些任務(wù)不會提升。

但如果在預(yù)訓(xùn)練和finetune階段都使用暫停token,大多數(shù)任務(wù)上都獲得顯著提升。

論文還探究了暫停token的數(shù)量、位置等關(guān)鍵超參數(shù)。發(fā)現(xiàn)對于不同的模型通常存在一個(gè)最優(yōu)的數(shù)量。

最后作者也提出,這項(xiàng)工作也有不少局限性。

  • 由于暫停token增加了模型計(jì)算量,與其他方法對比是否公平還有待討論
  • 新方法需要重新預(yù)訓(xùn)練,在實(shí)際應(yīng)用還有一定困難
  • 對具體工作機(jī)制還缺乏深入理解
  • 推理時(shí)如果暫停token數(shù)量為0,模型表現(xiàn)仍然不佳

搜索引擎You.com的CEO表示,接下來是不是應(yīng)該把所有提高人類認(rèn)知表現(xiàn)的技巧都對大模型試一試?

圖片

現(xiàn)在已經(jīng)有了“一步一步地想”和“深呼吸”。

也許下一個(gè)爆款論文就是教大模型帶著問題睡一覺或者更離譜的健康飲食、注意鍛煉。

論文地址:https://arxiv.org/abs/2310.02226

責(zé)任編輯:張燕妮 來源: 量子位
相關(guān)推薦

2009-10-29 18:04:32

2018-08-08 06:49:35

云計(jì)算私有云公有云

2011-03-29 15:53:28

數(shù)據(jù)庫管理

2015-02-26 14:10:58

部署虛擬化

2025-04-07 09:00:00

模型AI推理

2011-02-18 10:22:30

2015-04-20 10:47:53

微服務(wù)容器技術(shù)PaaS

2010-08-26 15:33:28

無線網(wǎng)絡(luò)

2013-09-11 11:00:59

HTML5企業(yè)

2023-10-16 13:39:00

AI智能

2025-02-18 08:00:00

2023-09-06 08:30:00

低代碼自動(dòng)化開發(fā)

2010-02-01 16:39:32

Dell主板質(zhì)量

2023-07-18 15:14:04

人工智能自動(dòng)化

2015-04-16 16:58:39

2013-12-09 11:06:47

2016-01-05 15:40:07

2014-08-20 11:17:03

2015-08-24 13:42:58

WiFi安全

2013-09-12 10:30:46

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號