還在為改論文頭禿?新AI幫你搞定它,加注釋查錯(cuò)增刪細(xì)節(jié)樣樣在行
本文經(jīng)AI新媒體量子位(公眾號(hào)ID:QbitAI)授權(quán)轉(zhuǎn)載,轉(zhuǎn)載請(qǐng)聯(lián)系出處。
改論文,有時(shí)候比寫論文痛苦。
無論是導(dǎo)師“刷屏”的一個(gè)個(gè)建議,還是期刊給回來的審稿意見,都能折磨得人頭發(fā)狂掉。
好消息是,現(xiàn)在AI終于可以幫你改論文了。
像是給論文引用的某個(gè)算法/觀點(diǎn)加上原始參考文獻(xiàn):
又或是修改文中的一些事實(shí)性錯(cuò)誤:
都只需要描述一句話(直接粘貼導(dǎo)師的修改意見),AI就能準(zhǔn)確領(lǐng)會(huì)你的意圖,并上手改動(dòng)論文。
最關(guān)鍵的是,改動(dòng)的地方AI還會(huì)給出解釋,讓你流利應(yīng)對(duì)導(dǎo)師的“突擊檢查”:
這是Meta AI搞出來的最新協(xié)同語言模型PEER,要解決的就是AI會(huì)生成文章、卻不會(huì)改文章的問題。
△人均撲克高手(doge)
看到這里,一名在讀博士生狂喜:“沒寫完的博士論文有著落了!”
還有網(wǎng)友表示:
很棒的工作,如果LLM沒有交互性,那終將成為一個(gè)死胡同。《銀河系漫游指南》的作者一定會(huì)喜歡它的。
那么,這只AI究竟是怎么學(xué)會(huì)“改文章”的?
用AI幫AI一步步“捋順?biāo)悸贰?/h4>
此前AI會(huì)寫卻不會(huì)改論文,主要有三點(diǎn)原因:
①無法控制文章細(xì)節(jié),搞不懂自己要改啥;②無法聽懂人類的命令;③解釋不了自己生成了什么。
為此,Meta AI的研究人員用4個(gè)編解碼器組成PEER,每個(gè)編解碼器干不同的活。
它們被分別命名為PEER-Edit(整體規(guī)劃&編輯)、PEER-Undo(還原編輯步驟)、PEER-Explain(解釋編輯目的)、PEER-Document(搜集素材)。
這幾個(gè)編解碼器并非獨(dú)立工作,它們的作用是相輔相成的。
例如,PEER-Undo的出現(xiàn),實(shí)際上就是為了加強(qiáng)PEER-Edit的編輯能力。
PEER-Edit是4個(gè)編解碼器中的核心骨干,它會(huì)在輸入一段待修改文本和參考素材后,決定如何對(duì)文本進(jìn)行編輯,并給出編輯結(jié)果。
但如果直接用待修改文本和參考素材訓(xùn)練PEER-Edit,會(huì)發(fā)現(xiàn)它的編輯能力不穩(wěn)定。
因此,需要用PEER-Undo來根據(jù)PEER-Edit的輸出和素材,盡可能還原PEER-Edit編輯過的每個(gè)步驟,有點(diǎn)像是“幫對(duì)方捋順編輯思路”。
這樣一來,PEER-Edit就會(huì)意識(shí)到“原來我打算這樣編輯”,并借助PEER-Undo生成的結(jié)果,有意識(shí)加強(qiáng)訓(xùn)練效果。
在PEER-Edit和PEER-Undo之外,PEER-Explain和PEER-Document的作用就相對(duì)好理解了。
其中,PEER-Explain負(fù)責(zé)將最終編輯的結(jié)果“變成人話”;PEER-Document則負(fù)責(zé)到網(wǎng)上收集修改用的素材(包括但不限于維基百科),給PEER-Edit“打零工”。
4個(gè)編解碼器加在一起,就組成了一個(gè)既能與人溝通、了解修改意圖,也能上手查找資料、編輯論文的協(xié)同語言模型PEER。
團(tuán)隊(duì)將它與其他模型的能力進(jìn)行了比較。
110億參數(shù)實(shí)現(xiàn)SOTA
具體來說,比較的模型包括一些基于T5(Text-to-Text Transfer Transformer)的模型和一些1750億參數(shù)的解碼器模型(GPT-3)等。
從圖中可見,PEER系列的模型參數(shù)最高也就110億左右,但在一些相關(guān)評(píng)估上都刷新了SOTA。
從可以實(shí)現(xiàn)的效果來看,基本上能直接通過交互,讓AI寫出一段論文并修改:
例如“刪掉沒信源的表述”、以及“把步驟列出來”,這只AI都能準(zhǔn)確理解并實(shí)現(xiàn):
不過對(duì)于這個(gè)模型,也有網(wǎng)友提出了一個(gè)設(shè)想:
如果讓PEER去審查PEER自己的文章,會(huì)怎樣呢?(手動(dòng)狗頭)
論文地址:
https://arxiv.org/abs/2208.11663