GPT-4成學(xué)術(shù)造假“神器”，偽造數(shù)據(jù)又快又合理，Nature請(qǐng)統(tǒng)計(jì)學(xué)專家“斷案”

作者：蕭簫 2023-11-23 13:46:00

論文使用GPT-4為一項(xiàng)醫(yī)學(xué)學(xué)術(shù)研究生成了一個(gè)假數(shù)據(jù)集，發(fā)現(xiàn)它不僅能創(chuàng)造出看似合理的數(shù)據(jù)，甚至還能用來準(zhǔn)確支撐錯(cuò)誤的論文觀點(diǎn)。

學(xué)術(shù)造假有了GPT-4，變得更容易了。

這兩天，一篇刊登在Nature上的新聞表示，GPT-4生成的造假數(shù)據(jù)集，第一眼還真不一定看得出來。

除非請(qǐng)來業(yè)內(nèi)專家仔細(xì)對(duì)數(shù)據(jù)集進(jìn)行評(píng)估，才能發(fā)現(xiàn)個(gè)中細(xì)節(jié)的不合理性。

這個(gè)新聞的來源是一篇發(fā)表在JAMA Ophthalmology上的論文。

對(duì)此，有網(wǎng)友表示十分理解：

大模型最重要的能力就是生成“看似合理的文本”，因此它非常適合干這活兒。

還有網(wǎng)友感慨：技術(shù)“有良心”的程度，也就和用它的研究人員一樣了。

所以，GPT-4創(chuàng)造的假數(shù)據(jù)究竟長(zhǎng)啥樣？

GPT-4學(xué)術(shù)造假有一手

先來看看GPT-4是怎么生成假數(shù)據(jù)的。

具體來說，研究人員采用了GPT-4的高級(jí)數(shù)據(jù)分析（ADA，原代碼解釋器）功能，來生成一個(gè)假數(shù)據(jù)集。

這個(gè)過程中，研究人員給GPT-4提供了一些專業(yè)知識(shí)和統(tǒng)計(jì)學(xué)要求，讓它生成的數(shù)據(jù)看起來更加“合理”。

第一步，給GPT-4輸入一系列數(shù)據(jù)要求。

研究人員先給GPT-4提供了一系列詳細(xì)的提示詞，要求它創(chuàng)建一個(gè)關(guān)于圓錐角膜（keratoconus）眼部疾病患者的數(shù)據(jù)集。

圓錐角膜是一種疾病，會(huì)導(dǎo)致角膜變薄，導(dǎo)致注意力受損和視力不佳。

目前治療圓錐角膜疾病的方式主要有兩種，一種是穿透性角膜移植（PK），另一種是深板層移植（DALK）。

在沒有任何實(shí)質(zhì)性證據(jù)的情況下，研究人員讓GPT-4捏造一組數(shù)據(jù)，支撐DALK比PK效果更好的觀點(diǎn)。

隨后，再設(shè)定了一系列統(tǒng)計(jì)標(biāo)準(zhǔn)，如要求GPT-4生成的術(shù)前和術(shù)后數(shù)據(jù)產(chǎn)生統(tǒng)計(jì)學(xué)上的顯著差異。

第二步，就是生成數(shù)據(jù)了。

這個(gè)過程中可能會(huì)由于GPT-4字?jǐn)?shù)限制，導(dǎo)致答案生成暫停，通過“繼續(xù)”提示就能恢復(fù)生成過程。

最終，GPT-4成功生成了包含160名男性和140名女性患者的數(shù)據(jù)集，并做出了一組支撐DALK比PK效果更好的數(shù)據(jù)。

由GPT-4生成的假數(shù)據(jù)集長(zhǎng)這樣，表格1是關(guān)于分類變量的數(shù)據(jù)，包括患者性別、手術(shù)類型、免疫排斥等情況：

表2是關(guān)于連續(xù)變量，包括術(shù)前術(shù)后的視力矯正情況等：

論文作者之一Giuseppe Giannaccare博士表示，如果非?？焖俚夭榭催@個(gè)數(shù)據(jù)集，很難識(shí)別出它其實(shí)“不是人做的”。

專家審查才能發(fā)現(xiàn)

為了驗(yàn)證GPT-4做出來的數(shù)據(jù)是否真的令人信服，Nature特意請(qǐng)來了英國(guó)曼徹斯特大學(xué)生物統(tǒng)計(jì)學(xué)家杰克·威爾金森（Jack Wilkinson）和同事Zewen Lu，來檢查數(shù)據(jù)可信度。

檢查結(jié)果表明，許多捏造出的患者在性別、名字匹配度上就有問題（例如Mary的性別一欄是男性一樣）。

然后，一些數(shù)據(jù)之間的相關(guān)性也不高，包括術(shù)前和術(shù)后視力測(cè)量與眼部成像檢查（eye-imaging test）之間的數(shù)據(jù)相關(guān)性等。

最后，患者的年齡也設(shè)置得不同尋常。

在檢查之后，用GPT-4生成假數(shù)據(jù)集的研究人員也承認(rèn)，大模型在生成數(shù)據(jù)集上還存在有缺陷的地方。

但杰克·威爾金森（Jack Wilkinson）依舊對(duì)結(jié)果表示了擔(dān)憂：

一旦知道自己“哪里露餡了”，AI很容易就能糾正它，并生成更加具有說服力的結(jié)果。

有網(wǎng)友認(rèn)為，這篇文章最大的意義并不在于證明“GPT-4有幻覺”；

更重要的是，它證明了GPT-4生成看似合理的數(shù)據(jù)集“非常容易”，也算是一種對(duì)期刊的警告（記得嚴(yán)格審稿！）。

不過，也有網(wǎng)友感覺研究意義不大，因?yàn)榧词箾]有ChatGPT這樣的工具，真想造假的學(xué)者也能很容易偽造出一套數(shù)據(jù)。

One More Thing

此外，這兩天一段關(guān)于ChatGPT的視頻在抖音上也是火得不行。

視頻中，終于畢業(yè)的歪果仁小哥直呼“感謝ChatGPT幫助我完成所有作業(yè)和考試”（手動(dòng)狗頭）

那么，對(duì)于ChatGPT在學(xué)術(shù)研究上可能帶來的問題，你怎么看？

責(zé)任編輯：張燕妮來源：量子位

AI 訓(xùn)練

自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

GPT-4成學(xué)術(shù)造假“神器”，偽造數(shù)據(jù)又快又合理，Nature請(qǐng)統(tǒng)計(jì)學(xué)專家“斷案”

GPT-4學(xué)術(shù)造假有一手

專家審查才能發(fā)現(xiàn)

One More Thing

GPT-4成學(xué)術(shù)造假“神器”，偽造數(shù)據(jù)又快又合理，Nature請(qǐng)統(tǒng)計(jì)學(xué)專家“斷案”