剽竊、作弊,ChatGPT竟偷偷生成了12篇署名論文!Marcus炮轟Ta變成CheatGPT
馬庫斯又來懟ChatGPT了!
今天,馬庫斯在個人博客里寫道:事情越來越離譜了。
吹之前看看答案對不對
事情的起因,源于Fred Ehrsam的一條推文。
Ehrsam同時詢問ChatGPT和谷歌「1公里用時4分21相當于1英里用時多長時間?」他表示,ChatGPT給出了精確簡潔的答案,而谷歌卻都做不到。
針對這條帖子,馬庫斯說:「它不可一世,傲慢自得,仿佛它就是未來世界的標志。但順便說一句,它的回答是錯誤的?!?/span>
ChatGPT并沒有將單位正確轉換,作者只是一廂情愿地認為,這個偉大的新工具給出的答案一定準確(甚至精確到秒?。?,他根本沒有進行檢查。
這就是問題所在。統(tǒng)計學的單詞預測不能替代真正的數(shù)學,但很多人卻不這么認為。(每公里4分21秒的速度就是每英里7分鐘的速度。如果你能好好提問,它會給你正確的答案。)
ChatGPT這種「對了,又沒完全對」的答案中,最糟糕的部分不是它錯了,而是它看上去信誓旦旦。如此令人信服,推特網(wǎng)友甚至沒有想到要懷疑它。
這就是現(xiàn)狀:濫用ChatGPT,人們信任它,甚至吹噓它,哪怕它與正確答案背道而馳。
想知道什么比炒作更糟糕嗎?人們開始將ChatGPT視為一個可靠的、有充分資質的科學合作者。
幫幫忙,別把ChatGPT寫成共同作者
馬庫斯說,關于ChatGPT,昨天的頭條是炒作其暴虐谷歌的能力。而今天,輿論討論的是ChatGPT成為論文合著者。
在去年12月發(fā)表的一篇預印本論文中,作者一欄中赫然驚現(xiàn)了ChatGPT!
無獨有偶,ChatGPT的名字自去年12月起,頻繁地出現(xiàn)在醫(yī)學領域一些經(jīng)過同行評審的論文當中:
論文地址:https://www.oncoscience.us/article/571/text/
根據(jù)Semantic Scholar的數(shù)據(jù),6周大的ChatGPT已經(jīng)有兩份出版物,12個合著者身份和一份引文。
我真誠地希望這種趨勢不會持續(xù)下去。
馬庫斯給出了五個原因:
- ChatGPT只是一個工具,不是人類。說它是科學家,不如說它充其量更像是一個拼寫檢查器,一個語法檢查器,或者一個統(tǒng)計包。?
它無法提供真實的想法,不會設計精心控制的實驗,也不能從已有文獻中得到啟發(fā)。你不會讓拼寫檢查器或電子表格成為合著者。
例如,你會在參考文獻中引用一些資源,例如像SPM這樣的用于大腦分析的軟件包。即使這對研究工作很重要,但沒人會把SPM列成合著者。
- 共同作者在不同領域的定義不同,但通常情況下,共同作者需要做出實質性的科學貢獻。?
ChatGPT根本無法很好地推理來做到這一點;鑒于ChatGPT目前對科學理解的理解水平,賦予其作者身份是對科學過程本身的不尊重。
馬庫斯在之前的文章中寫道,ChatGPT對物理、生物、心理、醫(yī)學等學科完全不了解,并向大家解釋了「又聰明又蠢」是什么樣子。
在這個回答中,ChatGPT一本正經(jīng)地說,科學家發(fā)現(xiàn)西班牙油條是居家最好用的手術工具。
- ChatGPT已經(jīng)證明自己既不可靠又不真實。它會產(chǎn)生離譜的計算錯誤,編造虛假的傳記細節(jié),亂用詞匯,定義根本不存在的科學現(xiàn)象。?
如果你不知道這一點,你就不了解人工智能研究;如果你知道這一點卻不在乎,這更糟糕。如果你讓它成為合著者,這表明你只是想跟風,而不是真正進行研究。
- 人們對ChatGPT濾鏡太強。?
你不會相信一臺只有75%正確率的計算器,那么,如果你公然宣稱,你對用「劣跡斑斑」的人工智能工具「寫」論文感到興奮,我為什么要信任你?
- 科學寫作的目的,是為了清晰地向他人傳授真理。?
如果你把ChatGPT視為有知覺的人——雖然顯然不是,你就是在誤導公眾產(chǎn)生同樣的感覺;你不是在傳播科學觀念,只是在炒作廢話。請停止這種行為。
最后馬庫斯總結道:真朋友不會允許ChatGPT成為你論文的共同作者。
如果說馬庫斯之前與LeCun等人激情辯論關于人工智能前景、AGI的可實現(xiàn)性、以及指責LeCun關于「人工智能路線圖」是奪他人之功,多多少少帶了個人恩怨的話,那么此次,對ChatGPT表達的擔憂和警惕就很切中要害了。
實際上,馬庫斯上面說的關于ChatGPT與論文造假、和版權爭議的問題,在ChatGPT僅推出幾周后,就成為了現(xiàn)實。
近日,弗曼大學的一位哲學教授達倫·??司桶l(fā)現(xiàn),一名學生交的一篇論文是人工智能生成的。
??苏f,當他看到論文中的明顯經(jīng)過精心編排、但卻是的錯誤的信息時,他就開始懷疑了。
他把論文提交Open AI的ChatGPT檢測器,結果顯示,這篇論文有99%的可能性是由人工智能生成的。
無獨有偶,北密歇根大學教授安東尼·奧曼(Antony Aumann)也表示,他也發(fā)現(xiàn)兩個學生提交了由ChatGPT編寫的文章。
在發(fā)現(xiàn)這兩篇文章的寫作風格有點不對勁后,奧曼將文章提交給聊天機器人,問它們是由該程序寫的可能性有多大。當聊天機器人說它有99%的把握是由ChatGPT寫的,他就把結果轉發(fā)給了學生。
??撕蛫W曼都表示,他們與學生對質后,所有學生最終都承認了違規(guī)行為。??说膶W生沒有通過這門課,而奧曼讓他的學生從頭開始重寫論文。
論文雖有錯誤,但寫的不錯
兩位教授表示,這兩篇AI生成的論文中的某些關鍵之處能看出來比較明顯的痕跡。??苏f,他發(fā)現(xiàn)的這篇論文提到了課堂上沒有提到的幾個事實,并提出了一個無實際意義的主張。
他說:「從字面上看,這是一篇寫得很好的文章,但仔細一看,關于多產(chǎn)的哲學家大衛(wèi)-休謨的一個說法毫無意義,甚至是完全是錯誤的。」
這種修飾得很完美的錯誤,就是AI代筆的最大的破綻。
對奧曼來說,聊天機器人只是寫得太完美了?!肝艺J為這個聊天工具寫得比我95%的學生都要好。」
「就是突然間,你有一個沒有表現(xiàn)出這種水平的思考或寫作能力的人,寫出了完全符合所有要求的東西,有復雜的語法和復雜的思想,與文章的提示直接相關,一下就感覺很不對勁?!顾f。
阿巴拉契亞州立大學的哲學教授克里斯托弗·巴特爾說,雖然AI生成的文章的語法幾乎完美,但實質內容往往缺乏細節(jié)。
「沒有背景,沒有深度、沒有洞察力?!?/span>
難以證實的剽竊:不招供就沒轍
不過話說回來,這是幾位教授的學生都承認了AI代筆,實際上,如果學生拒不承認使用人工智能寫論文,學術界很可能會陷入困境。
巴特爾說,目前一些學術機構的規(guī)則還沒有發(fā)展到打擊這種作弊的程度。如果學生挖空心思,否認使用人工智能,那么實際上很難確切證明這種作弊行為。
他還說,OpenAI自家提供的AI檢測工具很好,但不完美。
這個工具是對文本是由人工智能生成的可能性進行了統(tǒng)計分析,給出一個概率。
而現(xiàn)行政策一般是,必須有明確和可證實的證據(jù)來證明論文是假的,才算石錘,這就使我們處于一個很困難的位置。如果返回結果是95%的可能性是人工智能生成的文章,還有5%的可能性不是。
在??说陌咐?,盡管檢測網(wǎng)站說「99%確定」這篇論文是由人工智能生成的,但實際上,關鍵還是在于學生自己承認了,否則僅憑這個概率結果,對確認作弊本身是遠遠不夠的。
??吮硎荆┰~很重要,除此之外,其他一切都是間接證據(jù),對于人工智能生成的內容,一般沒有物質證據(jù),而物質證據(jù)比間接證據(jù)有更大的分量。"
奧曼則說,盡管他認為聊天機器人的分析足以成為采取行動的證據(jù),但利用人工智能抄襲作弊,對高校來說仍然是一個新的挑戰(zhàn)。
畢竟,現(xiàn)在憑ChatGPT以假亂真的高超本事,只要用戶想,它變成CheatGPT實在是分分鐘的事。