自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

ChatGPT“克星”:用AI識(shí)別AI生成的文本,英語(yǔ)論文閱讀筆記都能測(cè)出

人工智能
無(wú)論是英語(yǔ)論文、還是閱讀筆記,只要在ChatGPT的知識(shí)范圍內(nèi),都可以拜托它幫忙完成,寫出來(lái)的內(nèi)容也有理有據(jù)。

ChatGPT的出現(xiàn),讓不少人看到了交期末大作業(yè)的曙光(手動(dòng)狗頭)。

無(wú)論是英語(yǔ)論文、還是閱讀筆記,只要在ChatGPT的知識(shí)范圍內(nèi),都可以拜托它幫忙完成,寫出來(lái)的內(nèi)容也有理有據(jù)。

不過,有沒有想過你的老師也準(zhǔn)備用“AI文本檢測(cè)器”一類的東西來(lái)防止你作弊?

像這樣輸入一段看起來(lái)沒毛病的筆記,經(jīng)過它一番檢測(cè),認(rèn)為這段文字“由AI編寫”(Fake)的可能性為99.98%!

圖片

△文本由ChatGPT生成

換個(gè)數(shù)學(xué)論文試試?ChatGPT的輸出看起來(lái)沒啥問題,卻仍然被它準(zhǔn)確識(shí)破了:

圖片

△文本由ChatGPT生成

這可不是靠瞎蒙或猜測(cè),畢竟對(duì)方同樣是個(gè)AI,還是個(gè)訓(xùn)練有素的AI。

看到這有網(wǎng)友調(diào)侃:用魔法打敗魔法?

圖片

用AI寫的東西來(lái)訓(xùn)練新AI

這個(gè)AI檢測(cè)器名叫GPT-2 Output Detector,是OpenAI聯(lián)合哈佛大學(xué)等高校和機(jī)構(gòu)一起打造的。(沒錯(cuò),OpenAI自家做的)

圖片

輸入50個(gè)以上字符(tokens)就能較準(zhǔn)確地識(shí)別AI生成的文本。

但即便是專門檢測(cè)GPT-2的模型,用來(lái)檢測(cè)其他AI生成文本效果也同樣不錯(cuò)。

作者們先是發(fā)布了一個(gè)“GPT-2生成內(nèi)容”和WebText(專門從國(guó)外貼吧Reddit上扒下來(lái)的)數(shù)據(jù)集,讓AI理解“AI語(yǔ)言”和“人話”之間的差異。

隨后,用這個(gè)數(shù)據(jù)集對(duì)RoBERTa模型進(jìn)行微調(diào),就得到了這個(gè)AI檢測(cè)器。

RoBERTa(Robustly Optimized BERT approach)是BERT的改進(jìn)版。原始的BERT使用了13GB大小的數(shù)據(jù)集,但RoBERTa使用了包含6300萬(wàn)條英文新聞的160GB數(shù)據(jù)集。

其中,人話一律被識(shí)別為True,AI生成的內(nèi)容則一律被識(shí)別為Fake。

例如這是一段從Medium英文博客上復(fù)制的內(nèi)容。從識(shí)別結(jié)果來(lái)看,很顯然作者是親自寫的(手動(dòng)狗頭):

圖片

△文字來(lái)源Medium@Megan Ng

當(dāng)然,這個(gè)檢測(cè)器也并非100%準(zhǔn)確。

AI模型參數(shù)量越大,生成的內(nèi)容越不容易被識(shí)別,例如1.24億參數(shù)量的模型“被抓包”的概率就比15億參數(shù)更高。

同時(shí),模型生成結(jié)果隨機(jī)性越高,AI生成內(nèi)容被檢測(cè)出來(lái)的概率也會(huì)更低。

但即便將模型調(diào)整到生成隨機(jī)性最高(Temperature=1,越接近0生成隨機(jī)性越低),1.24億參數(shù)模型被檢測(cè)出的概率仍然是88%,15億參數(shù)模型被檢測(cè)出的概率仍然有74%。

這是OpenAI兩年前發(fā)布的模型,當(dāng)時(shí)對(duì)GPT-2生成的內(nèi)容就“一打一個(gè)準(zhǔn)”。

現(xiàn)在面對(duì)升級(jí)版的ChatGPT,檢測(cè)英文生成內(nèi)容的效果依舊能打。

但面對(duì)ChatGPT生成的中文,它的識(shí)別能力就不那么好了。例如讓ChatGPT來(lái)一段作文:

圖片

AI檢測(cè)器給出是人寫的概率為99.96%……

圖片

當(dāng)然話說(shuō)回來(lái),ChatGPT也能檢測(cè)自己生成的文本。

所以,不排除老師將你的作業(yè)直接交給ChatGPT來(lái)識(shí)別:

圖片

One More Thing

值得一提的是,ChatGPT表示自己并不能訪問互聯(lián)網(wǎng)來(lái)搜索信息。

顯然,它還意識(shí)不到GPT-2 Output Detector這個(gè)AI檢測(cè)器的存在:

圖片

所以能不能像網(wǎng)友所說(shuō),讓ChatGPT生成一段“不被AI檢測(cè)器測(cè)出來(lái)的”內(nèi)容呢?

圖片

很遺憾不能:

圖片

所以大作業(yè)還是自己寫吧……

參考鏈接:[1]??https://weibo.com/1402400261/Mj7QtwRoH[2]https://github.com/openai/gpt-2-output-dataset/tree/master/detector[3]https://chat.openai.com??/

[4]https://medium.com/user-experience-design-1/how-chatgpt-is-blowing-google-out-of-the-water-a-ux-breakdown-784340c25d57

責(zé)任編輯:武曉燕 來(lái)源: 量子位
相關(guān)推薦

2023-05-05 09:32:40

AI論文

2023-05-04 07:12:02

Linuxshell人工智能

2023-02-28 11:19:35

CHATGPT人工智能

2023-04-10 10:28:33

ChatGPTAI風(fēng)險(xiǎn)管理計(jì)劃

2025-04-21 08:13:58

ChatGPTAINLP

2019-01-28 10:25:31

AI數(shù)據(jù)科技

2023-06-02 13:19:15

模型AI

2023-10-23 12:05:17

2023-10-19 13:12:32

Open-AIAI

2021-08-19 06:28:28

人工智能AI生物識(shí)別

2023-11-08 08:38:43

2023-05-06 08:23:36

ChatGPT自然語(yǔ)言技術(shù)

2023-05-23 12:34:07

ChatGPTAI

2023-03-01 16:29:51

ChatGPT人工智能

2023-04-25 10:09:55

人工智能AI

2023-05-16 09:53:18

ChatGPT人工智能

2023-02-13 09:42:10

人工智能ChatGPT

2018-02-25 17:09:30

視頻AI圖像

2024-03-15 15:09:28

2024-09-20 17:41:07

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)