楊冪論文查重率僅0.9%,“疑似AI生成”?于是我們動(dòng)手檢測了一下…… 原創(chuàng)
整理丨諾亞
出品 | 51CTO技術(shù)棧(微信號:blog51cto)
昨天,“楊冪論文查重率”的詞條快速爬上微博熱搜。如今該詞條的閱讀量已經(jīng)達(dá)到1.3億。
截圖來自:微博
這次事件起始于楊冪刊登在《中國廣播電視學(xué)刊》的一篇文章。當(dāng)明星開始與學(xué)術(shù)、論文等關(guān)鍵詞掛鉤,隨之而來的質(zhì)疑都是可以想象的。
隨著輿論擴(kuò)大,質(zhì)疑持續(xù)發(fā)酵。甚至有網(wǎng)友直接將上述文章進(jìn)行了論文查重,發(fā)現(xiàn)查重率“只有0.9%”。引用某位吃瓜群眾的話,“查重率太高是抄襲,查重率太低就是垃圾”,更有人用AI內(nèi)容檢測工具進(jìn)行了測試,提出這篇文章“疑似使用AI”,總之“達(dá)不到發(fā)刊標(biāo)準(zhǔn)”。
截圖來自:微博
一、事件梳理
知名影視演員在學(xué)術(shù)期刊發(fā)文本身就是一件容易引起話題度的事。那么整起事件真相到底如何呢?我們稍微捋一捋。
《中國廣播電視學(xué)刊》(CSSCI擴(kuò)展版、北大中文核心)是由國家廣電總局主管、中國廣播電視社會(huì)組織聯(lián)合會(huì)主辦的學(xué)術(shù)期刊。它于2024年第六期發(fā)表了一篇名為《淺談?dòng)耙晞≈醒輪T創(chuàng)作習(xí)慣——以電視劇<哈爾濱一九四四>為例》的文章,署名為“楊冪”。
消息傳開后,一石驚起千層浪。“楊冪發(fā)表c刊”的詞條引來了大批吃瓜群眾。網(wǎng)友們驚詫之余,紛紛表示不理解。
截圖來自:互聯(lián)網(wǎng)
但仔細(xì)探究一下,就有人開始質(zhì)疑其含金量。首先,文章含摘要在內(nèi)共有3800多字,真要作為論文顯然字?jǐn)?shù)過少。再者,查重率過低,顯然引用文獻(xiàn)不足,難以令人信服。
不過,對于這種說法,有網(wǎng)友認(rèn)為,楊冪文章發(fā)表的欄目“交流之窗”是一個(gè)具有一定靈活性的欄目,其重在交流經(jīng)驗(yàn),對學(xué)術(shù)深度、專業(yè)性方面沒有過于嚴(yán)謹(jǐn)?shù)囊蟆?/p>
還有一撥人則對文章的“真實(shí)性”,即是否為楊冪本人所寫,表示問號,“疑似使用AI”的說法就是從此而來。那么這又要如何驗(yàn)證呢?有人嘗試了AI內(nèi)容檢測工具。
截圖來自:互聯(lián)網(wǎng)
出于好奇,小編也進(jìn)行了驗(yàn)證。首先在Copyleaks官網(wǎng)上,將部分文章內(nèi)容粘貼到“AI Detector”框內(nèi),顯示結(jié)果為AI生成內(nèi)容占比1.1%。
圖片
隨后,小編換了一個(gè)類似的工具網(wǎng)站——Content at Scale,部分節(jié)選內(nèi)容顯示為“人為寫作”。
圖片
可以預(yù)料的是,爭議還會(huì)繼續(xù),官方可能會(huì)給出一個(gè)解釋,但大眾心中則各有一桿秤。
回到文章本身,雖然題目中標(biāo)有“淺談”二字,措辭也有轉(zhuǎn)圜余地,比如“僅憑導(dǎo)演和編劇的意圖,對角色的剖析難免片面?!钡耐ㄗx下來第一感覺是戛然而止,如果能展開論述,再關(guān)注一下輸出質(zhì)量,相信也不會(huì)出現(xiàn)如此多質(zhì)疑聲浪。
二、AI內(nèi)容檢測工具速覽
隨著人工智能的普及,生成式AI的崛起,人們逐漸開始接受和習(xí)慣各種AI工具,大量AI生成內(nèi)容充斥互聯(lián)網(wǎng),也難怪這起事件中不少人提出“AI生成”的可能性。于是相應(yīng)的,檢測是否為AI生成的檢測器應(yīng)運(yùn)而生。
實(shí)際上,市場上有很多這樣的工具,可以評估到底是人類還是人工智能生成的特定內(nèi)容。以下就列出較為流行的幾個(gè),供諸君參考:
1.ZeroGPT
ZeroGPT經(jīng)常作為教師的AI論文檢測工具。使用也非常簡單。只需上傳文本文件或在提供的輸入框中手動(dòng)輸入文本,即可啟動(dòng)檢測過程。檢測的最大字符限制為15000個(gè)(高級版為100000個(gè))。ZeroGPT將分析內(nèi)容并突出顯示AI生成的每個(gè)句子,并顯示AI使用的百分比。該工具還支持批量上傳文件,讓您同時(shí)檢查多個(gè)文件。
圖片
2.Copyleaks
Copyleaks在其網(wǎng)站上提供了一個(gè)簡單易用的AI內(nèi)容檢測器,可以檢測出一系列人工智能驅(qū)動(dòng)的內(nèi)容。你也可以下載一個(gè)Chrome擴(kuò)展,它可以在你瀏覽的網(wǎng)頁上檢測出來.
圖片
3.ContentDetector.AI
內(nèi)容檢測AI可以檢測任何ChatGPT生成的內(nèi)容和AI生成的內(nèi)容,并根據(jù)文本由AI工具生成的可能性提供一個(gè)估計(jì)的百分比得分。它還可以作為一個(gè)單詞計(jì)數(shù)器。
圖片
4.Content at Scale
Content at Scale有趣的地方在于:其AI檢測器與它的AI寫作平臺(tái)相輔相成。該公司標(biāo)榜其人工智能寫作工具可以“創(chuàng)造不可檢測的人工智能生成的內(nèi)容”。在這樣的標(biāo)語下,你自然會(huì)期望他們“攻防兼?zhèn)洹?,AI檢測器也是一流的。
圖片
總體來說,這些工具都提供了易于使用的界面和一定的準(zhǔn)確度,來確保信息的真實(shí)性和信任度。至于效果到底如何,大家也可以親自上手體驗(yàn)一下,在評論區(qū)留言反饋。
參考鏈接:
??https://weibo.com/u/5665478463??
??https://www.wbolt.com/ai-content-detection.html#different-ways-to-detect-aigenerated-content??
??https://www.toolify.ai/zh/top-ai-tools/top-15-ai-text-detectors-spot-generated-content??
????本文轉(zhuǎn)載自??51CTO技術(shù)棧??,作者:諾亞
