全美高校掀起AI作弊風(fēng)暴!近50%大學(xué)生用ChatGPT拿高分,OpenAI私藏檢測工具
ChatGPT,還是CheatGPT?
ChatGPT竟成為美國學(xué)生作弊的「黑科技」,而OpenAI為了市場占有率,暗藏ChatGPT文本識別工具!
在美國,WSJ稱近40%高中生、近50%大學(xué)生借助AI作弊拿高分;在某些學(xué)校,作弊成風(fēng),肆無忌憚!
越來越多的美國學(xué)生,正在偷偷使用ChatGPT等AI軟件完成作業(yè),拿到好成績,而家長和老師卻難以察覺、知情甚少。
AI「作弊」有多普遍?
一名17歲的新澤西州高中畢業(yè)生,坦言去年利用AI在英語、數(shù)學(xué)和歷史課上的作弊經(jīng)歷。
這名學(xué)生的經(jīng)歷揭示了生成式AI技術(shù)已經(jīng)深深滲透到美國教育體系中,使得這一代學(xué)生能夠輕易地將學(xué)習(xí)任務(wù)「外包」給擁有海量知識的AI軟件。
高科技小抄|圖片來源Alexandra Citrin-Safadi/WSJ
教育工作者承認(rèn)AI在課堂上確實(shí)有其價值。
然而,在如何防止學(xué)生濫用這項(xiàng)技術(shù)逃避學(xué)習(xí)的問題上,教師和家長卻只能自行摸索對策。
提供AI工具的科技公司——不論是科技巨頭谷歌,還是AI初創(chuàng)公司OpenAI等——在這方面幾乎沒有提供任何實(shí)質(zhì)性幫助。
AI如何成為學(xué)生的秘密武器?
這位17歲的學(xué)生向記者解釋了她去年在數(shù)十項(xiàng)作業(yè)中使用AI的原因:
- 有時是因?yàn)樽鳂I(yè)太枯燥或太難
- 有時是為了追求更好的成績
- 拖延癥到最后,才發(fā)現(xiàn)作業(yè)完不成
她使用OpenAI的ChatGPT和谷歌的Gemini來獲取靈感和復(fù)習(xí)知識點(diǎn),這些用途本是很多老師所允許的。
但更多時候,她是直接讓AI完成作業(yè)——Gemini不僅幫她解決數(shù)學(xué)作業(yè),還在一次家庭作業(yè)測驗(yàn)中取得了高分。
ChatGPT為她完成了科學(xué)實(shí)驗(yàn)的數(shù)據(jù)計(jì)算,還代寫了一篇?dú)v史課論文中較為困難的部分——她后來對這部分內(nèi)容進(jìn)行了改寫以逃避查重檢測。
谷歌的AI作業(yè)幫手介紹
在這些作弊行為中,她只被發(fā)現(xiàn)過一次。
40%中學(xué)生,50%大學(xué)生AI寫作業(yè)
AI正在改變白領(lǐng)工作的方方面面,從起草電子郵件、制作演示文稿到生成圖像,無所不包。
有些職場人士已經(jīng)因此失去工作,許多公司CEO也開始調(diào)整未來的招聘計(jì)劃。
據(jù)OpenAI透露,ChatGPT的周活躍用戶已達(dá)4億。4 億相當(dāng)于地球總?cè)丝跀?shù)的 5%。
其中,學(xué)生群體是最主要的用戶。
ChatGPT的月活量增長
OpenAI的目標(biāo)是讓學(xué)生養(yǎng)成終身使用ChatGPT解答問題的「習(xí)慣」——代替谷歌近30年來作為信息查詢首選平臺的地位。
Impact Research去年的調(diào)查顯示,在未經(jīng)教師允許的情況下,在使用AI的學(xué)生中,約40%的初高中生承認(rèn)曾使用AI完成作業(yè)。
而在大學(xué)生群體中,這一比例更是接近50%。
OpenAI的內(nèi)部分析也證實(shí),大學(xué)生經(jīng)常使用ChatGPT協(xié)助撰寫論文。
在沒有成年人監(jiān)督的數(shù)字世界里,是否使用這些能暗中幫助獲取高分的AI工具,學(xué)生們不得不自行抉擇——AI公司設(shè)置的年齡限制形同虛設(shè),很容易被繞過。
這種情況令人想起上一代人初次接觸社交媒體時的情形——關(guān)于AI對學(xué)生學(xué)習(xí)的利弊影響,包括其可能助長作弊行為的研究都還很不充分。
AI對教育到底是好是壞?
密西西比大學(xué)學(xué)術(shù)創(chuàng)新助理主任Marc Watkins表示:「這是一場沒有征得任何人同意就已經(jīng)開始的巨大社會實(shí)驗(yàn)。」
那位新澤西的學(xué)生雖然順利通過了去年的所有課程,但她承認(rèn)自己實(shí)際學(xué)到的知識遠(yuǎn)少于本應(yīng)掌握的內(nèi)容。
在高中最后一年,她已經(jīng)停止了違規(guī)使用AI。她說:「我決定退一步,重新開始用自己的大腦思考?!?/span>
保羅·格雷厄姆(Paul Graham)曾在去年10月的一篇博客中預(yù)言一個場景:AI出現(xiàn)后,人們會被分為「寫作」和「不寫作」兩類人。
圖片
學(xué)術(shù)不端是否應(yīng)該由AI負(fù)責(zé),AI公司的態(tài)度相當(dāng)?shù)弧?/span>
OpenAI教育團(tuán)隊(duì)成員Siya Raj Purohit表示:「作弊又不是OpenAI發(fā)明的,想要作弊的人總能找到辦法?!?/span>
Siya Raj Purohit
而眾多教育工作者擔(dān)憂,AI聊天機(jī)器人的便捷性,會誘使更多學(xué)生逃避具有難度的學(xué)習(xí)任務(wù)。
教育界:AI無益于教育
隨著AI技術(shù)的飛速發(fā)展,只要稍加巧妙運(yùn)用,就很難在作業(yè)中發(fā)現(xiàn)AI的痕跡。
在去年10月的一次教育技術(shù)會議上,紐約州立大學(xué)系統(tǒng)校長、美國前教育部長John B. King Jr.表示:「很可能有大量學(xué)生,從小學(xué)生到大學(xué)生,昨晚用ChatGPT完成了作業(yè),而他們根本沒有學(xué)到任何東西。這種情況令人擔(dān)憂?!?/span>
圖片
在會議上,當(dāng)King表達(dá)了這一擔(dān)憂后,與他同臺的Purohit提出了一個具有爭議性的觀點(diǎn)。
她說,也許我們應(yīng)該把善用AI的能力作為衡量批判性思維和溝通能力的標(biāo)準(zhǔn)。
她引用了最近與沃頓商學(xué)院一位教授的討論,反問道:「在AI時代,寫作的價值到底是什么?」
對此,弗吉尼亞大學(xué)認(rèn)知心理學(xué)家Daniel Willingham給出了他的答案:
寫作,能培養(yǎng)其他練習(xí)方式無法替代的思維模式。
當(dāng)在解釋時,寫作迫使你解釋得更透徹;當(dāng)在論證時,寫作促使你論證得更全面。
在課程中,南卡的八年級英語教師Jody Stallings,安排學(xué)生閱讀Harper Lee的《殺死一只知更鳥》(To Kill a Mockingbird)。
每天上課伊始,他都會讓學(xué)生根據(jù)已讀內(nèi)容,回答問題。
Stallings表示,這個寫作練習(xí)不僅能讓學(xué)生深入思考書的內(nèi)容,還能通過寫作來提煉思想。
圖片
To Kill a Mockingbird首版封面
科技界:AI改革教育
然而,科技支持者們?nèi)匀粓?jiān)信:AI能從根本上改革并提升教育質(zhì)量。
去年,OpenAI首席執(zhí)行官奧特曼,描繪了將來教育的美好愿景:「未來,我們的孩子將擁有虛擬智能導(dǎo)師,能夠以任何語言、按照每個孩子的個性化節(jié)奏,提供所有學(xué)科的專門指導(dǎo)。」
OpenAI教育副總裁Leah Belsky,建議學(xué)校不要抵制,而是要在課堂上主動擁抱AI,從而應(yīng)對作弊問題。
Leah Belsky:擁抱AI,轉(zhuǎn)變思路
她表示:「在教學(xué)和作業(yè)中,如果教育工作者能合理運(yùn)用AI,AI就能從學(xué)生私下偷用的工具,轉(zhuǎn)變?yōu)閷W(xué)習(xí)過程中的重要輔助手段?!?/span>
目前,已有多個機(jī)構(gòu)和企業(yè),推出了AI智能輔導(dǎo)系統(tǒng),旨在為學(xué)生提供無需教師在場的學(xué)習(xí)輔導(dǎo)。
同時,一些教師也開始使用AI工具來協(xié)助編寫教案、設(shè)計(jì)作業(yè)和起草家長通知。
新澤西州高中英語教師Sandy Mangarella表示,AI聊天機(jī)器人幫她改進(jìn)了教學(xué)內(nèi)容,并設(shè)計(jì)了新的課堂活動。
她說:「感覺就像多了一個能隨時討論的同事?!?/span>
教育部、各州政府、非營利組織以及包括OpenAI在內(nèi)的科技公司,已經(jīng)發(fā)布了教師如何負(fù)責(zé)任地使用AI的指導(dǎo)意見,其中提到了AI生成的信息并非總是準(zhǔn)確的。
AI作弊肆無忌憚
然而,這些指導(dǎo)文件大多只是簡單提及或完全忽略了作弊問題。
阿拉巴馬州庫薩縣的高中英語教師Jacob Moon說,他以前很少在課堂上發(fā)現(xiàn)作弊現(xiàn)象。
但僅在本學(xué)年,他就已經(jīng)發(fā)現(xiàn)約二十多名學(xué)生在包括論文在內(nèi)的作業(yè)中使用AI。
Moon擔(dān)憂地表示:「作為教師,最讓我憂心的是,等這些學(xué)生進(jìn)入大學(xué)和職場后會怎么樣?」
該校二年級學(xué)生Chris Prowell透露,盡管同學(xué)們經(jīng)常使用AI完成作業(yè),但他本人從不這樣做,因?yàn)閾?dān)心這會影響自己為大學(xué)學(xué)習(xí)做準(zhǔn)備。
他說,肆無忌憚的AI作弊行為「對那些真正付出努力的人很不公平?!?/span>
對學(xué)生在家獨(dú)立完成作業(yè)時能否規(guī)范使用AI,一些教育工作者持懷疑態(tài)度。
加州索諾馬縣高中英語教師Joshua Allard-Howells表示,去年AI作弊在他的學(xué)生中如野火般蔓延。
為此,他采取了新措施:要求學(xué)生在課堂上手寫初稿,并嚴(yán)禁帶入或使用電子設(shè)備。
他說,這一改變帶來了意想不到的效果:學(xué)生開始認(rèn)真對待寫作,作品也更顯真實(shí)性和個人特色。
這種方法的弊端是:他不得不取消了所有家庭作業(yè)。
他無奈地表示:「只要布置作業(yè),學(xué)生們就會用AI作弊?!?/span>
AI代寫鋪天蓋地
目前,已有數(shù)十家公司在推廣聲稱能用AI完成論文和作業(yè)的App,而且「神不知鬼不覺」。
比如今年7月,F(xiàn)acebook的一則廣告,畫面中是一個背著書包、戴著耳機(jī)和牙套的市場營銷專業(yè)學(xué)生,配文寫道:
使用You的研究助手,我只用了幾分鐘就完成了論文,連參考文獻(xiàn)都搞定了。
這款搜索研究工具已獲得近10億美元的投資估值。
在本學(xué)年伊始,在Facebook和Instagram上,愛沙尼亞公司Aithor大力推廣寫作助手。
廣告配上兩個畢業(yè)帽表情,承諾「一鍵生成完美論文」。
對此,Aithor首席營銷官Anatoly Terentyev,在郵件回應(yīng)中表示:「實(shí)際上,我們只是提供一個基礎(chǔ)框架,學(xué)生仍需要對內(nèi)容進(jìn)行潤色和個性化處理。」
他說公司正在重新審視廣告用語。
另一家AI公司Caktus的廣告語更為直白:「老師們恨死我們了」。
該公司CEO Harrison Leonard解釋說,這句話指的是那些抗拒變革的教師。
他認(rèn)為,大學(xué)生本就具備寫作能力,Caktus AI只是幫助他們學(xué)習(xí)使用AI,為未來工作做準(zhǔn)備。他強(qiáng)調(diào)這并非作弊工具。
然而,Caktus AI在社交媒體上的表現(xiàn)卻大相徑庭,在「美國貼吧」Reddit曾發(fā)帖稱:
過去三年,我在一所名校踢足球,特別討厭做作業(yè)、參加訓(xùn)練這些煩人的事。所以我開發(fā)了個軟件,能立刻生成所有論文,瞬間解決所有作業(yè)。
作為前圣母大學(xué)足球運(yùn)動員的Leonard,對這則帖子避而不答,而他此前的說法是:「我無法控制學(xué)生們?nèi)绾问褂眠@個平臺?!?/span>
亞利桑那州立大學(xué)英語教授Patricia Webb,認(rèn)為雖然明令禁止在她的課程中使用AI。
但從寫作風(fēng)格來看,她估計(jì)在寫作作業(yè)中仍有20%到40%的學(xué)生在暗戳戳地使用AI。
但她表示,在沒有確鑿證據(jù)的情況下,她很難與這些學(xué)生當(dāng)面對質(zhì)。
正如Webb所說:「沒有證據(jù)就不能給出處罰?!?/span>
這就導(dǎo)致她不得不給那些她內(nèi)心幾乎確信是AI代寫的作業(yè)打出及格分?jǐn)?shù)。
為此,她采取了一個變通辦法:布置需要寫個人經(jīng)歷或進(jìn)行采訪的作業(yè),這類內(nèi)容更難交給AI代寫。
OpenAI雪藏檢測工具
調(diào)查發(fā)現(xiàn),雖然OpenAI已經(jīng)開發(fā)出能夠準(zhǔn)確識別ChatGPT生成文本的工具,但該公司選擇不對外發(fā)布。
因?yàn)閮?nèi)部調(diào)查顯示,如果推出這項(xiàng)檢測功能,將近30%的用戶會減少使用ChatGPT。
一些教師轉(zhuǎn)而求助于第三方AI檢測工具。
但這些軟件往往不夠可靠:有時會把AI生成的內(nèi)容誤判為學(xué)生原創(chuàng),有時又會把學(xué)生的真實(shí)作品誤判為AI生成。
目前使用最廣泛的檢測工具是Turnitin。
圖片
Turnitin稱能激發(fā)學(xué)生寫出原創(chuàng)作品
該公司首席產(chǎn)品官Annie Chechitelli聲稱,他們的工具能以85%的準(zhǔn)確率識別AI生成的文本,而且很少會將學(xué)生的原創(chuàng)作品誤判為AI生成。
不過,該公司拒絕提供產(chǎn)品進(jìn)行準(zhǔn)確性測試。
2023年,Max Spero創(chuàng)立了Pangram Labs,這家公司最初的目標(biāo)是幫助企業(yè)甄別AI生成的虛假產(chǎn)品評論。
Pangram Labs宣傳準(zhǔn)確率在99.98%以上
讓他意外的是,許多客戶竟然是教師。
在一項(xiàng)測試中,記者讓ChatGPT撰寫了一篇分析《蠅王》主題的九年級水平作文。
經(jīng)Pangram Labs的檢測軟件分析,這篇文章被判定為幾乎確定是AI生成的。
接著,研究人員將這篇文章輸入到HumanizeAI.pro——
這是一款聲稱能「將AI生成的內(nèi)容轉(zhuǎn)化為自然、真實(shí)的人類寫作風(fēng)格」的應(yīng)用程序。
有趣的是,對于經(jīng)過處理的新版本,Pangram Labs的檢測結(jié)果變得猶豫不決:
第一次檢測時,系統(tǒng)表示「可能含有AI撰寫的內(nèi)容」;
而在用完全相同的文本進(jìn)行第二次檢測時,卻得出了「完全是人類寫作」的結(jié)論。
對此,Spero表示,Pangram Labs正在努力研發(fā)新技術(shù)來「擊敗這些偽裝工具」。
在德克薩斯州休斯頓郊區(qū)任教的高中英語教師Carter Wright分享了他的困擾。
他說自己耗費(fèi)了無數(shù)時間來追查AI作弊:試用各種檢測軟件的免費(fèi)版,仔細(xì)核查學(xué)生谷歌文檔的修改記錄。
然而,學(xué)生們似乎總能想出新辦法,領(lǐng)先一步。
Wright無奈地表示:「除非徹底禁用這些技術(shù),否則要完全杜絕作弊,幾乎是不可能的事情。」
參考資料:https://www.wsj.com/tech/ai/chatgpt-ai-cheating-students-97075d3c?mod=tech_lead_pos2