AI作弊愈演愈烈,高校仍然束手無策
2022年末,ChatGPT剛一面世,就有人斷言「大學(xué)論文已死」。
快兩年的時(shí)間過去了,LLM聊天機(jī)器人日臻進(jìn)步,人工智能作弊與反作弊之間的大戰(zhàn)也愈演愈烈。
師生之間不得不展開一場軍備競賽。
近期發(fā)布的一項(xiàng)報(bào)告指出,ChatGPT的第一大功用就是創(chuàng)意寫作。
而且,ChatGPT的使用者大多數(shù)都是學(xué)生,學(xué)生一放假,ChatGPT的月活都會(huì)產(chǎn)生波動(dòng)。
OpenAI和它的忠實(shí)用戶們可謂是雙向奔赴,為了讓學(xué)生們安心使用,連早就準(zhǔn)備好的反作弊神器——文本水印都引而不發(fā)。
只需幾秒鐘,AI工具就可以生成一篇合格的大學(xué)論文,教師們對此苦不堪言。
AI寫,AI批
亞利桑那州立大學(xué)(ASU)是教育領(lǐng)域的一個(gè)革新者。
今年初,這所大學(xué)官宣成為第一家與OpenAI合作的高等教育機(jī)構(gòu)。
Kyle Jensen是ASU的寫作項(xiàng)目主任,每年有2.3萬名學(xué)生在他的監(jiān)督下參加寫作課程。
Jensen與人共同運(yùn)營著一個(gè)由國家人文基金會(huì)資助的項(xiàng)目,項(xiàng)目旨在提高人文學(xué)科教師的生成式AI素養(yǎng)。
這位敢為人先的教授是新一代希望擁抱生成式AI的教師之一,他堅(jiān)信傳統(tǒng)寫作的價(jià)值,也相信AI以新方式促進(jìn)教育的潛力。
愿景雖然美好,可是現(xiàn)實(shí)卻非常嚴(yán)峻。
學(xué)生們挑戰(zhàn)了AI使用的極限,把教師們打得措手不及。
對于普遍存在的作弊,缺乏有效檢測的工具,而且還存在誤判的風(fēng)險(xiǎn):有很多學(xué)生只是借助AI來檢查語法錯(cuò)誤,卻被貼上了作弊的標(biāo)簽。
還有一些老師因?yàn)閷W(xué)生作弊而對自己的教學(xué)事業(yè)產(chǎn)生了懷疑,生成式人工智能「幾乎破壞了在線課程的完整性」,「ChatGPT讓一切都變得毫無意義」。
隨著ASU等學(xué)校的在線課程變得越來越普遍,作弊變得成本更低。
不管作業(yè)的大小,許多學(xué)生統(tǒng)統(tǒng)交給ChatGPT來完成,甚至包括一段500字以內(nèi)的自我介紹。
學(xué)生并不是唯一使用AI的人,教師也使用這些工具來提高他們的教學(xué)水平。
一項(xiàng)調(diào)查發(fā)現(xiàn),去年已經(jīng)有超過一半的K12教師都在使用ChatGPT進(jìn)行課程規(guī)劃。
六個(gè)月前的另一項(xiàng)研究發(fā)現(xiàn),在經(jīng)常使用生成式人工智能的高等教育教師中,超過70%的人使用它來給學(xué)生作業(yè)評分或提供反饋。
在這種現(xiàn)象背后推波助瀾的當(dāng)然是科技公司。
2月份,教育出版商Houghton Mifflin Harcourt收購了一項(xiàng)名為Writable的服務(wù),Writable可以利用人工智能為小學(xué)生的作業(yè)寫評語。
教師們之所以選擇AI工具,也是迫于負(fù)擔(dān)過重的教學(xué)壓力。
以Jensen的寫作項(xiàng)目為例,有些學(xué)校同時(shí)教授五門課程,每門課程有24名學(xué)生。
而大學(xué)作文與交流會(huì)議建議每門寫作課程的學(xué)生人數(shù)不要超過20人,最好是15人,并警告說,如果學(xué)生過多,則無法有效地與學(xué)生進(jìn)行寫作交流。
著有《不僅僅是文字:如何思考人工智能時(shí)代的寫作》一書的John Warner擔(dān)心,這些課程負(fù)擔(dān)的存在會(huì)鼓勵(lì)教師為了提高效率而使用人工智能,
「如果AI工具提供的評語與學(xué)生們之前收到的平庸評語差不多,這種做法會(huì)不會(huì)成為一種流行趨勢?」
如果事情真的演變成這樣,那將會(huì)顯得十分滑稽可笑——
學(xué)生被激勵(lì)用人工智能生成作業(yè),然后老師會(huì)用人工智能生成的評論來回應(yīng)。
反作弊軍備競賽
一場無休止的人工智能作弊和檢測軍備競賽正在上演。
OpenAI即便推出了文本水印,也可能被篡改。
而且,任何為尋找水印而構(gòu)建的探測器只能檢測出由特定AI系統(tǒng)生成的文本,對其他家模型則束手無策。
當(dāng)一家AI公司發(fā)布一個(gè)版本的文本水印之后,也許緊接著就會(huì)向大學(xué)提供一項(xiàng)昂貴的服務(wù),以便老師們可以使用這項(xiàng)服務(wù)來檢測學(xué)生是否作弊。
另一方面,它們還可能向?qū)W生兜售「無水印服務(wù)」。
學(xué)校為了證明購買作弊檢測服務(wù)的合理性,可能會(huì)制定相應(yīng)政策,推動(dòng)學(xué)生和教師在課程中使用特定的GenAI模型;
而有心作弊的學(xué)生會(huì)想出各種各樣的變通辦法,這樣,就形成了一個(gè)作弊與反作弊的不斷循環(huán)。
一成不變的作業(yè)
雖然AI讓作弊變得防不勝防,可是并不是因?yàn)锳I的出現(xiàn),才導(dǎo)致了作弊的發(fā)生。
抄作業(yè)的歷史可比ChatGPT的歷史悠久得多。
數(shù)據(jù)顯示,超過一半的高中生和大學(xué)生都曾以某種方式作過弊。國際學(xué)術(shù)誠信中心報(bào)告稱,截至2020年初,近三分之一的本科生在承認(rèn)他們在考試中作弊。
在ChatGPT出現(xiàn)以前,教授們的眼中釘是Chegg和Course Hero,這是兩款專門用來提供「家庭作業(yè)幫助」服務(wù)的產(chǎn)品,在OpenAI顛覆其業(yè)務(wù)之前非常受歡迎。
作弊工具已經(jīng)升級(jí)換代了,可是教授們布置的作業(yè)卻幾十年如一日——
「《理智與情感》或《白鯨》中的主題是什么?」
現(xiàn)在,很多大學(xué)已經(jīng)對教育方式做出了一些必要的革新。
比如,ASU的入門級(jí)英語課程,會(huì)要求學(xué)生先閱讀有關(guān)人工智能的內(nèi)容,并將其作為一種當(dāng)代現(xiàn)象進(jìn)行研究,然后使用人工智能工具來批評和改進(jìn)他們自己的作品。
這門課程的重點(diǎn)不再是作業(yè)本身,而是對人工智能輔助學(xué)習(xí)過程的反思。
猶他大學(xué)也采取了類似的方法,學(xué)生如果選修大學(xué)寫作課程,將會(huì)使用AI來學(xué)習(xí)「什么讓寫作變得更迷人?」
除了閱讀和撰寫有關(guān)人工智能這一社會(huì)問題的文章外,他們還閱讀文學(xué)作品,然后嘗試讓ChatGPT生成不同形式和流派的作品。
然后他們將人工智能生成的作品與人類創(chuàng)作的作品進(jìn)行比較,找出差異。
對此,Warner認(rèn)為,與其讓人工智能既成為教育的主題又成為教育的工具,還不如讓老師們更新一下自己教授基礎(chǔ)知識(shí)的方式。
他建議,不再給學(xué)生布置「命題作文」,而是換成「寫一段生動(dòng)的散文」,或「對所看到的事物進(jìn)行清晰的觀察」。
誠然,學(xué)生們還是可以用AI來完成這種任務(wù),但是如果這項(xiàng)任務(wù)有趣到學(xué)生們愿意自己去完成呢?他們可能就不會(huì)請AI代勞了。
「如果你作為一位文學(xué)教授,卻只會(huì)要求學(xué)生了解《理智與情感》的主題,那你就太丟臉了」。