大學生完??!AI作答心理學本科題目得分領(lǐng)先!
近日,雷丁大學的研究團隊通過一項創(chuàng)新研究發(fā)現(xiàn),人工智能工具ChatGPT在大學考試中不僅表現(xiàn)出色,而且其得分竟然超過了真實學生。這一研究利用ChatGPT為心理學本科課程的考試生成答案,結(jié)果不僅顯示AI的平均分數(shù)超過了學生,而且還引發(fā)了對現(xiàn)代教育評估方式的深刻思考。
AI優(yōu)異表現(xiàn)背后的深意
研究團隊設(shè)計了33個虛擬學生身份,讓他們通過ChatGPT來完成考試。驚人的是,AI的表現(xiàn)比真實學生高出半個等級。其中94%的AI答卷沒有引起評分員的懷疑,顯示出AI在模擬人類答題風格上的高度逼真。這一成績不僅體現(xiàn)了AI在學術(shù)場景的應(yīng)用潛力,更引發(fā)了對于AI在教育領(lǐng)域可能引起的不公平競爭的擔憂。
雷丁大學的副教授Peter Scarfe
此項研究由雷丁大學的副教授Peter Scarfe和Etienne Roesch教授領(lǐng)導(dǎo)。他們指出,這一結(jié)果對全球教育工作者具有重大的啟示,尤其是在公平性和誠信方面。當AI能夠無懈可擊地完成學術(shù)任務(wù)時,教育者和政策制定者需要重新考慮如何確保考試的公正性和有效性。
對策與未來方向
盡管回歸傳統(tǒng)的手寫考試看似是對抗AI作弊的直接辦法,但這并非長遠之計。斯卡夫博士強調(diào),教育界急需找到創(chuàng)新的方法來應(yīng)對AI技術(shù)的挑戰(zhàn)。當前的教育評估體系需適應(yīng)這種技術(shù)革新,通過更聚焦于創(chuàng)新思維和解決問題的能力的考核方式,來減少對標準化測試答案的依賴。
AI處理高層次抽象思維的局限性在該研究中,AI在高年級課程的表現(xiàn)相對落后揭示了AI處理高層次抽象思維的局限性。這一發(fā)現(xiàn)提供了一個思路,即高年級課程的考核可能需要側(cè)重于更復(fù)雜的思維能力和深層次的理解,這是目前AI技術(shù)尚難以觸及的領(lǐng)域。
維護教育的公正性與誠信
此外,恢復(fù)現(xiàn)場考試等措施可能只是權(quán)宜之計。真正的挑戰(zhàn)在于如何建立一套能夠全面評估學生能力的體系,而不僅僅是他們復(fù)現(xiàn)知識的能力。格拉斯哥大學的做法提醒我們,現(xiàn)場考試可能需要結(jié)合其他形式的評估,如項目作業(yè)、口頭報告等,來全面評價學生的實際能力。
AI在教育領(lǐng)域的廣泛應(yīng)用,盡管帶來了便利和高效,也引發(fā)了對學術(shù)誠信的深刻擔憂。未來,教育系統(tǒng)必須在保持評估公正性的同時,創(chuàng)新考核方式,以適應(yīng)技術(shù)發(fā)展的步伐。這不僅是對抗技術(shù)挑戰(zhàn)的戰(zhàn)略,更是對教育本質(zhì)和目的的深刻反思。
本文轉(zhuǎn)載自 ??Infonity AI智推星??,作者: AI智推星
