自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

除了缺點創(chuàng)意,GPT-3寫出了及格大學(xué)畢業(yè)論文,只需20分鐘

新聞 機器學(xué)習(xí)
GPT-3 寫的論文及格了嗎?教育資源網(wǎng)站 EduRef 對此進行了一項測試,效果還行,及格水平。

 GPT-3 寫的論文及格了嗎?教育資源網(wǎng)站 EduRef 對此進行了一項測試,效果還行,及格水平。

[[384977]]

2020 年 5 月,OpenAI 推出了具有 1750 億參數(shù)的史上最大 AI 模型GPT-3,該模型不僅可以更好地答題、翻譯、寫文章,還帶有一些數(shù)學(xué)計算的能力。自推出以來,該模型就開始在不同的領(lǐng)域大顯身手,如基于問題的搜索引擎、與歷史人物對話、基于文本描述生成代碼以及繪圖和圖像補全等等。

但 GPT-3 的應(yīng)用之路遠未結(jié)束…

近日,教育資源網(wǎng)站 EduRef 進行了一項測試,他們找了一組教授創(chuàng)建了一個寫作提示,然后讓應(yīng)屆畢業(yè)生和本科生以及 GPT-3 同時根據(jù)該提示寫作,最后教授組對匿名提交的作文打分,并對作者進行追蹤調(diào)查。那么,究竟結(jié)果如何呢?GPT-3 的分數(shù)能夠超過人類作者嗎?未必!

GPT-3 通過了大部分課程的寫作測試

常言道:「評級為 C 就可以畢業(yè)(C’s get degrees)」。AI 遠遠達不到完美,GPT-3 的寫作水平大概相當于自由寫作者(freelance writer)。

結(jié)果顯示,在 COVID-19 疫苗效力的研究方法論文寫作上,人類作者可以得到 B 或者 D,而 GPT-3 往往只能得到 C。在美國歷史類的測試中,人類作者可以在美國例外主義論文中得到 B 或者 C+,而 GPT-3 只能得到 B-。最后,在法學(xué)課上的政策函寫作中,GPT-3 得到了 B-,而 3 個學(xué)生中只有 1 個能夠得到高分。

下圖為人類作者與 GPT-3 在不同學(xué)科寫作中的得分情況:

除了缺點創(chuàng)意,GPT-3寫出了及格大學(xué)畢業(yè)論文,只需20分鐘

由此可見,GPT-3 的寫作技能主要體現(xiàn)在技術(shù)類文檔中。在創(chuàng)意寫作課程中的地點記敘文(place narrative)寫作中,GPT-3 僅得到了 F,沒有通過測試。作為對比,自由寫作者得到了 A、B + 和 D+。盡管在創(chuàng)意寫作教授的眼中,GPT-3 失敗了,但自然語言生成(NLG)軟件依然可以用于編寫各類內(nèi)容,包括一部幾乎獲獎的小說《The Day a Computer Writes a Novel》。先前的成功也預(yù)示著以后的失敗,GPT-3 或許只需要一些調(diào)整即可以成為一名合格的創(chuàng)意作家??偟膩碚f,AI 幾乎通過了所有的課程寫作測試。

GPT-3 20 分鐘完成論文

雖然每個教授打分都不一樣,但該評分小組包括兩名博士和一名醫(yī)學(xué)碩士。他們總共有超過 55 年的高中和各種大學(xué)水平的教學(xué)經(jīng)驗。寫作者包括應(yīng)屆畢業(yè)生和本科生,其中一些人在他們的研究領(lǐng)域?qū)懥颂崾尽F骄鶃碚f,他們需要 3 天時間完成任務(wù)。

除了缺點創(chuàng)意,GPT-3寫出了及格大學(xué)畢業(yè)論文,只需20分鐘

對于絕大多數(shù)學(xué)生來說,3 天內(nèi)完成大學(xué)論文似乎是很難的事情,主要原因在于時間太短,但是GPT-3 在 20 分鐘內(nèi)就完成了這個任務(wù)。GPT-3 利用深度學(xué)習(xí)產(chǎn)生類似人類的文本,每項任務(wù)花費 3 到 20 分鐘完成,并且用最長的時間來編寫創(chuàng)造性的寫作敘述。為了避免人為干擾,GPT-3 只對輸出長度和重復(fù)文本進行了輕微的編輯,其生成的內(nèi)容、真實信息和語法都沒有受到影響。

GPT-3 生成的美國歷史類作文示例如下:

除了缺點創(chuàng)意,GPT-3寫出了及格大學(xué)畢業(yè)論文,只需20分鐘

GPT-3 可生成類似人類寫作的內(nèi)容

即使沒有人為干擾,GPT-3 的任務(wù)也或多或少地收到了與人類作者相同的反饋。49.2% 的評論涉及語法和句法,26.2% 的評論涉及重點和細節(jié),語氣與行文結(jié)構(gòu)等也被提及,但分別只有 12.3% 和 10.8%。這與人類作家收到的評論比例幾乎相同,近 50% 的評論與語法和句法有關(guān),25.4% 的評論與焦點和細節(jié)有關(guān)。超過 13% 的評論是關(guān)于人類專業(yè)知識,而 10.4% 的評論是關(guān)于整體風(fēng)格等。

人類作者與 GPT-3 的寫作結(jié)果收到的評論反饋情況:

除了缺點創(chuàng)意,GPT-3寫出了及格大學(xué)畢業(yè)論文,只需20分鐘

盡管收到了同樣風(fēng)格的評論,GPT-3 生成的內(nèi)容與人類作者并不那么相似。以排名靠前的兩個單詞組合為例,GPT-3 和人類作者只分享了排名靠前的組合:「of the」。「People who」、「it is」和「those who」常被 GPT-3 使用,而人類作者經(jīng)常使用的是「to the」、「in the」和「on the」。總體來說,這些單詞是在英語中經(jīng)常使用的,組合上的差異顯示出 AI 和人類在寫作結(jié)構(gòu)上的一些差異。

人類作者與 GPT-3 在寫作用詞上的差異分析:

除了缺點創(chuàng)意,GPT-3寫出了及格大學(xué)畢業(yè)論文,只需20分鐘

考慮到 GPT-3 超高的論文得分,搭配統(tǒng)計數(shù)據(jù)的差異表明,人類作者比 AI 產(chǎn)生的獨特內(nèi)容明顯更多。

盡管 GPT-3 具有出色的產(chǎn)出,但其生成的論文在短期內(nèi)還無法獨立獲得大學(xué)學(xué)位。當與人類作者競爭時,GPT-3 獲得了一些及格分數(shù),但在創(chuàng)意寫作方面有所欠缺。盡管它在眾多領(lǐng)域的成功為 AI 的未來帶來了希望,但對大學(xué)教授來說,AI 依然存在不足。

 

責(zé)任編輯:張燕妮 來源: 機器之心Pro
相關(guān)推薦

2022-10-17 12:29:11

NornGPT-3語言處理器

2014-11-10 12:29:52

客服網(wǎng)站

2013-09-17 09:49:29

程序集讀懂程序編程

2016-09-13 20:58:41

MySQ基礎(chǔ)入門Sql

2021-01-03 17:30:10

3D人像ARVR

2009-02-23 09:34:54

畢業(yè)生職業(yè)發(fā)展職場定位

2019-01-30 18:45:53

Python編程語言

2023-06-30 09:53:08

英偉達AI

2023-01-09 13:19:07

AIGPT-3創(chuàng)作能力

2018-11-14 12:45:12

華為

2009-07-09 17:43:30

Chrome OS截圖Chrome操作系統(tǒng)截Chrome

2018-11-23 11:44:21

華為云

2018-05-06 16:26:03

關(guān)聯(lián)規(guī)則數(shù)據(jù)分析關(guān)聯(lián)規(guī)則推薦

2020-09-14 11:30:26

HTTP3運維互聯(lián)網(wǎng)

2021-06-18 07:34:12

Kafka中間件微服務(wù)

2023-11-10 15:35:52

AI模型

2023-04-07 09:53:02

量子AI

2021-07-19 10:56:36

GPE-3OpenAI微軟

2021-02-03 11:20:41

Docker架構(gòu)容器

2009-04-02 10:26:00

點贊
收藏

51CTO技術(shù)棧公眾號