自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

OpenAI“復(fù)制粘貼”背后:剽竊者想要免費獲得一切

人工智能
如果OpenAI和生成式AI開發(fā)商是明智的,他們需要與內(nèi)容創(chuàng)作者分享財富。從長遠(yuǎn)來看,這確實是所有人前進(jìn)的唯一道路——無論是科技億萬富翁還是自由撰稿人。

如今,人們發(fā)表的文章或作品被剽竊,而剽竊者免費使用或為此獲利的事例屢見不鮮。從互聯(lián)網(wǎng)到AI,莫不如此。

比如,如今火熱的OpenAI,其AI模型就很少為其使用的內(nèi)容付費,該公司在2023年創(chuàng)造了13億美元的收入。

OpenAI的狡辯

在《紐約時報》針對OpenAI進(jìn)行的版權(quán)訴訟中,OpenAI為自己辯護(hù)稱,“我們使用互聯(lián)網(wǎng)公開的內(nèi)容訓(xùn)練AI模型的行為是合理的?!?/p>

根據(jù)OpenAI的這一邏輯,任何人放到網(wǎng)上的作品都是在參與一種公平的游戲,都可以被利用并納入該公司的大型語言模型。

《紐約時報》聲稱,該報發(fā)表的數(shù)百萬篇文章現(xiàn)在被OpenAI用來訓(xùn)練與其進(jìn)行業(yè)務(wù)競爭的聊天機器人。他們從該報作者和編輯的工作成果中賺取了數(shù)十億美元,卻沒有支付稿費。

OpenAI還聲無賴地聲稱,《紐約時報》可以選擇不讓他們的報道被ChatGPT的LLM使用。但是,如果是這樣的話,那么,ChatGPT直接抄襲《紐約時報》獲得普利策獎的一篇調(diào)查報告該如何解釋呢?該報告是《紐約時報》的記者歷時18個月對紐約市出租車行業(yè)的掠奪性貸款行為進(jìn)行調(diào)查而發(fā)表的一篇詳盡報道。

事實面前,OpenAI解釋,ChatGPT可能采用的是其所謂“記憶”的方法。該公司辯稱,“這是我們在不斷學(xué)習(xí)和進(jìn)步過程中罕見的一次失敗,但當(dāng)特定內(nèi)容在訓(xùn)練數(shù)據(jù)中不止一次出現(xiàn)時,就像它的片段出現(xiàn)在許多不同的公共網(wǎng)站上一樣,這種情況更為常見。”

與此同時,OpenAI聲稱,“《紐約時報》的報道沒有對我們現(xiàn)有模型的訓(xùn)練做出有意義的貢獻(xiàn),也不會對未來的訓(xùn)練產(chǎn)生足夠的影響?!盙PT-3中權(quán)重最高的數(shù)據(jù)集是Common Crawl,排名前三的數(shù)據(jù)來源是維基百科、美國專利數(shù)據(jù)庫和《紐約時報》。

剽竊者想要免費獲得一切

正如Futurism網(wǎng)站的特約撰稿人Victor Tangermann最近在發(fā)表的一篇文章所寫的那樣,“OpenAI的整個商業(yè)模式依賴于盡可能多地收集數(shù)據(jù),通常包括受版權(quán)保護(hù)的材料?!?/p>

OpenAI在向英國議會提出的觀點也是這樣表達(dá)的。該公司表示:“因為當(dāng)今的版權(quán)幾乎涵蓋了所有類型的人類表達(dá),其中包括博客文章、照片、論壇帖子、軟件代碼片段和政府文件——如果不使用受版權(quán)保護(hù)的材料,那么就不可能訓(xùn)練領(lǐng)先的AI模型?!?/p>

已故科幻作家Harlan Ellison在《付錢給作家》文章中曾說:“剽竊者想要免費獲得一切。他們付費給作家了嗎?沒有,他們總是想讓作家白干!”

OpenAI和其他生成式AI開發(fā)商就是如此。他們竊取出版公司、出版物、作家和編輯的工作成果,他們在沒有給任何人支付費用的情況下獲利。

歷史總是在重演

歷史總是在重演。報紙和雜志等出版物在20世紀(jì)90年代開始衰落,他們的內(nèi)容被發(fā)到互聯(lián)網(wǎng),而出版商無法獲利潤。這就是谷歌能夠通過廣告將新聞媒體的內(nèi)容轉(zhuǎn)化為利潤的原因,而新聞出版物的收入則大量流失。

希望出版商不會再犯這樣的錯誤,他們應(yīng)該獲得相應(yīng)的報酬。當(dāng)然,這種情況可能會重演。如果那真的發(fā)生,那么就能看到未來是什么樣子。博主兼科幻作家Cory Doctorow為這種情況創(chuàng)造了“Enshittification”這樣的詞語來描述,指的是網(wǎng)站內(nèi)容和信息質(zhì)量的下降。

最近的研究表明,谷歌的搜索結(jié)果正變得越來越無效,而且充斥著更多的垃圾網(wǎng)站。越來越多的內(nèi)容是基于搜索引擎優(yōu)化和AI生成的廢話。與此同時,內(nèi)容質(zhì)量相對于數(shù)量的下降,將導(dǎo)致出版商和作家收入減少。這反過來意味著,可供生成式工智能引擎訓(xùn)練的具有價值的故事將會越來越少。

如果OpenAI和生成式AI開發(fā)商是明智的,他們需要與內(nèi)容創(chuàng)作者分享財富。從長遠(yuǎn)來看,這確實是所有人前進(jìn)的唯一道路——無論是科技億萬富翁還是自由撰稿人。

責(zé)任編輯:龐桂玉 來源: 極客網(wǎng)
相關(guān)推薦

2014-11-11 15:31:51

2015-10-26 09:24:40

微軟androidios

2012-07-03 15:04:22

程序員

2018-07-03 13:17:00

2024-10-05 00:00:00

2017-12-30 00:23:10

容器開源

2011-08-31 13:43:10

windows8

2016-08-31 17:24:05

大數(shù)據(jù)分析

2012-12-31 11:22:58

開源開放

2020-09-11 10:55:10

useState組件前端

2023-09-26 07:39:21

2019-07-12 14:00:55

xclipLinux命令行

2020-10-29 15:17:49

代碼開發(fā)工具

2018-12-19 12:23:24

復(fù)制粘貼WordIBM

2021-02-28 09:47:54

軟件架構(gòu)軟件開發(fā)軟件設(shè)計

2012-11-05 15:22:59

康普光纜DCD

2025-02-20 11:20:41

2020-12-15 06:02:19

瀏覽器Edge智能粘貼

2018-11-23 11:17:24

負(fù)載均衡分布式系統(tǒng)架構(gòu)

2021-02-19 23:08:27

軟件測試軟件開發(fā)
點贊
收藏

51CTO技術(shù)棧公眾號