自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

OpenAI開撕紐約時報:故意引導(dǎo)ChatGPT得出抄襲結(jié)論

人工智能
模型是從人類知識的巨大集合中學(xué)習(xí)的,因此任何一類數(shù)據(jù)(包括新聞)都只是整體訓(xùn)練數(shù)據(jù)的一小部分,任何單一數(shù)據(jù)源(包括紐約時報在內(nèi)),對于模型的知識學(xué)習(xí)都并不重要。 4、完整故事被隱藏,收到起訴后驚訝又失望

OpenAI的反擊來了。

針對被紐約時報提起史上最受關(guān)注的侵權(quán)訴訟一案,OpenAI公開發(fā)表長文表明立場。

文章直接表示:整個訴訟毫無根據(jù),并指出紐約時報:

  • 存在故意引導(dǎo)ChatGPT之嫌疑
  • 隱瞞信息,沒有講出完整的事情經(jīng)過

圖片圖片

以及OpenAI的總體觀點是:

(1)使用版權(quán)數(shù)據(jù)訓(xùn)練合理。沒有它們,哪來的當今世界上最先進的模型?(2)如果你不想被訓(xùn)練?可以退出。單一數(shù)據(jù)源(包括紐約時報在內(nèi))的缺失也不會對模型的表現(xiàn)造成重要影響。

消息一出,吃瓜群眾再次火速聚集,吵成一團。

支持OpenAI的直接“蝦仁豬心”:

紐約時報退出訓(xùn)練數(shù)據(jù)集,反而會讓模型輸出質(zhì)量更好(Doge)

圖片圖片

有人則問了當事模型GPT-4的看法,結(jié)果AI也把紐約時報無情嘲諷了一番:

圖片圖片

吳恩達也洋洋灑灑寫了一大堆,總結(jié)來說就是:

同情OpenAI多于紐約時報,后者所說的全文抄襲更可能是RAG機制所致,并且實測OpenAI已經(jīng)堵住漏洞,質(zhì)疑紐約時報究竟受到了多少實際損失。

圖片圖片

不過,反方網(wǎng)友也毫不留情,直接指著鼻子罵:

OpenAI,你太雙標了,什么訓(xùn)練合理,都是為了你的利益最大化罷了。

圖片圖片

你才是那個沒有講出完整故事的人。

圖片圖片

OpenAI具體回應(yīng)

先來看看OpenAI回應(yīng)的具體立場,一共包含四個點:

1、非常樂意與新聞機構(gòu)合作

OpenAI表示,自己在技術(shù)設(shè)計過程中努力行動支持新聞機構(gòu),會見了數(shù)十家相關(guān)媒體,聆聽他們提出的擔憂,并提供解決方案。

其本意也是支持健康的新聞生態(tài)系統(tǒng),并實現(xiàn)互利互惠,具體包括:

(1)通過部署他們的產(chǎn)品,來協(xié)助新聞從業(yè)者完成一些耗時的任務(wù),比如分析大量公共記錄和翻譯故事,最終讓編輯和記者從中受益。

(2)通過對歷史、非公開內(nèi)容進行訓(xùn)練,向他們的AI模型傳授世界知識。

(3)在ChatGPT回答中顯示帶有歸屬信息的實時內(nèi)容,為新聞發(fā)布者與讀者建立聯(lián)系。

2、訓(xùn)練屬于合理使用,提供退出機制

OpenAI此前就在提交給英國上議院的一份意見書中警告稱:

如果沒有受版權(quán)內(nèi)容的訓(xùn)練,我們的模型就將無法運行。

在此,OpenAI再次表示,使用公開的互聯(lián)網(wǎng)材料訓(xùn)練AI模型是合理的,既對創(chuàng)作者公平、對創(chuàng)新者必要,也對國家的競爭力至關(guān)重要。

并指出這一觀點已經(jīng)在美國得到很多團體、學(xué)者的支持,在其他國家和地區(qū)例如歐盟、日本、新加坡等甚至有法律支持對受版權(quán)保護的內(nèi)容進行訓(xùn)練。

不過,話鋒一轉(zhuǎn),本著“合法權(quán)利對我們來說不如成為好公民重要”,OpenAI表示自己提供了一個簡單的退出流程,可以防止他們的AI模型再次訪問這些網(wǎng)站數(shù)據(jù)。

據(jù)介紹,紐約時報已經(jīng)于2023年8月采用這一機制,退出OpenAI的訓(xùn)練。

3、“反流”是罕見錯誤,希望用戶也不要故意引導(dǎo)

所謂“反流”(Regurgitation),其實就是指模型輸出和訓(xùn)練數(shù)據(jù)一模一樣的內(nèi)容。

紐約時報在訴訟中就列出ChatGPT和該家新聞驚人雷同的情況:

圖片圖片

對于這一文縐縐的表達,有網(wǎng)友是不滿的:不就是抄襲(plagarism)嗎?

圖片圖片

但不管怎么說,OpenAI的解釋是:

當特定內(nèi)容在訓(xùn)練數(shù)據(jù)中多次出現(xiàn)時就會出現(xiàn)這種罕見的錯誤,不過我們已經(jīng)采取了措施來防止情況出現(xiàn)。

以及,OpenAI也特別勸誡用戶:

采取負責任的行為,不要故意操縱模型進行反流,這既是對我們技術(shù)的不當使用,也違反了我們的使用條款。

然而,馬庫斯和一位數(shù)字插畫家?guī)滋烨霸?lián)合撰文,列出包括 DALL-E 3在內(nèi)的AI模型如何在沒有明確提示的情況下的不少“反芻數(shù)據(jù)”,也就是給出一些明顯和已有作品場景基本相似的圖片等內(nèi)容。

而這,就使得OpenAI的說法有些矛盾。

最后,在本段末尾,OpenAI還來了一句:

模型是從人類知識的巨大集合中學(xué)習(xí)的,因此任何一類數(shù)據(jù)(包括新聞)都只是整體訓(xùn)練數(shù)據(jù)的一小部分,任何單一數(shù)據(jù)源(包括紐約時報在內(nèi)),對于模型的知識學(xué)習(xí)都并不重要。

4、完整故事被隱藏,收到起訴后驚訝又失望

OpenAI透露,在去年12月19日時,其實已經(jīng)和紐約時報取得了建設(shè)性談判進展,包括在回答中實時顯示來源和跳轉(zhuǎn)等,并和紐約時報解釋:

與任何單一來源一樣,你們的內(nèi)容對我們現(xiàn)有模型的訓(xùn)練沒有任何有意義的貢獻,也不會對未來的訓(xùn)練產(chǎn)生足夠的影響。

然而OpenAI表示沒想到,12月27號就被直接起訴了,并且還是通過紐約時報的消息才知道——心情整個就是一個既驚訝又失望。

在此,OpenAI指出,對于紐約時報指出的”反流”情況(也就是回答逐字抄寫紐約時報新聞),他們很努力解決這個問題,拿出了誠意,并曾要求后者分享示例,但一再遭到拒絕。

更有趣的是,OpenAI發(fā)現(xiàn),所謂的“反流”內(nèi)容,其實是多年前多個第三方網(wǎng)站上大量傳播的文章(即并非來自紐約時報)。

以及紐約時報可能涉嫌故意操縱提示詞——放進去大段原文讓模型“上當”。

OpenAI表示,按照他們這么操作,模型其實也并沒有像紐約時報展示的那樣夸張。

這說明:他們要么故意引導(dǎo)模型,要么進行過精挑細選。

綜合以上,OpenAI認為:

紐約時報的訴訟毫無根據(jù)。

不過緩和的場面話也是有的:

我們?nèi)匀幌Mc其建立合作伙伴關(guān)系,畢竟它曾在60年前報道了第一個有效工作的神經(jīng)網(wǎng)絡(luò)。

前情回顧

去年12月27日,紐約時報突然一紙狀書、220000頁附件,遞交到地方法院狀告OpenAI侵權(quán),當然還包括微軟。

訴狀中指出,紐約時報的文章構(gòu)成了Common Crawl中用于訓(xùn)練GPT的最大單個專有數(shù)據(jù)集。

基于此,他們找到了多達100個鐵證,證明ChatGPT輸出內(nèi)容與紐約時報新聞內(nèi)容幾乎一模一樣。

并且有時由于幻覺問題,模型還會以紐約時報的名義“造謠”,生成一些假新聞,例如橙汁會導(dǎo)致淋巴癌,這也對他們的名聲造成了困擾。

對此,紐約時報的訴求是:

要求OpenAI和微軟銷毀包含侵權(quán)材料的模型和訓(xùn)練數(shù)據(jù),并對非法復(fù)制和使用《紐約時報》獨有價值的作品相關(guān)的“數(shù)十億美元的法定和實際損失”負責。

由于證據(jù)充足、律師團隊強大,網(wǎng)友直呼這是一起“見證AI侵權(quán)里程碑式的案件”、“恐怕不能再像之前擺平其他出版商那樣三瓜兩棗就打發(fā)了”。

圖片圖片

據(jù)了解,去年4月份時,紐約時報就與OpenAI談判,但沒談妥,OpenAI拒絕達成協(xié)議。

原因可能是金額巨大,特別是考慮到OpenAI利潤的增長以及類似案例的增多。

有一個大膽猜測是,OpenAI可能想用七至八位數(shù)金額(百萬美元/千萬美元)解決此事,但紐約時報所追求的是更高的賠償和持續(xù)的版稅收入。

Ps. OpenAI年收入在16億美元左右,每年用于買授權(quán)文章和材料進行訓(xùn)練的金額在100萬美元至500萬美元之間。

這次,網(wǎng)友站哪邊?

有網(wǎng)友指出,這起案子的關(guān)鍵是“訓(xùn)練是否為合理使用”,而他認為:

模型的輸出可能會侵權(quán),但輸入不會。

圖片圖片

但有人諷刺道:

當你擁有數(shù)十億美元時,一切都是合理使用。

圖片圖片

也有人提出:

我同意為合理使用,但前提是你開源。

圖片圖片

并有人附和:

確實強調(diào)非營利性組織很重要。

圖片圖片

此外,對于OpenAI提出的退出機制,有一位作家網(wǎng)友不滿的聲音也得到了很多支持:

光退出,也就是禁止你們的模型讀取我的個人網(wǎng)站還不夠,我還需要你仔細檢查并從訓(xùn)練數(shù)據(jù)中完全刪除我的內(nèi)容。

圖片圖片

結(jié)局究竟會如何?

一項調(diào)查顯示,有59%的受訪者認為,不應(yīng)允許人工智能公司使用出版商內(nèi)容來訓(xùn)練模型。

而70%的人表示,如果公司想在模型訓(xùn)練中使用受版權(quán)保護的材料,則應(yīng)向出版商進行補償。

看起來,輿論似乎是站在紐約時報這一邊的。

你覺得這個案子應(yīng)該怎么判?

參考鏈接:[1]https://openai.com/blog/openai-and-journalism 

[2]https://x.com/OpenAI/status/1744419710635229424?s=20 

[3]https://www.ft.com/content/04861d1e-2e9f-4b92-a294-8d0c223a8287

[4]https://techcrunch.com/2024/01/08/openai-claims-ny-times-copyright-lawsuit-is-without-merit/

 [5]https://www.theregister.com/2024/01/08/midjourney_openai_copyright/

 [6]https://x.com/AndrewYNg/status/1744433663969022090?s=20 [7]https://x.com/futuristflower/status/1744422698636218807?s=20

責任編輯:武曉燕 來源: 量子位
相關(guān)推薦

2024-01-17 14:00:00

數(shù)據(jù)模型

2024-02-28 12:57:59

2009-03-31 09:15:42

2024-06-12 11:19:10

2013-03-26 10:09:16

2010-11-26 09:34:04

2012-05-01 08:44:12

索尼

2013-05-03 13:28:54

2012-07-31 10:18:47

黑客攻擊紐約時報

2011-04-15 09:11:02

PlayBookRIM黑莓

2013-08-23 10:43:29

2024-01-09 15:04:10

2010-08-26 13:37:15

2012-07-04 09:15:50

2023-08-20 12:16:39

人工智能OpenAI

2023-12-28 17:51:00

AI技術(shù)

2023-12-29 13:46:00

AI版OpenAI微軟

2017-12-31 11:51:24

WP應(yīng)用Windows

2011-04-04 11:45:12

微軟諾基亞蘋果

2025-01-02 14:36:16

點贊
收藏

51CTO技術(shù)棧公眾號