自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

交錢!StackOverflow:類ChatGPT們用我數(shù)據(jù)訓(xùn)練得付費(fèi)

人工智能 新聞
隨著這一波AIGC熱潮的到來,其背后的各種“規(guī)矩”,是值得深入探討、商定了。

本文經(jīng)AI新媒體量子位(公眾號ID:QbitAI)授權(quán)轉(zhuǎn)載,轉(zhuǎn)載請聯(lián)系出處。

ChatGPT,遭到了一波反向收費(fèi)。

而管OpenAI要錢的,正是全球最大程序員問答網(wǎng)站StackOverflow。

理由是這樣的:

你們拿我家的數(shù)據(jù)去訓(xùn)練AI了。

圖片

無獨(dú)有偶,在StackOverflow之前,Reddit近日也發(fā)出了類似的信號——計劃開始向訪問其API的公司收費(fèi)。

Reddit老板給出的理由更是直白:

我們的數(shù)據(jù)非常有價值,不想免費(fèi)提供給科技巨頭們。

圖片

不得不說,這波圍繞類ChatGPT展開的“商戰(zhàn)”著實(shí)有點(diǎn)意思。

不過圍觀的網(wǎng)友們就不那么樂觀了:

唯一沒有獲利的……好像就是用戶了。

圖片

科技巨頭們要為訓(xùn)練數(shù)據(jù)買單了

我們都知道,訓(xùn)練一個像諸如ChatGPT這樣的AI,背后定然需要海量的數(shù)據(jù)。

無論是OpenAI、谷歌、微軟、Meta或是其它公司都是如此。

但這些科技巨頭們一般獲取這些數(shù)據(jù)的方式都是從網(wǎng)上抓取,也因此不會給對應(yīng)數(shù)據(jù)背后的公司掏錢。

他們所獲取的數(shù)據(jù)來源,就包括了StackOverflow、Reddit在內(nèi)的數(shù)千個在線“資源”。

然后科技巨頭們就會將這些數(shù)據(jù)“喂”給大模型,讓對話AI變得更聰明、更智能。

待產(chǎn)品們成熟可以“上崗”之后,科技巨頭們就會開啟付費(fèi)模式,例如我們熟知的ChatGPT Plus、GitHub Copilot等等。

圖片

但在這么一個過程中,像StackOverflow和Reddit這樣的網(wǎng)站,就有點(diǎn)慘了。

首先,就是我們剛才提到的,這些AI拿著他們家的數(shù)據(jù)做訓(xùn)練,變得更強(qiáng)更優(yōu)秀。

其次,這些AI的誕生似乎對于它們來說并沒有太大的益處,反倒可能會變成非常有競爭力的對手。

于是乎,Reddit就率先不干了,CEO Steve Huffman直接撂下狠話:

想白嫖,沒門!得交錢。

而后StackOverflow的CEO Prashanth Chandrasekar也公開贊成Reddit的做法。

不僅如此,他還認(rèn)為這些大語言模型(LLM)的開發(fā)人員還違反了自家網(wǎng)站用戶們的權(quán)益。

因?yàn)樵赟tackOverflow條款中有這樣的明確規(guī)定:

用戶擁有他們在Stack Overflow上發(fā)布內(nèi)容的所有權(quán),但所有內(nèi)容均受知識共享許可的約束,該許可要求以后使用這些數(shù)據(jù)的任何人都說明其來源。

Chandrasekar認(rèn)為,日后科技巨頭們拿著自家的類ChatGPT的產(chǎn)品去出售的時候,開發(fā)人員是解釋不清用了StackOverflow哪些用戶的問答去訓(xùn)練的模型:

因此,他們違反了知識共享許可。

據(jù)了解,StackOverflow和Reddit目前都沒有對數(shù)據(jù)收費(fèi)做明確的公示,而且價格也沒有定下來。

但另一方面,各種大語言模型背后的企業(yè),也正在努力降低開發(fā)的成本。

將來若是訓(xùn)練數(shù)據(jù)都要收費(fèi)了……那這部分成本又將會有誰來買單呢?

反正Reddit CEO的表態(tài)是:

爬取Reddit數(shù)據(jù)產(chǎn)生了價值,卻不將任何價值返還給我們的用戶,這是個問題。

會怎么收費(fèi)?

雖然目前StackOverflow和Reddit都沒有明確訓(xùn)練數(shù)據(jù)的價格,但有媒體猜測,他們可能會借鑒馬斯克推特的“定價路線”。

例如在這個月,馬斯克就提高了訪問推特數(shù)據(jù)的價格——42000美元/5000萬條推文。

更戲劇性的是,馬斯克前一陣子還以“OpenAI非法使用推特數(shù)據(jù)訓(xùn)練”為由,準(zhǔn)備起訴OpenAI。

圖片

而不僅是文字領(lǐng)域,在圖片生成領(lǐng)域,因訓(xùn)練數(shù)據(jù)而產(chǎn)生的糾紛也是屢見不鮮。

例如Getty Image就在此前起訴了OpenAI的對手Stability AI。

理由是涉嫌使用超過1200萬張照片且之前沒有尋求過許可。

……

至于像StackOverflow和Reddit最終將如何定價,還需要等待他們官方的表態(tài)。

但值得明確的一點(diǎn)是,隨著這一波AIGC熱潮的到來,其背后的各種“規(guī)矩”,是值得深入探討、商定了。

責(zé)任編輯:張燕妮 來源: 量子位
相關(guān)推薦

2023-04-26 07:27:36

ChatGPTSSLNginx

2022-03-22 14:15:57

計算模型訓(xùn)練

2023-05-17 15:09:54

2023-12-11 21:35:48

2013-06-18 17:12:03

程序員開發(fā)工具付費(fèi)

2023-07-05 13:34:57

ChatGPTOpenAI生產(chǎn)者

2023-09-22 08:27:59

2021-02-20 12:21:16

AI 數(shù)據(jù)人工智能

2023-02-14 15:18:36

ChatGPTAI

2022-12-25 10:35:09

ChatGPTPython

2023-04-23 09:31:07

2023-04-18 17:46:15

數(shù)據(jù)科學(xué)

2023-06-26 07:10:51

2013-01-09 16:00:38

移動應(yīng)用免費(fèi)付費(fèi)

2023-04-15 20:29:19

ChatGPT人工智能

2022-12-06 13:56:03

AI模型

2023-06-28 07:02:19

ChatGPTiOS

2025-02-08 08:50:00

2013-08-09 10:37:31

代碼數(shù)據(jù)

2024-05-10 08:44:25

ChatGPT模型GPT
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號