舉報人「自殺」,OpenAI表示震驚!NYU教授發(fā)長文悼念:警鐘仍在回響
幾天前,消息曝出,曾在OpenAI工作四年,指控公司侵犯版權(quán)的Suchir Balaji,上月底在舊金山公寓中被發(fā)現(xiàn)死亡,年僅26歲。
Suchir Balaji曾參與了ChatGPT后訓練、GPT-4預訓練,以及o1推理的研發(fā)工作。
今年10月,他在自己的一篇博文和「紐約時報」的專訪中指出,OpenAI在使用新聞和其他網(wǎng)站的信息訓練其AI模型時,違反了「合理使用」原則。
目前,OpenAI的發(fā)言人已經(jīng)證實了Balaji的離世,并在郵件中表達了沉痛的哀悼。
而正與OpenAI CEO奧特曼陷入法律糾紛的馬斯克,則在X平臺上發(fā)了一個耐人尋味的 「Hmm」。
在消息曝出當日,馬庫斯迅速在X上發(fā)帖悼念:
「Suchir Balaji是個很好的年輕人?!?/span>
「這是悲劇?!?/span>
第二天,他專門撰寫了一篇博客,來紀念Suchir Balaji。
紀念Suchir Balaji(1998 - 2024)
11月初,馬庫斯通過Zoom與畢業(yè)于伯克利的前OpenAI員工Suchir Balaji,進行了一次富有啟發(fā)性的交談。
讓人痛心的是,他在短短三周之后,便離開了這個世界。
根據(jù)警方報告,這似乎是一起自殺事件。
馬庫斯表示,關(guān)于二人的通話內(nèi)容,可以不違背保密原則地說:「Suchir Balaji對OpenAI和版權(quán)問題表示擔憂;而正是由于這些共同的顧慮,他們才得以相識。」
在10月的個人博客里,Balaji發(fā)表了一篇文章,探討了我們這個時代最重要的問題之一:生成式AI是否符合「合理使用」(fair use)的標準?
博文地址:https://suchir.net/fair_use.html
在這篇博文中,Balaji詳細分析了美國《1976年版權(quán)法》第107條中定義的四個合理使用因素,特別關(guān)注了以下兩個因素:
1. 使用的目的和性質(zhì):Balaji指出,ChatGPT等生成式AI模型的商業(yè)性質(zhì)可能不利于被視為合理使用。
2. 對受版權(quán)保護作品潛在市場或價值的影響:他引用了一些研究,論證ChatGPT的出現(xiàn)可能對某些在線知識社區(qū)(如Stack Overflow)的流量和用戶參與度產(chǎn)生負面影響,進而影響這些平臺的市場價值。
其實,AI訓練數(shù)據(jù)的版權(quán)問題早已存在。一年前,當《紐約時報》起訴OpenAI并證實了其輸出內(nèi)容與網(wǎng)站上的部分報道高度相似時,OpenAI在文本和版權(quán)方面的問題就已經(jīng)開始凸顯。
類似的現(xiàn)象也出現(xiàn)在圖像和視頻生成領(lǐng)域。今年一月,馬庫斯和Reid Southen在《IEEE Spectrum》上揭示了圖像生成軟件(如Midjourney和DALL-E)存在的類似問題。
他們發(fā)現(xiàn)的最令人震驚的現(xiàn)象是,即便沒有直接點名,系統(tǒng)也會產(chǎn)生類似抄襲商業(yè)角色的復制品。
比如,輸入「意大利水管工」就會生成任天堂的馬里奧角色,而指令里完全沒有提到馬里奧這個名字。
相比之下,真正的藝術(shù)家理應會創(chuàng)造一個全新的、原創(chuàng)的水管工形象。
將近一年過去了,明顯的侵權(quán)問題依然存在。
OpenAI最新發(fā)布的視頻生成模型Sora與其他AI一樣,顯然是在大量受版權(quán)保護的材料上進行了訓練。
與前代產(chǎn)品相似,它也會不時產(chǎn)生缺乏創(chuàng)意、近似抄襲的輸出,就像Southen生成的這些例子:
超級英雄復仇的電影場景
一個有意大利人的橫版游戲
無獨有偶,TechCrunch也在幾天前指出了相同的問題。報道稱,OpenAI從未公開Sora所使用的訓練數(shù)據(jù)來源,但從目前的結(jié)果來看,至少有部分數(shù)據(jù)可能來自Twitch直播和電子游戲?qū)崨r。
法律專家警告:OpenAI疑似將游戲內(nèi)容用作Sora訓練數(shù)據(jù)恐將引發(fā)法律爭議
比如,它可以生成類似于使命召喚和反恐精英風格的第一人稱射擊游戲片段。
還有充滿90年代《忍者神龜》風格的街機格斗游戲片段。
Sora似乎還對Twitch直播的格式有所了解。下面這張視頻截圖中可以看到,大體的布局和細節(jié)都得到了還原。
甚至,這張截圖中出現(xiàn)了著名Twitch主播Raúl álvarez Genes(網(wǎng)名Auronplay)的影像,甚至連他左臂的紋身都被「復刻」了出來。
這些版權(quán)問題的嚴重性已經(jīng)不言而喻。Suchir的擔憂確實切中要害。
然而,挑戰(zhàn)既定觀念總是要付出代價的。
正如《印度時報》所指出的,Suchir「對OpenAI涉嫌侵犯版權(quán)的公開批評...使他的離世備受關(guān)注,引發(fā)人們對敢于反對強大科技企業(yè)的人所承受的壓力和挑戰(zhàn)的深思」。
雖然我們無從得知他離世的真正原因,但愿人們不會忘記Suchir的擔憂和他展現(xiàn)的勇氣。
加州SB-1047舉報人保護法案被否決令人遺憾。社會確實需要采取更多措施來保護像Suchir Balaji這樣的人。
最后,讓我們引用Suchir在十月份博客結(jié)論中的一段話作為結(jié)尾:
在合理使用的四個構(gòu)成要素中,似乎沒有任何一項支持ChatGPT可以合理使用其當前的訓練數(shù)據(jù)。
然而,這些論據(jù)本質(zhì)上并非僅針對ChatGPT,類似的論點同樣適用于各個領(lǐng)域中的眾多生成式AI產(chǎn)品。