GitHub被起訴,版權(quán)問題再引熱議,網(wǎng)友類比谷歌圖書:畢竟谷歌沒拿用戶內(nèi)容寫小說
本文經(jīng)AI新媒體量子位(公眾號(hào)ID:QbitAI)授權(quán)轉(zhuǎn)載,轉(zhuǎn)載請(qǐng)聯(lián)系出處。
GitHub在去年11月遭到集體訴訟。
現(xiàn)在,關(guān)于其背后的知識(shí)共享問題被翻出來,美國版權(quán)清理中心(CCC)的常務(wù)董事Roy Kaufman特地撰文指出:
GitHub給的代碼通常沒有署名,違反了著作權(quán)授權(quán)許可協(xié)議CC BY 4.0。
此文一出,GitHub再度被推到風(fēng)口浪尖,引起熱烈討論。
這場(chǎng)起訴的導(dǎo)火索是GitHub與OpenAI共同研發(fā)的“敲代碼神器”:Copilot。
當(dāng)時(shí),正式發(fā)布不到5個(gè)月的Copilot已惹怒了一眾程序員,主要問題可以概括為“侵權(quán)”二字。
知識(shí)共享問題再度引熱議
美國版權(quán)清理中心的Roy在文中寫道,其實(shí)CC BY 4.0的規(guī)定已經(jīng)算相當(dāng)寬松了:
只要有合理的署名,就可以在沒有額外許可的情況下,把用戶上傳的內(nèi)容用于文本數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí),以及AI訓(xùn)練(可統(tǒng)稱為Text Data Mining,TDM)。
巴特,GitHub Copilot給出的代碼連這點(diǎn)都做不到——因?yàn)樗鶝]有標(biāo)注作者署名。
誠然,GitHub主要是個(gè)用于分享開源代碼的平臺(tái),但官方這樣隨意挪用用戶上傳的內(nèi)容,依然涉嫌違反許多法律和協(xié)議。
有網(wǎng)友指出:
(根據(jù)相關(guān)法律),不可以通過修改主機(jī)服務(wù)商的使用條款,隨意挪用用戶上傳的內(nèi)容。
還有人把Copilot和谷歌圖書(Google Books)作比較,后者用于搜索谷歌掃描的書籍、雜志全文,并可通過光學(xué)字符識(shí)別(OCR)轉(zhuǎn)換為文本。該網(wǎng)友指出:
二者有一個(gè)明顯的不同之處:谷歌圖書一次只允許你訪問2頁內(nèi)容。
若要獲取一本書的全部?jī)?nèi)容,必須搜索很多次——也就是說,他人不能一下子就獲得這本書的完整電子版,這樣就不存在“版權(quán)清洗”。
事實(shí)上,谷歌圖書也曾被作家協(xié)會(huì)起訴,但人家谷歌最后勝訴了。
因?yàn)榉ㄔ涸跈?quán)衡版權(quán)侵權(quán)問題時(shí),會(huì)考慮“實(shí)用性 ”以及“充分改造性”等問題。
有吃瓜網(wǎng)友補(bǔ)充調(diào)侃道,雖然谷歌很有可能把這些電子版書籍的內(nèi)容上傳到自家的云上了,但是:
畢竟人家沒用這些東西來搞AI寫小說。
言外之意,就是假如谷歌來搞類似Copilot的事情,那他們可能也要面臨大麻煩。
違反多項(xiàng)法律和協(xié)議
至于GitHub Copilot違反了哪些協(xié)議,原告表示,其中包括美國的數(shù)字千年版權(quán)法(Digital Millennium Copyright Act,DMCA)。
DMCA主要有以下部分:
- 版權(quán)技術(shù)措施法案(Copyright Technical Measures Act):規(guī)定在數(shù)字領(lǐng)域中可使用的技術(shù)保護(hù)措施,防止未經(jīng)許可被挪用。
- 網(wǎng)絡(luò)服務(wù)提供商責(zé)任限制法案(Online Copyright Infringement Liability Limitation Act):規(guī)定網(wǎng)絡(luò)服務(wù)提供商(如網(wǎng)站或云服務(wù))在用戶侵權(quán)行為方面的責(zé)任。
- 對(duì)解除加密技術(shù)的刑事處罰條例(Criminal Penalties for Circumvention of Encryption Measures):解開加密技術(shù),可能構(gòu)成刑事犯罪。
- 版權(quán)投訴通知制度(Copyright Complaint Notification System):規(guī)定版權(quán)所有者如何投訴侵權(quán)行為,以及網(wǎng)絡(luò)服務(wù)提供商應(yīng)對(duì)投訴的責(zé)任和義務(wù)。
據(jù)其中的“網(wǎng)絡(luò)服務(wù)提供商責(zé)任限制法案”,如果服務(wù)商希望使用用戶上傳內(nèi)容,需征得用戶同意,并且在使用時(shí)給予適當(dāng)?shù)氖鹈?span style="color: #8f8f8f;">(嗯,又是署名...)
除了DMCA,Copilot還涉嫌違反了加州消費(fèi)者隱私法等,以及前文提到的CC BY 4.0。
總而言之,GitHub和Copilot涉嫌違反的法律和規(guī)定相當(dāng)錯(cuò)綜復(fù)雜。
目前,本案尚處于早期階段,不管最終判決結(jié)果如何,都還有很長的路要走。
值得一提的是,訴訟發(fā)起者,干了20多年的老程序員Matthew Butterrick已激活了自己的律師資格證,特地來細(xì)究這些問題。