自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

Copilot逐字復(fù)制代碼,恐抹去整個(gè)開(kāi)源社區(qū)?程序員拿出律師證發(fā)起集體訴訟

開(kāi)發(fā) 新聞
Copilot是開(kāi)源社區(qū)的「寄生蟲(chóng)」?

作為一名開(kāi)發(fā)者,或許你不介意 GitHub Copilot 未經(jīng)詢問(wèn)就使用了你的開(kāi)源代碼。

但如果,Copilot 逐漸抹去整個(gè)開(kāi)源社區(qū),你會(huì)有什么感受?

近日,程序員 Matthew Butterick (同時(shí)他也擁有作家和律師身份)在個(gè)人博客中控訴了 Copilot,并宣布開(kāi)展訴訟調(diào)查:

2022 年 6 月,我寫(xiě)了一篇關(guān)于 GitHub Copilot 法律問(wèn)題的文章,特別是它對(duì)開(kāi)源許可證的處理不當(dāng)。最近,我采取了下一步行動(dòng):我重新激活了我的加州律師資格,與 Joseph Saveri 律師事務(wù)所的優(yōu)秀集體訴訟律師 Joseph Saveri、 Cadio Zirpoli 和 Travis Manfredi 合作開(kāi)展一個(gè)新項(xiàng)目——我們正在調(diào)查針對(duì) GitHub Copilot 違反其對(duì)開(kāi)源作者和最終用戶法律義務(wù)的潛在訴訟。

GitHub Copilot 是微軟在經(jīng)過(guò)一年的技術(shù)預(yù)覽后于 2022 年 6 月正式發(fā)布的產(chǎn)品。Copilot 是 Visual Studio 和其他 IDE 的插件,可根據(jù)在編輯器中鍵入的內(nèi)容生成所謂的「建議」 。

那么,Copilot 與傳統(tǒng)的自動(dòng)補(bǔ)全功能有什么不同?

Copilot 由 Codex 提供支持,這是一個(gè)由 OpenAI 開(kāi)發(fā)并授權(quán)給微軟的 AI 系統(tǒng)。(盡管微軟也被稱為「OpenAI 的非官方所有者」。)

Copilot 會(huì)根據(jù)用戶輸入的文本 prompt 提供建議,一般可用于提出小的建議,但微軟強(qiáng)調(diào) Copilot 能夠建議更大的代碼塊,例如函數(shù)的整個(gè)主體。

但是其底層 AI 系統(tǒng) Codex 是如何訓(xùn)練的呢?據(jù) OpenAI 稱,Codex 接受了「數(shù)以千萬(wàn)計(jì)的公共存儲(chǔ)庫(kù)」的訓(xùn)練,包括 GitHub 上的代碼。微軟自己含糊地描述為「數(shù)十億行公共代碼」。但 Copilot 研究員 Eddie Aftandilian 在最近的播客中證實(shí),Copilot 是「在 GitHub 上的公共存儲(chǔ)庫(kù)上訓(xùn)練的」。

Copilot 有什么問(wèn)題?

本文作者 Matthew Butterick 認(rèn)為,無(wú)論是訓(xùn)練還是使用,Copilot 都存在法律問(wèn)題。

訓(xùn)練中的法律問(wèn)題

絕大多數(shù)的開(kāi)源軟件包是在授權(quán)許可下發(fā)布的,授予用戶一定的權(quán)利并強(qiáng)加一定的義務(wù)(例如保留源代碼的精確屬性)。這些授權(quán)的合法實(shí)現(xiàn)方式是作者在他們的代碼中聲明他們的版權(quán)(copy-right)。

因此,那些希望使用開(kāi)源軟件的人必須做出一個(gè)選擇,要么遵守許可證上規(guī)定的義務(wù),要么使用從屬于「許可證例外」的代碼(如版權(quán)法下的「合理使用」)。

微軟和 OpenAI 已經(jīng)承認(rèn) Copilot 和 Codex 是在 GitHub 上公開(kāi) repo 中的開(kāi)源軟件上訓(xùn)練的。那么,他們選的是哪條路呢?

如果微軟和 OpenAI 選擇在每個(gè) repo 的開(kāi)源許可下使用這些 repo,那么他們將需要發(fā)布大量的 attri-bu-tion,因?yàn)檫@幾乎是每個(gè)開(kāi)源許可的最低要求。然而,我們現(xiàn)在看不到任何 attri-bu-tion。

因此,微軟和 OpenAI 必須找到一個(gè)「合理使用( fair-use )」的理由。GitHub 前 CEO  Nat Fried-man 在 Copilot 的技術(shù)預(yù)覽會(huì)上曾經(jīng)說(shuō)過(guò),「在公開(kāi)數(shù)據(jù)上訓(xùn)練(機(jī)器學(xué)習(xí))系統(tǒng)屬于合理使用。」

事實(shí)真就如他所說(shuō)嗎?這是一個(gè)法律問(wèn)題,不是誰(shuí)說(shuō)了就算的。當(dāng)然,微軟、OpenAI 和其他研究機(jī)構(gòu)一直在支持「合理使用」的論點(diǎn)。Nat Fried-man 曾進(jìn)一步斷言,「機(jī)器學(xué)習(xí)社區(qū)所廣泛依賴的」關(guān)于「合理使用」的「法理」是存在的。但是軟件自由保護(hù)組織(Software Freedom Conservancy,SFC)不同意他的觀點(diǎn),并要求微軟提供證據(jù)來(lái)支持其立場(chǎng)。SFC 負(fù)責(zé)人曾透露:

我們?cè)?2021 年 6 月私下詢問(wèn)了 Fried-man 和其他微軟、GitHub 的代表,要求他們?yōu)?GitHub 的公開(kāi)法律立場(chǎng)提供可靠的法律參考…… 但他們什么都沒(méi)有提供。

為什么微軟不能為他們的立場(chǎng)提供一些法律依據(jù)?因?yàn)?SFC 是對(duì)的:他們根本就沒(méi)有依據(jù)。盡管一些法院已經(jīng)考慮了相關(guān)問(wèn)題,但目前還沒(méi)有一個(gè)美國(guó)的判例直接去解決 AI 訓(xùn)練的「合理使用」問(wèn)題。此外,那些涉及「合理使用」的案例也是平衡了多重因素。即使法院最終裁定某些類型的 AI 訓(xùn)練是「合理使用」的(這似乎是有可能的),它也可能將其他類型的訓(xùn)練排除在外。到今天為止,我們還不知道 Copi-lot 或 Codex 在這個(gè)范圍內(nèi)處于什么位置。微軟和 OpenAI 也不知道。

使用中的法律問(wèn)題

我們還不能說(shuō)「合理使用」最終將以何種方式應(yīng)用于 AI 訓(xùn)練。但我們知道,這一發(fā)現(xiàn)完全不會(huì)影響 Copi-lot 用戶。為什么?因?yàn)樗麄冎皇鞘褂?Copi-lot 來(lái)給出代碼。那么,這部分代碼的版權(quán)和許可狀態(tài)是怎樣的呢?

2021 年,Nat Fredman 聲稱,Copilot 的輸出屬于操作者,就像他們?cè)谑褂镁幾g器一樣。但 Copilot 為粗心的人設(shè)置了新的陷阱。

圖片

微軟將 Copilot 的輸出描述為一系列代碼「建議」。微軟在這些建議中「不主張任何權(quán)利」。但同時(shí),微軟也沒(méi)有對(duì)這樣生成的代碼的正確性、安全性或擴(kuò)展出的知識(shí)產(chǎn)權(quán)問(wèn)題提供任何保證。一旦你接受了 Copilot 的建議,所有這一切都成了你的問(wèn)題。

你要對(duì)你代碼的安全性和質(zhì)量負(fù)責(zé)。我們建議您在使用由 GitHub Copilot 生成的代碼時(shí)采取與使用其他任何非本人所寫(xiě)代碼時(shí)相同的預(yù)防措施,包括嚴(yán)格的測(cè)試、IP 掃描和安全漏洞跟蹤。

圖片

這些建議的代碼會(huì)有什么問(wèn)題?已經(jīng)有 Copilot 用戶指出,Copilot 可能會(huì)被誘導(dǎo)從可識(shí)別的 repo 中一字不差地復(fù)制代碼。前段時(shí)間,得克薩斯農(nóng)工大學(xué)教授 Tim Davis 給出了很多例子來(lái)說(shuō)明 Copilot 確實(shí)逐字復(fù)制了他的代碼。

圖片

使用此代碼顯然就產(chǎn)生了遵守其許可的義務(wù)。但是根據(jù) Copilot 的設(shè)計(jì),用戶根本看不到代碼的來(lái)源、作者、許可等信息,又怎么去遵守呢?

本文作者 Matthew Butterick 認(rèn)為,Copilot 的快速代碼檢索方法就是一種煙霧彈,目的是掩蓋一個(gè)骯臟的真相:Copi-lot 只是一個(gè)連接大量開(kāi)源代碼的方便的替代界面。因此,Copilot 用戶可能會(huì)承擔(dān)代碼原作者施加給他們的許可義務(wù)。在這種背景下,Nat fredman 聲稱 Copilot 的操作「就像…… 一個(gè)編譯器」是相當(dāng)站不住腳的,因?yàn)榫幾g器改變了代碼的形式,但它們不注入新的知識(shí)產(chǎn)權(quán)屬性。公平地說(shuō),微軟并沒(méi)有對(duì)此提出異議。他們只是把它埋在了小字里。

Copilot 對(duì)開(kāi)源社區(qū)意味著什么?

Matthew Butterick 指出,通過(guò)提供 Copilot 作為大量開(kāi)源代碼的替代接口,微軟所做的不僅僅是切斷開(kāi)源作者和用戶之間的法律關(guān)系??梢哉f(shuō),微軟正在創(chuàng)建一個(gè)新的「圍墻花園」,它將阻止程序員去發(fā)現(xiàn)傳統(tǒng)的開(kāi)源社區(qū),或者至少,消除一切這樣做的動(dòng)機(jī)。

隨著時(shí)間的推移,這個(gè)過(guò)程將使這些社區(qū)變得貧乏。用戶的注意力和參與度會(huì)逐漸轉(zhuǎn)移到 Copilot 的圍墻花園,遠(yuǎn)離開(kāi)源項(xiàng)目本身——遠(yuǎn)離他們的 source repo、他們的 issue track-er、他們的郵件列表、他們的 dis-cus-sion board。這種能量的轉(zhuǎn)變對(duì)于開(kāi)源來(lái)說(shuō)將是痛苦的、永久的損失。

微軟云計(jì)算執(zhí)行官 Scott Guthrie 最近承認(rèn),盡管微軟 CEO Satya Nadella 在收購(gòu) GitHub 時(shí)做出了「GitHub 仍將是一個(gè)開(kāi)放平臺(tái)」的樂(lè)觀承諾,但微軟一直在推動(dòng)更多 GitHub 服務(wù)(包括 Copilot)進(jìn)入其 Azure 云平臺(tái).

Matthew Butterick 表示,他們并不是無(wú)緣無(wú)故向 GitHub 發(fā)起訴訟。他認(rèn)為,發(fā)布開(kāi)源軟件的一大好處是「人」:圍繞我們工作的用戶、測(cè)試人員和貢獻(xiàn)者社區(qū)?!肝覀兊纳鐓^(qū)幫助我們以無(wú)需靠自己的方式改進(jìn)軟件,這使工作變得有趣」。

Copilot 向開(kāi)源軟件引入了更「自私」的界面:只給我想要的(just give me what I want)!使用 Copilot,開(kāi)源用戶永遠(yuǎn)不必知道誰(shuí)制作了他們的軟件,永遠(yuǎn)不必與社區(qū)互動(dòng),永遠(yuǎn)不必做出貢獻(xiàn)。

同時(shí),Matthew Butterick 提醒說(shuō),開(kāi)源作者必須注意到,我們的工作被隱藏在一個(gè)名為 Copilot 的大型代碼庫(kù)中。就像農(nóng)場(chǎng)中的一頭奶牛,Copilot 只想將我們轉(zhuǎn)變?yōu)橐_(kāi)采的資源的生產(chǎn)者。

「即使是奶牛也能從交易中獲得食物和住所,而 Copilot 對(duì)我們的個(gè)人項(xiàng)目沒(méi)有任何貢獻(xiàn)。」

Matthew Butterick 認(rèn)為,Copilot 的圍墻花園與開(kāi)源是對(duì)立的,且存在危害。因此,這也是對(duì) GitHub 在被微軟收購(gòu)之前所代表的一切的背叛。如果你出生于 2005 年之前,肯定會(huì)記得 GitHub 的聲譽(yù)是建立在其為開(kāi)源開(kāi)發(fā)人員提供好東西和培育開(kāi)源社區(qū)的基礎(chǔ)上的。相比之下,Copilot 是這個(gè)想法的多重瘋狂反轉(zhuǎn)。

換個(gè)角度說(shuō),也許你是 Copilot 的粉絲,認(rèn)為 AI 是未來(lái)。首先,這里反對(duì)的不是一般的人工智能輔助編程工具,而是微軟對(duì) Copilot 的具體選擇。我們可以很容易地想象一個(gè)對(duì)開(kāi)源開(kāi)發(fā)人員更友好的 Copilot 版本——例如,參與是自愿的,或者編碼人員有償為訓(xùn)練語(yǔ)料庫(kù)做出貢獻(xiàn)。目前看來(lái),盡管自稱熱愛(ài)開(kāi)源,但微軟沒(méi)有選擇這些選項(xiàng)。其次,如果你發(fā)現(xiàn) Copilot 有價(jià)值,很大程度上是因?yàn)榈讓娱_(kāi)源訓(xùn)練數(shù)據(jù)的質(zhì)量。Copilot 從開(kāi)源項(xiàng)目中汲取生命,最直接的影響將是讓 Copilot 變得更糟。

Matthew Butterick 表示,「當(dāng)我第一次寫(xiě) Copilot 時(shí),我說(shuō)過(guò):『我不擔(dān)心它對(duì)開(kāi)源的影響?!欢唐趦?nèi),我仍然不擔(dān)心。但當(dāng)我回顧自己近 25 年的開(kāi)源之旅時(shí),我意識(shí)到我錯(cuò)過(guò)了更大的圖景。畢竟,開(kāi)源不是固定的一群人。這是一種不斷增長(zhǎng)、不斷變化的集體智慧,不斷被新鮮的思想更新。我們?yōu)楸舜嗽O(shè)定了新的標(biāo)準(zhǔn)和挑戰(zhàn),從而提高了我們對(duì)取得成就的期望。

在這場(chǎng)盛大的煉金術(shù)中,Copilot 闖入了。它的目標(biāo)是把開(kāi)源的能量據(jù)為己有。我們無(wú)需深入研究微軟在開(kāi)源方面的曲折歷史,就可以了解 Copilot 的本質(zhì)——寄生蟲(chóng)。

在對(duì)開(kāi)源的損害變得無(wú)法彌補(bǔ)之前,我們必須測(cè)試 Copilot 的合法性。這就是我想申明的原因?!?/span>

責(zé)任編輯:張燕妮 來(lái)源: 機(jī)器之心
相關(guān)推薦

2022-11-30 21:45:06

2022-03-16 11:10:19

程序員社區(qū)技術(shù)

2023-03-19 15:51:25

開(kāi)源開(kāi)源許可證開(kāi)發(fā)

2019-06-05 08:10:36

iOS應(yīng)用系統(tǒng)

2013-06-28 13:28:09

2017-09-05 14:18:29

2012-05-05 09:51:48

諾基亞

2010-11-18 15:34:41

QQ助手微博騰訊

2014-08-25 10:19:12

程序員

2020-10-25 15:20:01

程序員技術(shù)在線社區(qū)

2017-03-13 09:07:05

測(cè)定代碼基因

2021-07-12 10:28:49

GitHub代碼AI

2015-08-24 15:37:36

國(guó)外程序員開(kāi)發(fā)社區(qū)

2010-08-11 09:51:28

Flex代碼

2013-08-20 09:33:59

程序員

2012-03-06 09:22:46

程序員

2014-03-13 11:02:25

JavaScriptJavaScript性

2015-08-24 16:24:08

程序員開(kāi)發(fā)社區(qū)頂級(jí)社區(qū)

2015-08-25 15:54:17

程序員代碼生成器

2011-05-10 09:29:30

代碼重寫(xiě)
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)