自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

GitHub 編程神器 Copilot被斥「盜版」大量開(kāi)源代碼,面臨90億美元集體訴訟

新聞
Butterick還創(chuàng)建了一個(gè)網(wǎng)站,跟進(jìn)訴訟情況,也呼吁更多人的支持,在網(wǎng)站文章中他強(qiáng)調(diào):“我們反對(duì)的絕不是 AI 輔助編程工具,而是微軟在 Copilot 當(dāng)中的種種具體行徑。

作者:Mickey?

自誕生之日起就飽受爭(zhēng)議的微軟代碼工具Copilot近期又遭遇了新的問(wèn)題。

一名程序員就該工具正式起訴了微軟、GitHub 和 OpenAI,尋求對(duì)微軟和其他設(shè)計(jì)部署 Copilot 的公司進(jìn)行集體訴訟,并要求賠償。目前訴訟已經(jīng)提交到了美國(guó)加州北區(qū)地方法院,要求批準(zhǔn) 9,000,000,000 美元的法定賠償金。

讓程序員們?cè)缦掳嗟腁I工具

Copilot到底何方神器?

今年6 月下旬,微軟發(fā)布了一種可以自動(dòng)生成計(jì)算機(jī)代碼的新型人工智能技術(shù)。

該工具名為 Copilot,旨在讓專(zhuān)業(yè)程序員更快地工作。當(dāng)他們工作時(shí),Copilot會(huì)給出代碼建議,程序員可以直接將copilot展示的建議的代碼塊直接添加到自己的代碼中,快速完成工作,這一工具也因此被很多媒體譽(yù)為“讓程序員早下班的工具”。

圖片

據(jù) Copilot 網(wǎng)站稱(chēng),Copilot基于Codex 模型產(chǎn)生,其由“互聯(lián)網(wǎng)上的公共代碼和文本”訓(xùn)練,“既能理解編程,也能理解人類(lèi)語(yǔ)言”。作為 Visual Studio Code 的擴(kuò)展,Copilot “將你的評(píng)論和代碼發(fā)送到 GitHub Copilot 服務(wù),然后它會(huì)使用 OpenAI Codex 來(lái)合成并建議個(gè)別行和整個(gè)函數(shù)”。

許多程序員喜歡這個(gè)新工具,有開(kāi)發(fā)者表示: “使用 Copilot,我能盡量少把精力浪費(fèi)在枯燥重復(fù)的工作身上。它點(diǎn)燃的靈感火花,讓我感到編碼過(guò)程更有趣、更高效了。”但也有不少人不買(mǎi)賬,洛杉磯的程序員、設(shè)計(jì)師、作家和律師Matthew Butterick就是其中之一。本月,他和其他律師團(tuán)隊(duì)提起訴訟,尋求對(duì)微軟和其他設(shè)計(jì)和部署 Copilot 的知名公司的集體訴訟地位。

前程序員律師發(fā)起集體訴訟:與盜版無(wú)異

與許多尖端人工智能技術(shù)一樣,Copilot通過(guò)分析大量數(shù)據(jù)來(lái)發(fā)展其技能。在這種情況下,它依賴(lài)于發(fā)布到互聯(lián)網(wǎng)上的數(shù)十億行計(jì)算機(jī)代碼。52 歲的 Butterick認(rèn)為此過(guò)程等同于盜版,因?yàn)樵撓到y(tǒng)不會(huì)展示任何版權(quán)來(lái)源。他的訴訟聲稱(chēng)微軟及其合作者侵犯了數(shù)百萬(wàn)、花費(fèi)數(shù)年時(shí)間敲下原始代碼的程序員的合法權(quán)利。

這起訴訟被認(rèn)為是對(duì)稱(chēng)為“AI訓(xùn)練”類(lèi)技術(shù)的首次法律訴訟。通過(guò)大量公開(kāi)數(shù)據(jù)進(jìn)行訓(xùn)練,讓ai學(xué)習(xí)并生成自己的產(chǎn)物,這是一種構(gòu)建人工智能的方式,有望重塑科技行業(yè)。這些所謂產(chǎn)物包括畫(huà)作、文字、和代碼。近年來(lái),許多藝術(shù)家、作家、專(zhuān)家和隱私活動(dòng)家抱怨說(shuō),公司正在使用不屬于他們的數(shù)據(jù)來(lái)訓(xùn)練他們的人工智能系統(tǒng)。

圖片

程序員兼律師馬修·巴特里克 (Matthew Butterick) 表示,他擔(dān)心自己所做的工作在新的人工智能系統(tǒng)中被不當(dāng)使用。

在過(guò)去幾十年的技術(shù)發(fā)展中,這一訴訟并不是首例。在 1990 年代和 2000 年代,微軟與開(kāi)源軟件的興起作斗爭(zhēng),將其視為對(duì)公司業(yè)務(wù)未來(lái)的生存威脅。隨著開(kāi)源的重要性與日俱增,微軟欣然接受它,后來(lái)還收購(gòu)了開(kāi)源程序員的家園——GitHub。

幾乎每一代新技術(shù),甚至是在線(xiàn)搜索引擎,都面臨著類(lèi)似的法律挑戰(zhàn)。通常,“沒(méi)有任何成文法或判例法對(duì)其有效,”專(zhuān)門(mén)研究這一法律領(lǐng)域的知識(shí)產(chǎn)權(quán)律師Bradley J. Hulbert說(shuō)。

這起訴訟是人工智能發(fā)展途中的重要里程碑。藝術(shù)家、作家、作曲家和其他創(chuàng)意類(lèi)型越來(lái)越擔(dān)心公司和研究人員在未經(jīng)他們同意且不提供報(bào)酬的情況下使用他們的作品來(lái)創(chuàng)造新技術(shù)。公司以這種方式訓(xùn)練各種各樣的系統(tǒng),包括藝術(shù)生成器、 Siri 和 Alexa 等語(yǔ)音識(shí)別系統(tǒng),甚至無(wú)人駕駛汽車(chē)。

Copilot 基于由 OpenAI 構(gòu)建的技術(shù),在微軟和 GitHub 發(fā)布 Copilot 后,GitHub 的首席執(zhí)行官 Nat Friedman 在推特上表示,根據(jù)版權(quán)法,使用現(xiàn)有代碼來(lái)訓(xùn)練系統(tǒng)是對(duì)材料的“合理使用”,構(gòu)建這些系統(tǒng)的公司和研究人員經(jīng)常使用這一論點(diǎn)。但目前還沒(méi)有法庭案件檢驗(yàn)過(guò)這一論點(diǎn)。

“微軟和 OpenAI 的野心遠(yuǎn)遠(yuǎn)超出了 GitHub 和 Copilot,”Butterick在接受采訪時(shí)說(shuō)。“他們想在任何地方免費(fèi)訓(xùn)練任何數(shù)據(jù),無(wú)需同意,永遠(yuǎn)?!?/p>

從GPT-3到Copilot,AI用開(kāi)源數(shù)據(jù)訓(xùn)練是否合法?

2020 年,OpenAI推出了一個(gè)名為 GPT-3 的系統(tǒng)。研究人員使用大量數(shù)字文本對(duì)系統(tǒng)進(jìn)行訓(xùn)練,其中包括數(shù)千本書(shū)籍、維基百科文章、聊天記錄和其他發(fā)布到互聯(lián)網(wǎng)上的數(shù)據(jù)。

通過(guò)精確定位所有文本中的模式,該系統(tǒng)學(xué)會(huì)了預(yù)測(cè)序列中的下一個(gè)單詞。當(dāng)有人在這個(gè)“大型語(yǔ)言模型”中輸入幾個(gè)單詞時(shí),它可以用整段文本來(lái)完成這個(gè)想法。通過(guò)這種方式,系統(tǒng)可以編寫(xiě)自己的 Twitter 帖子、演講、詩(shī)歌和新聞文章。

令構(gòu)建該系統(tǒng)的研究人員大吃一驚的是,它甚至可以編寫(xiě)計(jì)算機(jī)程序,顯然是從互聯(lián)網(wǎng)上發(fā)布的無(wú)數(shù)程序中學(xué)到的。

因此,OpenAI 更進(jìn)一步,在專(zhuān)門(mén)存儲(chǔ)代碼的新數(shù)據(jù)集合上訓(xùn)練新系統(tǒng)Codex 。該實(shí)驗(yàn)室后來(lái)在一份詳細(xì)介紹該技術(shù)的研究論文中表示,至少部分代碼來(lái)自 GitHub。

這個(gè)新系統(tǒng)成為 Copilot 的底層技術(shù),微軟通過(guò) GitHub 分發(fā)給程序員。在與相對(duì)較少的程序員進(jìn)行了大約一年的測(cè)試后,Copilot 于 7 月在 GitHub 上向所有程序員推出。

目前,Copilot 生成的代碼很簡(jiǎn)單,可能對(duì)更大的項(xiàng)目有用,但必須進(jìn)行修改、擴(kuò)充和審查,許多使用過(guò)該技術(shù)的程序員表示。有些程序員發(fā)現(xiàn)它只有在學(xué)習(xí)編碼或試圖掌握一門(mén)新語(yǔ)言時(shí)才有用。

盡管如此,Butterick還是擔(dān)心 Copilot 最終會(huì)摧毀全球程序員社區(qū)。系統(tǒng)發(fā)布幾天后,他發(fā)表了一篇博文,標(biāo)題為:“這個(gè)Copilot很蠢,它想殺了我”。

Butterick 先生自稱(chēng)為開(kāi)源程序員,是與世界公開(kāi)分享代碼的程序員社區(qū)的一員。在過(guò)去的 30 年里,開(kāi)源軟件幫助推動(dòng)了消費(fèi)者每天使用的大多數(shù)技術(shù)的興起,包括網(wǎng)絡(luò)瀏覽器、智能手機(jī)和移動(dòng)應(yīng)用程序。

盡管開(kāi)源軟件旨在在編碼人員和公司之間自由共享,但這種共享受許可證約束,旨在確保它的使用方式使更廣泛的程序員社區(qū)受益。Butterick 先生認(rèn)為,Copilot 違反了這些許可證,并且隨著它的不斷改進(jìn),將使開(kāi)源編碼器變得過(guò)時(shí)。

在公開(kāi)吐槽這個(gè)問(wèn)題幾個(gè)月后,他向其他幾位律師提起訴訟。該訴訟仍處于早期階段,尚未被法院授予集體訴訟地位。

令許多法律專(zhuān)家感到意外的是,Butterick的訴訟并未指控微軟、GitHub 和 OpenAI 侵犯版權(quán)。他的訴訟采取了不同的策略,認(rèn)為這些公司違反了 GitHub 的服務(wù)條款和隱私政策,同時(shí)也違反了要求公司在使用材料時(shí)顯示版權(quán)信息的聯(lián)邦法律。

Butterick和訴訟背后的另一位律師喬·薩維里 (Joe Saveri) 表示,訴訟最終可能會(huì)解決版權(quán)問(wèn)題。

當(dāng)被問(wèn)及公司是否可以討論這起訴訟時(shí),GitHub 發(fā)言人拒絕了采訪,然后在一封電子郵件聲明中表示,該公司“從一開(kāi)始就致力于通過(guò) Copilot 進(jìn)行負(fù)責(zé)任的創(chuàng)新,并將繼續(xù)改進(jìn)產(chǎn)品,為全球開(kāi)發(fā)人員提供最好的服務(wù)” 微軟和 OpenAI 拒絕就訴訟發(fā)表評(píng)論。

大多數(shù)專(zhuān)家認(rèn)為,根據(jù)現(xiàn)行法律,在受版權(quán)保護(hù)的材料上訓(xùn)練人工智能系統(tǒng)不一定違法。但這樣做可能是因?yàn)橄到y(tǒng)最終創(chuàng)建的材料與它所訓(xùn)練的數(shù)據(jù)基本相似。

Copilot 的一些用戶(hù)表示,它生成的代碼似乎與現(xiàn)有程序相同(或幾乎相同),這一觀察結(jié)果可能成為 Butterick 先生和其他人案例的核心部分。

加州大學(xué)伯克利分校教授帕姆·薩繆爾森專(zhuān)門(mén)研究知識(shí)產(chǎn)權(quán)及其在現(xiàn)代技術(shù)中的作用,他說(shuō)法律思想家和監(jiān)管機(jī)構(gòu)在技術(shù)出現(xiàn)之前的 80 年代簡(jiǎn)要探討了這些法律問(wèn)題。她說(shuō),現(xiàn)在需要進(jìn)行法律評(píng)估。

“這不再是玩具問(wèn)題,”薩繆爾森博士說(shuō)。

Butterick還創(chuàng)建了一個(gè)網(wǎng)站,跟進(jìn)訴訟情況,也呼吁更多人的支持,在網(wǎng)站文章中他強(qiáng)調(diào):“我們反對(duì)的絕不是 AI 輔助編程工具,而是微軟在 Copilot 當(dāng)中的種種具體行徑。微軟完全可以把 Copilot 做得更開(kāi)發(fā)者友好——比如邀請(qǐng)大家自愿參加,或者由編程人員有償對(duì)訓(xùn)練語(yǔ)料庫(kù)做出貢獻(xiàn)。但截至目前,口口聲聲自稱(chēng)熱愛(ài)開(kāi)源的微軟根本沒(méi)做過(guò)這方面的嘗試。另外,如果大家覺(jué)得 Copilot 效果挺好,那主要也是因?yàn)榈讓娱_(kāi)源訓(xùn)練數(shù)據(jù)的質(zhì)量過(guò)硬。Copilot 其實(shí)是在從開(kāi)源項(xiàng)目那邊吞噬能量,而一旦開(kāi)源活力枯竭,Copilot 也將失去發(fā)展的依憑。”

相關(guān)素材:

https://archive.ph/3tuU0

https://githubcopilotinvestigation.com/

責(zé)任編輯:武曉燕 來(lái)源: 大數(shù)據(jù)文摘
相關(guān)推薦

2021-07-22 09:50:22

蘋(píng)果 iOS壟斷

2021-07-06 09:28:35

GitHub開(kāi)發(fā)者開(kāi)源

2022-10-18 15:14:55

代碼程序員

2024-11-28 13:19:43

2009-05-09 08:42:29

SunOralce收購(gòu)

2020-08-07 07:46:54

漏洞安全數(shù)據(jù)

2023-06-12 10:28:22

GitHub人工智能

2022-12-26 00:28:07

2017-05-21 22:00:58

2023-07-13 23:11:43

2023-05-30 10:42:52

2023-05-15 12:26:08

AI編程

2020-11-14 11:20:56

滲透測(cè)試Cobalt Stri源代碼

2019-04-28 15:35:21

Facebook隱私保護(hù)信息泄露

2012-05-05 09:51:48

諾基亞

2013-11-20 11:18:10

蘋(píng)果Android

2021-10-08 05:28:06

黑客攻擊數(shù)據(jù)泄露

2011-01-28 09:11:43

VerizonTerremark

2023-10-31 18:03:42

GitHub人工智能開(kāi)發(fā)

2013-05-21 09:57:41

WebsenseVista收購(gòu)
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)