GitHub深陷“抄襲門”,拿公開源碼訓(xùn)練AI,遭大量程序員聲討
GitHub Copilot是GitHub新出的一款“人工智能結(jié)對(duì)編程工具”,開發(fā)人員只需要在編輯器內(nèi)輸入想要的邏輯的注釋,這個(gè)工具便能立即寫出代碼。

Copilot一經(jīng)發(fā)布就引起了不小轟動(dòng)。
有人認(rèn)為,這是一款劃時(shí)代的AI產(chǎn)品。在未來,程序員這一職業(yè),很有可能因?yàn)锳I編程工具的產(chǎn)生,而大幅提高生產(chǎn)效率。
然而,在Copilot還沒有加冕為王時(shí),GitHub的一封郵件卻將這個(gè)工具打入了十八層地獄。
7月7日,一位名叫“Nora Tindall”的外國網(wǎng)友,曬出了一封GitHub的回復(fù)郵件。
郵件中,Nora質(zhì)問GitHub,自己的GitHub賬戶中的代碼是否被用于Copilot的訓(xùn)練。
GitHub明確表示,所有的GitHub公開代碼都被用于Copilot的訓(xùn)練,GitHub不會(huì)區(qū)分開源協(xié)議的類型。
針對(duì)這樣無視版權(quán)的行為,Nora諷刺道:“這是官方規(guī)定,遵守版權(quán)只適用于平民和無產(chǎn)階級(jí),富人和大公司可以為所欲為。”
GitHub不區(qū)分開源協(xié)議的類型,意味著什么?
意味著不管你的代碼使用了哪一種開源協(xié)議,都將被GitHub無情地拿來訓(xùn)練Copilot,開源協(xié)議蕩然無存。
例如我們熟悉的GPL協(xié)議,它規(guī)定開源代碼可以免費(fèi)使用和引用,也可以修改和衍生代碼,但不允許修改后的代碼,以及衍生的代碼作為閉源商業(yè)軟件發(fā)布和銷售。
假如Copilot遵循GPL,意味著它必須開源!
如果Copilot未來收費(fèi),變成了一種商品,這毫無疑問是一種侵權(quán)行為。
Copilot還有另外一個(gè)問題。官方聲稱Copilot通常不會(huì)精確復(fù)制代碼塊。
但很多開發(fā)者使用Copilot后表示,這一說法并不準(zhǔn)確。
一名網(wǎng)友上傳了一段視頻。視頻中,這名網(wǎng)友在編輯器中打出“Fast Inverse Square Root”(平方根倒數(shù)速算法)后,Copilot將《雷神之錘3》里那段經(jīng)典的算法寫在了編輯器上。
甚至連那句wtf的經(jīng)典注釋都沒有放過。
事件還在不斷地發(fā)酵,甚至已經(jīng)有科技公司表示,嚴(yán)謹(jǐn)員工使用Copilot。因?yàn)樗苡锌赡苁褂米裱璆PL協(xié)議的源代碼,使公司面臨侵權(quán)風(fēng)險(xiǎn)。
在今年的世界人工智能大會(huì)開幕式上,AI應(yīng)用、AI倫理、AI安全被多次提及,但鮮有人提及AI涉及版權(quán)的問題。
AI所使用的訓(xùn)練數(shù)據(jù),該不該獲得作者的授權(quán)?或者說,開發(fā)人員所公開的代碼,不希望被機(jī)器學(xué)習(xí)納入訓(xùn)練數(shù)據(jù),該怎么辦?
像GitHub此次的“抄襲門”,如果自己在GitHub公開的源碼不希望被抄襲,是完全沒有辦法的。而GitHub使用這些源碼,也沒有經(jīng)過開發(fā)者們的同意,未來如果Copilot閉源,必將引起軒然大波。
今年的315晚會(huì)上,曝光率人臉識(shí)別攝像頭被濫用的現(xiàn)象,一些門店為了精準(zhǔn)營銷,未經(jīng)客戶同意采集和使用人臉信息,這也是AI發(fā)展道路上,必須解決的問題。