谷歌資深研究員遭解雇:論文之爭背后
譯文【51CTO.com快譯】12月初,谷歌解雇知名AI倫理研究員蒂姆尼特·格布魯(Timnit Gebru)。這一事件引發(fā)爭議不斷甚至遭到內(nèi)部員工聯(lián)名抗議。就在解雇事件當(dāng)天,美國國家勞工關(guān)系委員會(huì)還對(duì)谷歌提起了訴訟,指控谷歌非法監(jiān)視雇員,報(bào)復(fù)性解雇有興趣加入工會(huì)的雇員。即使圣誕將近,事件余韻也未消散??梢哉f自谷歌兩位創(chuàng)始人一年前離開公司后,這一事件對(duì)公司現(xiàn)任管理層又是一次嚴(yán)峻大考。
事件起因
先來回顧一下這起事件的前因后果。
格布魯本人是著名的人工智能科學(xué)家,也是谷歌人工智能倫理團(tuán)隊(duì)的聯(lián)席技術(shù)負(fù)責(zé)人。事件肇始是今年早些時(shí)候,格布魯在推特上給華盛頓大學(xué)教授艾米麗·本德發(fā)了一條消息。圍繞人工智能處理文本的最新研究進(jìn)展可能引發(fā)的倫理問題,兩人進(jìn)行了深入的探討。當(dāng)討論進(jìn)展到一定階段時(shí),他們與來自谷歌和學(xué)界的另外五名研究者,共同完成了一篇審視人工智能偏見的研究論文,并在10月份提交給了一個(gè)學(xué)術(shù)會(huì)議。
正是這篇論文被谷歌的AI負(fù)責(zé)人認(rèn)為“沒有達(dá)到我們的發(fā)表標(biāo)準(zhǔn)”,在格布魯拒絕了將論文撤回或移除署名后,她被谷歌解雇。在此之后,逾2200名谷歌員工簽署了一封公開信,要求更公開透明地審查這篇論文。在業(yè)內(nèi),越來越多的人工智能研究人員公開譴責(zé)了谷歌對(duì)待格布魯?shù)姆绞健?/p>
論文背后
引發(fā)分歧的這篇論文名為《論隨機(jī)鸚鵡的危險(xiǎn): 語言模型會(huì)不會(huì)太大? 》(On the Dangers of Stochastic Parrots: Can Language Models Be Too Big?),它將批判性的眼光投向了人工智能研究中最活躍的領(lǐng)域之一。
自2010年以來,谷歌等科技公司已在人工智能領(lǐng)域投入大量資金,當(dāng)時(shí)研究人員發(fā)現(xiàn),使用一種名為“機(jī)器學(xué)習(xí)”的技術(shù),可以讓語音和圖像識(shí)別更加準(zhǔn)確。這些算法可以通過消化帶有標(biāo)簽的樣本數(shù)據(jù)來改進(jìn)它們?cè)谌蝿?wù)中的表現(xiàn)。其中,一種被稱為“深度學(xué)習(xí)”的方法,通過將學(xué)習(xí)算法與更大的樣本數(shù)據(jù)集、更強(qiáng)算力的計(jì)算機(jī)相結(jié)合,可以獲得驚人的新結(jié)果。
在過去的幾年里,研究人員著力研究出了如何為語言建立超大規(guī)模的機(jī)器學(xué)習(xí)模型,通過讓機(jī)器學(xué)習(xí)算法消化從網(wǎng)絡(luò)上抓取的數(shù)十億文本文字,在機(jī)器閱讀理解方面取得了重大進(jìn)展。這些系統(tǒng)根據(jù)語言的統(tǒng)計(jì)模式運(yùn)作,它們不像人類那樣理解這個(gè)世界,而且會(huì)犯一些對(duì)人而言顯而易見的錯(cuò)誤,但它們可以通過數(shù)據(jù)處理來取得令人印象深刻的成果,比如回答問題、生成文本等等。
谷歌的BERT就是這樣一個(gè)系統(tǒng),它被用來改善谷歌搜索引擎處理長句查詢的方式。微軟在此前宣布,獲得 OpenAI的GPT-3系統(tǒng)的獨(dú)家授權(quán),使得微軟能夠在其面向客戶的 AI 解決方案中充分發(fā)揮 GPT-3 的自然語言生成和處理能力。
人工智能領(lǐng)域的這種進(jìn)步促使其他研究人員開始關(guān)注這種自然語言處理技術(shù)的局限性和可能導(dǎo)致的社會(huì)影響。格布魯參與合著的這篇論文綜述了之前關(guān)于分析和生成語言的人工智能系統(tǒng)的局限性的研究,比如構(gòu)建和訓(xùn)練AI語言系統(tǒng)會(huì)消耗大量電能,另外論文還引用了有關(guān)谷歌語言模型BERT局限性的研究報(bào)告。此前就有研究發(fā)現(xiàn)BERT傾向于把一些類似腦性麻痹、失明等表示殘疾的短語與負(fù)面消極的語言聯(lián)系起來。這篇論文恰恰審視了這種偏見,進(jìn)而質(zhì)疑這種大型的語言模型是否會(huì)給社會(huì)中享有特權(quán)的人帶來不成比例的好處,又是否會(huì)傷害那些邊緣化的社區(qū)和人群。
因此格布魯和其他幾位作者敦促人工智能開發(fā)者對(duì)待語言項(xiàng)目要更加謹(jǐn)慎,包括更好地記錄用于創(chuàng)建此類系統(tǒng)的數(shù)據(jù)。論文提出,構(gòu)建這種語言系統(tǒng)的研究人員不僅要考慮人工智能開發(fā)者的立場,還要考慮該領(lǐng)域之外有可能受到系統(tǒng)輸出或判斷影響的人的視角。
各方反應(yīng)
整體來看,引發(fā)分歧的這篇論文就是在指出目前AI語言系統(tǒng)的相關(guān)局限性后提出了一些改進(jìn)意見,而不是在攻擊谷歌或其技術(shù)。
倫敦大學(xué)學(xué)院名譽(yù)副教授朱利安·科內(nèi)比斯(Julien Cornebise)在看過這篇論文后也指出了這一點(diǎn)。“這是一篇非常扎實(shí)、經(jīng)過充分深入研究的文章。很難想象這樣的成果會(huì)在任何實(shí)驗(yàn)室引起軒然大波,更不用說會(huì)導(dǎo)致有人因此丟掉工作。”
艾倫人工智能研究所首席執(zhí)行官奧倫·艾奇奧尼(Oren Etzioni)表示:“艾倫研究所對(duì)這一主題也進(jìn)行了自己的研究,其中一些成果也被引用在這篇論文里……目前這項(xiàng)工作仍在進(jìn)行中,因?yàn)槠娪卸喾N形式,幾乎所有在這個(gè)領(lǐng)域工作的人都認(rèn)識(shí)到,這些語言模型的影響力正在日益增強(qiáng),我們有義務(wù)負(fù)責(zé)任地使用它們。”
谷歌人工智能主管杰夫·迪恩(Jeff Dean)則在郵件中表態(tài):“這篇論文本身存在一些重要缺陷,使我們無法輕松地將谷歌關(guān)聯(lián)其中。例如,關(guān)于如何使模型更有效率以及減少其對(duì)整體環(huán)境影響的重要發(fā)現(xiàn)在論文中都沒有體現(xiàn),也沒有考慮到谷歌和其他研究人員最近在減少語言模型偏見方面的一些工作。強(qiáng)調(diào)風(fēng)險(xiǎn)而不提出研發(fā)人員理解和減輕這些風(fēng)險(xiǎn)的方法,這種做法對(duì)于解決這些問題沒有任何幫助。”
對(duì)此,艾米麗·本德在事發(fā)后表示:“盡管杰夫·迪恩認(rèn)為這篇論文質(zhì)量不佳,但這個(gè)領(lǐng)域確實(shí)還遠(yuǎn)遠(yuǎn)沒有發(fā)明出一種能夠可靠地消除語言偏見的方法。”
后續(xù)進(jìn)展
自12月9日,谷歌CEO皮采在一封內(nèi)部郵件中道歉之后,谷歌方面對(duì)于格布魯?shù)?ldquo;離開”沒有再作任何公開表態(tài)。杰夫·迪恩也在后來的一封郵件中表示“關(guān)于此事1月公司會(huì)有最新決定”?;诠雀璧膽B(tài)度和處事方法,有人猜測格布魯?shù)碾x開或許不僅僅是因?yàn)橐黄撐?。格布魯本人也曾表示,她可能因?yàn)榕u(píng)谷歌在多元化和包容性方面的處理方式,并在最近的群發(fā)郵件中建議同事停止參與相關(guān)項(xiàng)目而被解職。
值得一提的是,格布魯是谷歌為數(shù)不多的黑人女性領(lǐng)導(dǎo)者之一,她一直對(duì)科技行業(yè)和谷歌對(duì)待少數(shù)族裔員工的做法提出批評(píng)。從這一角度來看,這起事件可以說集中匯聚了近年來引發(fā)谷歌員工騷亂的四個(gè)問題:人工智能領(lǐng)域的道德規(guī)范,女性待遇,種族問題,以及對(duì)谷歌過往開放自由文化的背離。
由于人工智能所蘊(yùn)藏的強(qiáng)大潛能和可期前景,隨著AI開發(fā)的深入,業(yè)界對(duì)于AI倫理問題的關(guān)注日趨升溫。基于此,谷歌也發(fā)布了一系列人工智能開發(fā)原則,其中包括“對(duì)社會(huì)有益”和“避免產(chǎn)生或強(qiáng)化不公平的偏見”等準(zhǔn)則 。后者正好是格布魯鉆研的領(lǐng)域。她因在Gender Shades項(xiàng)目中的出色表現(xiàn)而出名,這個(gè)項(xiàng)目揭示了面部識(shí)別技術(shù)對(duì)黑人族裔的不準(zhǔn)確性,她的工作迫使IBM和微軟暫停了對(duì)外銷售面部識(shí)別技術(shù)和產(chǎn)品。
但本次谷歌在解雇格布魯一事上沉默的態(tài)度,可以說具有強(qiáng)烈的反諷的意味。曾經(jīng)的谷歌以開放、理想主義和自由為宗旨,如今似乎也正在轉(zhuǎn)變?yōu)橐粋€(gè)更加世俗意義上的企業(yè),在取悅員工和打擊異議兩側(cè)危險(xiǎn)地走著鋼索。
原文標(biāo)題:Behind the Paper That Led to a Google Researcher’s Firing,作者:Tom Simonite
【51CTO譯稿,合作站點(diǎn)轉(zhuǎn)載請(qǐng)注明原文譯者和出處為51CTO.com】