揭秘Google Brain:專注糾正算法錯(cuò)誤/解決AI偏見
騰訊科技訊 1月29日消息,據(jù)外媒報(bào)道,用谷歌***執(zhí)行官桑達(dá)爾·皮查伊的話說,對(duì)于負(fù)責(zé)推進(jìn)“比電或火更具有深刻意義”的人工智能(AI)技術(shù)的人來說,杰夫·迪恩(Jeff Dean)是個(gè)非常冷靜的人。
作為這家科技巨頭的AI主管,迪恩負(fù)責(zé)領(lǐng)導(dǎo)的部門對(duì)谷歌的未來至關(guān)重要。即使在今年達(dá)沃斯世界經(jīng)濟(jì)論壇的狂熱氣氛中,迪恩仍在禪修。顯然,這樣艱巨的任務(wù)并未令他感到不安。
谷歌人工智能部門主管杰夫·迪恩(Jeff Dean)
迪恩在谷歌成立之初的使命,就曾幫助應(yīng)對(duì)“幾乎可以肯定”來自外太空的威脅。
太空射線
早在世紀(jì)之交,谷歌的搜索引擎就開始出現(xiàn)故障,而其程序員卻對(duì)這一原因感到迷惑不解。正是迪恩及其密友桑杰·格瑪瓦特(Sanjay Ghemawat)診斷出了外太空問題。
迪恩解釋說,谷歌搜索服務(wù)在廉價(jià)的硬件上運(yùn)行,“它們就像是用打包電線和口香糖捆綁構(gòu)成的”,因此它容易受到“極低概率事件”的影響。
迪恩稱:“來自外太空的特定射線會(huì)進(jìn)入地球,并擊中存設(shè)備的存儲(chǔ)單元上,將0或1翻轉(zhuǎn)為1或0。如果有人正在處理大量數(shù)據(jù),這種情況尤其糟糕,因?yàn)橥蝗恢g,數(shù)據(jù)中有些隨機(jī)位將被翻轉(zhuǎn)和損壞。”
他補(bǔ)充說:“目前大多數(shù)機(jī)器都有類似問題的硬件保護(hù)措施。但是,谷歌早期使用的機(jī)器并沒有真正做到這一點(diǎn)。”
然而,近年來,谷歌的***機(jī)器吸引了迪恩的全部關(guān)注,而該公司大膽命名的“Brain Team”也是如此。這個(gè)團(tuán)隊(duì)的使命是“使機(jī)器智能化,改善人們的生活”。即使目前谷歌的人工智能應(yīng)用更顯平淡無奇,這一使命也令人覺得雄心勃勃。
機(jī)器學(xué)習(xí)使谷歌用戶能夠通過搜索照片中出現(xiàn)的對(duì)象(例如,通過鍵入Cake或Cat)來檢索照片,而且機(jī)器學(xué)習(xí)也是語音識(shí)別工具的開發(fā)基礎(chǔ),語音識(shí)別工具可以將多種語言的音頻轉(zhuǎn)換為文本。
谷歌的翻譯工具是其AI團(tuán)隊(duì)的另一個(gè)成功之處,但也提供了一個(gè)早期的例子,說明算法可以“向現(xiàn)實(shí)世界學(xué)習(xí),而不是向我們希望的世界學(xué)習(xí)”。
與偏見作斗爭(zhēng)
迪恩解釋說,當(dāng)一個(gè)算法被輸入大量文本時(shí),它將自學(xué)如何識(shí)別通常組合起來的單詞。
迪恩稱:“舉例來說,你可能知道這樣的問題,即算法經(jīng)常將醫(yī)生更多地與‘他’而不是‘她’聯(lián)系在一起,而將護(hù)士更多地與‘她’而不是‘他’聯(lián)系起來。但你也會(huì)知道,外科醫(yī)生與手術(shù)刀有關(guān),木匠與錘子有關(guān)。因此,這些算法的優(yōu)點(diǎn)在于,它們可以學(xué)習(xí)這些類型的模式和相關(guān)性。”
迪恩表示,這項(xiàng)任務(wù)是找出你想讓算法找出哪些偏見,而他的團(tuán)隊(duì)和AI領(lǐng)域的許多人都在努力探索這背后的科學(xué)。迪恩稱:“很難說我們是否能找到***的無偏見算法。”
職業(yè)社交網(wǎng)站LinkedIn創(chuàng)始人艾倫·布魯(Allen Blue)
公司努力解決這些問題的一個(gè)令人驚訝的例子是職業(yè)社交網(wǎng)站LinkedIn。當(dāng)其5.62億用戶登錄到自己的賬戶上時(shí),他們會(huì)得到關(guān)于工作和聯(lián)系人的獨(dú)特建議,而這些都是由AI提供支持的。更重要的是,使用LinkedIn的招聘人員會(huì)收到一份經(jīng)過機(jī)器學(xué)習(xí)篩選的理想候選人名單。
但LinkedIn聯(lián)合創(chuàng)始人艾倫·布魯(Allen Blue)很快就發(fā)現(xiàn)了這個(gè)過程中存在的一個(gè)問題,即女性在入圍名單上的排名還不夠高。布魯說:“我們所能做的就是說:‘好吧,我們會(huì)糾正這個(gè)算法。這樣它就能以與實(shí)際匹配搜索標(biāo)準(zhǔn)的同等比例篩選男性和女性候選人,并對(duì)他們進(jìn)行排序,以確保這些女性不會(huì)意外地被漏掉。”
更多樣性
但布魯承認(rèn),解決這個(gè)問題只是AI冰山的一角。他解釋說:“我們剛剛達(dá)到這樣的水平,即理解了如何以***的意圖構(gòu)建一種機(jī)器學(xué)習(xí)算法,但仍然無意中在結(jié)果中引入了偏見。”
布魯最喜歡引用的例子是面部識(shí)別技術(shù)。他稱:“***個(gè)版本面部識(shí)別應(yīng)用的訓(xùn)練對(duì)象是名人照片,這些名人大多是白人和男性,這意味著白人男性的面部識(shí)別準(zhǔn)確率可達(dá)97%,而非洲女性的準(zhǔn)確率僅為3%。”他認(rèn)為,如果不增加AI算法構(gòu)建者的多樣性,就不可能有任何補(bǔ)救辦法。
早期對(duì)面部識(shí)別的嘗試遇到了偏見問題
布魯說:“當(dāng)我們觀察LinkedIn上真正擁有AI技能的人時(shí),只有22%的人是女性。” 更糟糕的是,他補(bǔ)充說:“女性的角色傾向于更注重研究,或更傾向于教學(xué),而男性的角色更傾向于領(lǐng)導(dǎo)。”
布魯承認(rèn):“每個(gè)人都有偏見,但如果女性不在這個(gè)方面提供幫助,我們就不能完全理解人們是如何設(shè)計(jì)AI的。”
盡管有這些警告,但當(dāng)談到AI的潛在積極作用時(shí),布魯和迪恩都顯得熱情洋溢。在談到招聘過程時(shí),布魯認(rèn)為,計(jì)算機(jī)甚至可以教會(huì)我們?nèi)绾蜗祟惖娜秉c(diǎn)。
洪水和地震
布魯稱:“當(dāng)你走進(jìn)去與某人面對(duì)面交談時(shí),你會(huì)得到很好的情緒解讀,或從他們身上獲得能量亦或是其他什么,這是建立在你的特質(zhì)基礎(chǔ)之上的,因此對(duì)于怎樣才能成為好員工的觀點(diǎn)是存在偏見的。AI可以幫助你從一種消除偏見的觀點(diǎn)中分離出那種良好的感覺,這就是我所說的純粹的機(jī)器與人類協(xié)作的意思。”
對(duì)于迪恩來說,谷歌的AI團(tuán)隊(duì)在世界各地的人道主義問題上所做的工作是他們最自豪的成就,比如能夠預(yù)測(cè)洪水和地震余震的系統(tǒng)。
數(shù)據(jù)隱私是今年達(dá)沃斯世界經(jīng)濟(jì)論壇的熱點(diǎn)問題
特別關(guān)注醫(yī)療保健和生物科學(xué)幫助催生了一種工具,它可以從視網(wǎng)膜圖像中診斷一種叫做糖尿病視網(wǎng)膜病變的疾病,而不需要眼科醫(yī)生介入。
迪恩在世界經(jīng)濟(jì)論壇上對(duì)AI的這些用途始終稱贊有加。在這次論壇上,諸多會(huì)議都集中討論了數(shù)據(jù)隱私和對(duì)技術(shù)的監(jiān)管問題。
就谷歌而言,迪恩相信,該公司的內(nèi)部原則將有助于防范AI的潛在濫用問題,并透露,他的團(tuán)隊(duì)“肯定決定不公布我們認(rèn)為可能會(huì)產(chǎn)生負(fù)面影響的某些成果”。
但迪恩說,防止濫用機(jī)器學(xué)習(xí)的方法是吸引合適的人類來該領(lǐng)域工作。他表示:“我們需要更多的人研究這類領(lǐng)域,更多的人對(duì)這些領(lǐng)域感到興奮,因?yàn)檫@就是我們?nèi)〉眠M(jìn)步和解決社會(huì)許多問題的方式。”(騰訊科技審校/金鹿)