詳解歷史上三大AI失敗案例
譯文【51CTO.com快譯】盡管今天提到的大多數(shù)事故與AI本身并無直接聯(lián)系,但卻或多或少有AI因素涉及其中。隨著AI技術(shù)的不斷改進(jìn),我們必須對代表著我們判斷方式的算法擁有充分的信心,因?yàn)樵谖磥淼膶?shí)際應(yīng)用中,算法有可能需要對復(fù)雜變量進(jìn)行決策,甚至決定著人類生命財(cái)產(chǎn)能否安全無憂。
下面,我們共同關(guān)注史上曾經(jīng)出現(xiàn)的幾個(gè)AI失敗案例。
Tay——微軟的聊天機(jī)器人
過去一年中,公認(rèn)的一大AI失敗案例正是微軟Tay:
“微軟技術(shù)研究部與必應(yīng)團(tuán)隊(duì)共同開發(fā)的聊天機(jī)器人,旨在實(shí)驗(yàn)對話交流內(nèi)容的理解能力。Tay通過輕松愉快的對話與人類用戶進(jìn)行接觸。Tay進(jìn)行過的聊天越多,其智能程度就越高,并可為您帶來更具個(gè)性化的使用體驗(yàn)。”
Tay屬于我們在自然語言理解(簡稱NLU)領(lǐng)域的一次嘗試。其學(xué)習(xí)算法負(fù)責(zé)閱讀、解釋并適應(yīng)用戶提供的書面內(nèi)容。其目標(biāo)在于以個(gè)性化方式實(shí)現(xiàn)人機(jī)交互,這也正是眾多技術(shù)巨頭希望實(shí)現(xiàn)的關(guān)鍵性戰(zhàn)略提升。與電影《她》中的假想類似,微軟希望讓Tay擁有與人相近的交流能力。在技術(shù)領(lǐng)域,商業(yè)成功通常經(jīng)由三種方式實(shí)現(xiàn):收購、參與與轉(zhuǎn)換??梢钥吹?,微軟的思路是提供完整的個(gè)性化體驗(yàn),確保其能夠通過嚴(yán)格的圖靈測試,并重新定義我們的參與途徑。
但是,當(dāng)Tay開始和人類聊天后,不到24小時(shí),她就被“教壞”了,成為一個(gè)集反猶太人、性別歧視、種族歧視于一身的“不良少女”。
Alexa錯(cuò)將色情內(nèi)容提供給兒童
通過相關(guān)視頻可以看到,兒童用戶要求Alexa“玩‘挖金子’”,但Alexa的回應(yīng)卻是“您希望收聽色情內(nèi)容……熱辣的小妞與素人美女……”(注:挖金子游戲一詞與女性賣春者相同。)雖然有人認(rèn)為問題不在AI身上,而是語音命令出了問題。這種說法有一定道理,但可以肯定的是,Alexa本身應(yīng)當(dāng)擁有通過機(jī)器學(xué)習(xí)區(qū)分語境的能力。
Inspirobot提供荒謬的建議
InspiroBot的設(shè)計(jì)初衷在于提供用戶感興趣的每日格言。然而頗為諷刺的是,其往往無法帶來能夠讓我們的一天充滿活力的正能量言論——甚至有可能以黑色幽默的方式令人陷入低落。
為何失敗?
答案可以歸納為三個(gè)方面——準(zhǔn)確度、情景與訓(xùn)練。
準(zhǔn)確度
AI技術(shù)幾乎能夠在一切行業(yè)當(dāng)中帶來實(shí)效。然而與反欺詐或者其它一些目標(biāo)更為明確的場景相比,Tay的失敗主要源自其準(zhǔn)確度的缺失。除了語法正確的交互能力之外,聊天機(jī)器人需要提供明確定義參數(shù)之外的其它回應(yīng)。由于實(shí)際用戶所提供的回應(yīng)同Tay在實(shí)驗(yàn)中所接觸過的詞匯及語法有所區(qū)別,因此很難提供一致且準(zhǔn)確的交互結(jié)果。
情景
對于這里提到的三個(gè)AI案例乃至其它各類AI方案,情景認(rèn)知仍是一大嚴(yán)峻挑戰(zhàn)。具體來說,如果大家與Tay聊天、向Alexa咨詢意見或者從InspiroBot處尋求激勵(lì),那么用戶的時(shí)間、地點(diǎn)、情感、天氣、身份、職位等因素都會影響到您對于所提供結(jié)果的解讀與評價(jià)。
Tay顯然未能充分理解會話中的情景,因?yàn)樗挠?xùn)練與交互未能考慮到多種多樣的情景因素。雖然能夠識別詞匯并在一定程度上建立一致性響應(yīng),但卻無法理解在特定背景下的含義與重要度。
同樣的,InspiroBot同樣遭遇失敗。盡管其努力提供豐富且具有通用性的建議,但卻缺乏對相關(guān)內(nèi)容的理解、意義的把握以及潛在解釋的認(rèn)知。
訓(xùn)練
大家可能都聽說過,“進(jìn)來的是垃圾,出去的也只能是垃圾”。Tay并非在內(nèi)部受控環(huán)境下進(jìn)行訓(xùn)練,而是被發(fā)布至世界范圍,通過與公眾交互進(jìn)行學(xué)習(xí)。然而在24小時(shí)之內(nèi),技術(shù)精湛的社區(qū)(特別是4chan與8chan)明顯認(rèn)為向?qū)W習(xí)算法提供有問題的內(nèi)容更加有趣。不用說,他們成功毀掉了Tay這位AI領(lǐng)域的未成年人。
在Alexa方面,情況則有所不同。通過語音命令觸發(fā)適當(dāng)響應(yīng),并通過訓(xùn)練以了解詞匯、語法、音調(diào)、語調(diào)、節(jié)奏、重音以及發(fā)音方式的意義。然而,這種將過多因素考慮進(jìn)來的作法本身令錯(cuò)誤邊界快速擴(kuò)大,并最終導(dǎo)致失敗。通過進(jìn)一步訓(xùn)練,Alexa應(yīng)該能夠?qū)W會如何識別兒童的聲音,并在必要時(shí)提示進(jìn)行家長控制。
另外,InspiroBot則可嘗試使用較少的單詞、句型模板以及經(jīng)過驗(yàn)證的積極詞匯,從而更輕松地提供真正具有激勵(lì)效果的表達(dá)。然而,這種作法本身與AI設(shè)計(jì)目標(biāo)有所沖突——大量參數(shù)過濾機(jī)制的存在并不利于機(jī)器學(xué)習(xí)的發(fā)展。
擁抱失敗
失敗是成功之母,而我們也應(yīng)當(dāng)以寬容的心態(tài)接受上述AI失敗案例。事實(shí)上,對于真正相信并期待著AI技術(shù)獲得成功的朋友,大家應(yīng)當(dāng)分享、討論、分析并嘗試解決這些失敗難題。您對于哪些現(xiàn)有AI方案感到失望?不妨在評論中聊上一聊。
【51CTO譯稿,合作站點(diǎn)轉(zhuǎn)載請注明原文譯者和出處為51CTO.com】