惹怒程序員的下場!阿里達(dá)摩院大神難忍騷擾電話,打造“二哈”AI
不要惹怒程序員。不要惹怒程序員。不要惹怒程序員。
即便你是一年呼出 40 億次的機(jī)器人騷擾電話。
在 3.15 晚會曝光機(jī)器人撥打騷擾電話黑色產(chǎn)業(yè)鏈后,大眾震驚,輿論嘩然,AI 從業(yè)者痛心。
沒想到最前沿的 AI 技術(shù),正被別有用心企業(yè)引向黑暗面。
但數(shù)小時后,阿里就宣布推出防騷擾電話 AI 技術(shù),稱機(jī)器人的問題交給機(jī)器人對付。
在放出的視頻 Demo 中,阿里 AI 實驗室推出防騷擾電話 AI,并且在一段完整推銷電話中,人類女推銷員一方,全程毫無察覺……
其后,阿里還在支付寶小程序和天貓精靈 App 推出開放體驗,反饋也不錯。
當(dāng)然,聶再清也未曾料到,自己的業(yè)余項目,就這樣受到如此***的關(guān)注。
這位阿里巴巴 AI 實驗室語音助手***科學(xué)家、阿里 AI 北京研發(fā)中心負(fù)責(zé)人,前微軟亞洲研究院***研究員解釋項目初衷時說:
經(jīng)常收到騷擾電話實在太煩了,而且團(tuán)隊開會,經(jīng)常被各種電話騷擾、打斷,以致會都沒法兒開,于是就想——能不能用技術(shù)的方式解決一下。
于是,阿里防騷擾電話 AI“二哈”就此誕生。
讓機(jī)器對付機(jī)器
在阿里 AI 實驗室內(nèi)部,“二哈”是這個智能防騷擾電話技術(shù)的項目代號。
當(dāng)用戶在手機(jī)上開通了這項服務(wù),在接到騷擾來電時,用戶可以直接轉(zhuǎn)接給機(jī)器人接聽。
阿里還放出演示視頻,展示“二哈”的工作狀態(tài)。
當(dāng)一名推銷貸款的女推銷員接入電話后,1 分鐘時間內(nèi),“二哈”不但對答如流,甚至化被動為主動,向這她咨詢“北京能不能貸款?”“最多能貸多少錢?”
甚至還在對話中“調(diào)戲”道:“你之前給我打過電話吧,聽起來挺耳熟的?”全程中女推銷員絲毫沒有察覺到與自己通話的是一個機(jī)器人。
***,“二哈”AI 還被女推銷員索要“微信號”。
視頻一出,微博上就炸了鍋。
有吃驚的,“不看標(biāo)題根本不會知道有機(jī)器人。”
有提出小建議,搞“機(jī)機(jī)大戰(zhàn)”的:
還有來自 AI 學(xué)者的評價,比如清華大學(xué)劉知遠(yuǎn)就說,不僅防騷擾,還能變相收集數(shù)據(jù)集,點贊了該技術(shù)應(yīng)用。
另外,阿里 AI 實驗室旗下的“天貓精靈”還表示,這是一個已經(jīng)通過了很多人的“圖靈測試”的機(jī)器人,現(xiàn)在就可以打開天貓精靈 App 或支付寶搜索天貓精靈調(diào)戲“二哈”了。
總之,AI 的問題,正在由 AI 解決。
技術(shù)原理:智能聊天
阿里 AI 北京研發(fā)中心負(fù)責(zé)人聶再清博士解釋,“二哈”背后,主要使用了智能聊天技術(shù)。
所謂“智能聊天”,需要理解用戶請求,同時用強(qiáng)大的知識圖譜制作聊天的知識點,通過跟用戶對話,把知識圖譜里的知識灌輸給用戶,同時也引導(dǎo)用戶反饋。
該過程中,AI 跟用戶聊的越多越好,AI 會學(xué)到很多知識,用戶聊完以后也會“教學(xué)相長”并慢慢把 AI 當(dāng)朋友。
更具體來說,智能聊天是用深度強(qiáng)化學(xué)習(xí)來學(xué)習(xí)對話策略的,因為不是精度要求非常高的任務(wù)完成。
所以就算 AI 聊錯一點,沒有多大的關(guān)系,用戶只是會對這個回復(fù)不太高興(不像任務(wù)完成時需要 100% 準(zhǔn)確完成主人的任務(wù))。
通過強(qiáng)化學(xué)習(xí),下次對話策略算法就可能更好地知道,到底應(yīng)該怎么和這類用戶聊天。
如果從垂直技術(shù)應(yīng)用劃分,過程中交叉使用了語音識別、NLP、知識圖譜,以及語音合成(TTS)等技術(shù)。
聶再清解釋:
首先用到了語音識別技術(shù)把用戶的語音轉(zhuǎn)成文字。
接著自然語言理解技術(shù),把來電者的意圖和具體的槽值抽取出來。
緊接著對應(yīng)到一個精準(zhǔn)的知識圖譜上面去,這樣“二哈”就能把用戶輸入和現(xiàn)實世界的人與物聯(lián)系起來。
然后,基于對用戶當(dāng)前輸入的理解以及歷史交互的上下文信息,“二哈”需要決定下一句應(yīng)該是回答來電者的一個問題還是給來電者提一個問題。
***,二哈還需要用的語音合作技術(shù)(TTS)把文字變成人聲。
但聽起來章法清晰、步驟明確,要真正做到真假難辨卻不容易。
如何做到真假難辨?
聶再清認(rèn)為核心要做到以下 3 大方面:
***,接住用戶的每一句話。
因為用戶的輸入空間非常大,要理解和聰明的回復(fù)來電者的每一句話很有難度。
對于一些不是“二哈”知識領(lǐng)域的問題,阿里 AI 目前采用了閑聊(ChitChat)的技術(shù),從互聯(lián)網(wǎng)上公開的人類對話庫中來找到最適合回復(fù),這是一種基于 information retrieval 思路來找到排名***的相關(guān)回復(fù)。
目標(biāo)是讓來電者看不出“二哈”可能的知識缺乏。
第二,主動提出一個相關(guān)問題。
這更多是一個對話策略學(xué)習(xí)的工作,需要讓來電者知道“二哈”真能理解他們的話,并提出只有理解了對話上下文,才能提出的好問題。
一味被動接話,很容易被識破。
該項挑戰(zhàn)非常大,聶再清在 2018 年 AAAI 上有一篇參與發(fā)表的論文(CoChat: Enabling Bot and Human Collaboration for Task Completion),核心就是提出一套聊天機(jī)器人對話策略學(xué)習(xí)框架,讓“二哈”這樣的聊天機(jī)器人在不同的場景下都可以持續(xù)學(xué)習(xí)。
包括監(jiān)督學(xué)習(xí)、在線學(xué)習(xí)、和深度強(qiáng)化學(xué)習(xí)(使用 sentiment analysis 提供獎懲反饋信號)。不同的聊天機(jī)器人根據(jù)自己的場景要求可以選擇使用不同的學(xué)習(xí)策略。
比方說有人工 worker 的客服領(lǐng)域就可以更多使用在線學(xué)習(xí),“二哈”這樣的機(jī)器人可以用監(jiān)督學(xué)習(xí)啟動,深度強(qiáng)化學(xué)習(xí)不斷進(jìn)步。
并且通過和人類不斷對話,“二哈”AI 會通過深度強(qiáng)化學(xué)習(xí)越來越好地知道如何提問才能更好地達(dá)成他的目標(biāo)。
***,像真人一樣的語音語調(diào)以及停頓。
如果推銷廣告的騷擾電話,通過聲音判斷初接電話的是個機(jī)器人,他們就不會繼續(xù)聊下去了。
所以“二哈”在語音合成(TTS)方面做了很多工作。
阿里 AI ***算法利用 Tacotron 加上基于神經(jīng)網(wǎng)絡(luò)的聲碼器算法,合成出極其逼真的人聲,但遺憾的是還有很大比例情況不能通過圖靈測試。
于是“二哈”現(xiàn)在采取了過渡性方案,把非常高頻的回復(fù)借用真人錄播。但毫無疑問,未來該方案會不斷減少。
而且值得注意的是,“二哈”最初只是一個課余項目。
不要惹怒程序員
“二哈”研發(fā)初衷,實在是對日益普遍的騷擾電話很生氣。
聶再清說,自己一直都是同一個電話號,于是泄露越來越嚴(yán)重,經(jīng)常收到騷擾電話。
還影響到團(tuán)隊工作,會議進(jìn)行中,同事們經(jīng)常被各類電話打斷導(dǎo)致會議終中斷,于是開始思考著如何用技術(shù)的方式解決。
而且更可氣的是,大量騷擾電話是機(jī)器自動撥出的,成本越來越低。
此外也算天時地利人和。
在阿里 AI 實驗室,聶再清團(tuán)隊負(fù)責(zé)天貓精靈的算法,所以所有相關(guān)人才團(tuán)隊里都有:語音識別、NLP、知識圖譜……全鏈條覆蓋。
并且跟語音助手一致,智能對話的基礎(chǔ)算法也都通用。
于是他們先以“課余”項目開始,興趣驅(qū)動,參與的工程師都很開心,一方面是解氣,另一方面也是知道背后帶來的意義。
其后一切也進(jìn)展飛快,最終在本月月初,開始向公司申報,并立項啟動。
沒想到在今年 3.15 晚會上,機(jī)器人騷擾電話引起如此大關(guān)注。
于是團(tuán)隊決定公開***研發(fā)成果,“二哈”也正式從幕后走到臺前。
一炮而紅。
AI 電話秘書
但“二哈”就只是幫對付騷擾電話而已嘛?
不。
聶再清說,“二哈”的進(jìn)一步的目標(biāo)是成為每個人的 AI 電話秘書,除了幫主人應(yīng)付騷擾電話,還可以在主人繁忙的時候詢問來電的主要意圖,也能幫主人預(yù)約議程。
而且相比之前人類的電話、議程為工作核心的秘書助理,“二哈”這樣的 AI 電話秘書,可以利用個性化 TTS,模仿出跟主人聲音極盡逼真的聲音。
另外,這樣的目標(biāo)也并不是遙不可及的“憧憬”。
至少現(xiàn)在,利用“二哈”實現(xiàn) AI 呼叫轉(zhuǎn)移,已經(jīng)不再是技術(shù)難題。
AI 可以在你不方便接電話時幫接聽來電,并轉(zhuǎn)換成文字向你“匯報”。
你愿意為這樣的 AI 服務(wù)買單嗎?