自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

三角獸亓超:如何消除機(jī)器對(duì)人類的誤解

原創(chuàng)
網(wǎng)絡(luò) 通信技術(shù)
7月21日下午WOTI2017主會(huì)場(chǎng),三角獸聯(lián)合創(chuàng)始人&CTO亓超進(jìn)行了主題為《如何消除機(jī)器對(duì)人類的誤解》的精彩演講。51CTO記者將持續(xù)為您帶來(lái)WOTI2017全球創(chuàng)新技術(shù)峰會(huì)前方精彩報(bào)道。

【51CTO.com原創(chuàng)稿件】2017年7月21日-22日,由51CTO主辦的以人工智能為主題的WOTI2017全球創(chuàng)新技術(shù)峰會(huì)在北京富力萬(wàn)麗酒店隆重舉行。峰會(huì)期間,30+AI明星,數(shù)十場(chǎng)圍繞人工智能主題的精彩演講與圓桌論壇緩緩揭開面紗。除了場(chǎng)內(nèi)的精彩演講,場(chǎng)外還有專門為AI愛好者搭建的動(dòng)手實(shí)驗(yàn)室和科技體驗(yàn)區(qū),這一切都讓本次大會(huì)亮點(diǎn)十足。

7月21日下午WOTI2017主會(huì)場(chǎng),三角獸聯(lián)合創(chuàng)始人&CTO亓超進(jìn)行了主題為《如何消除機(jī)器對(duì)人類的誤解》的精彩演講。以下是演講實(shí)錄,讓我們先睹為快!

[[197682]]
三角獸聯(lián)合創(chuàng)始人&CTO亓超


大家好,我是亓超。三角獸公司的名字特別奇怪,這個(gè)名字來(lái)自于我們?nèi)齻€(gè)創(chuàng)始人,我們?nèi)齻€(gè)是相對(duì)互補(bǔ)的團(tuán)隊(duì),其中一位,我們倆都是百度的同事,還有一位負(fù)責(zé)品牌宣傳,之前在安利中國(guó)、奧美公關(guān)工作。我們希望解決的問題是語(yǔ)義部分,涉及到人機(jī)交互系統(tǒng)面臨的問題,今天的主題希望從技術(shù)方面分享,因?yàn)槲矣X得CTO主要責(zé)任是解釋技術(shù)的問題,把握技術(shù)的方向等等內(nèi)容。

人機(jī)交互的事情并不是特別新的話題,希望人能夠和機(jī)器自由對(duì)話,讓機(jī)器理解人類語(yǔ)言,執(zhí)行人類下達(dá)的任務(wù),或者說(shuō)跟它有一些更自然的溝通。所以從歷史上來(lái)說(shuō),經(jīng)歷了許多起起落落,在AI行業(yè),特別是最近幾年有幾次波峰和波谷的狀態(tài)。最近幾次,語(yǔ)音技術(shù)的突破,語(yǔ)音識(shí)別和合成質(zhì)量比之前高很多,之后帶動(dòng)了一波語(yǔ)音助手產(chǎn)品出現(xiàn),隨之大家意識(shí)到這種產(chǎn)品慢慢從市場(chǎng)逐漸的消亡掉,變成了低落時(shí)期。隨著近幾年發(fā)展又出現(xiàn)更多產(chǎn)品,市場(chǎng)有抬頭趨勢(shì),特別是最近國(guó)家發(fā)布了戰(zhàn)略目標(biāo),把AI技術(shù),或者說(shuō)這種概念,往上帶動(dòng),隨之有很多產(chǎn)品出現(xiàn),比如微軟小冰、百度糯米等等產(chǎn)品。

主要由幾部分構(gòu)成,第一部分是自由的和人類對(duì)話,所有不能理解和不能捕獲的語(yǔ)言都會(huì)拋出一個(gè)自然搜索的結(jié)果,這是對(duì)對(duì)話過(guò)程的中斷。而且,自然的溝通免不了要有一些無(wú)目的的、無(wú)任務(wù)驅(qū)動(dòng)的聊天過(guò)程。所以在這里,必要的一個(gè)方面是像人一樣能夠更順暢的和人進(jìn)行開放領(lǐng)域的聊天對(duì)話。第二部分是作為機(jī)器人,作為某一方面或者某一領(lǐng)域的工具來(lái)講,它還要給人類提供一些服務(wù)或者信息,包括問答的技能,或者說(shuō)我要幫你達(dá)成訂餐、訂機(jī)票的服務(wù)功能。還有主動(dòng)行為,因?yàn)橹悄芷嚥还怏w現(xiàn)在應(yīng)答,還體現(xiàn)在主動(dòng)方面,能夠理解你,同時(shí)推送你希望獲取的信息或者希望獲取的服務(wù)。

整個(gè)人機(jī)交互系統(tǒng)涉及的技術(shù)模塊非常多,可以認(rèn)為是自然語(yǔ)言處理或者相關(guān)的技術(shù)大集成,作為整體技術(shù)的出口呈現(xiàn)。這張圖想表達(dá)從底下往上是逐步集成的過(guò)程,最底層設(shè)計(jì)的技術(shù)包括深度學(xué)習(xí),強(qiáng)化學(xué)習(xí),還有自然語(yǔ)言處理的基本技術(shù),這個(gè)作為基礎(chǔ)的模塊,需要系統(tǒng)里必須打造成非常好的強(qiáng)壯的基礎(chǔ)。另外涉及到語(yǔ)義和信息檢索,讓機(jī)器去理解人類的語(yǔ)言,免不了要教他內(nèi)容,或者學(xué)知識(shí),這些知識(shí)的來(lái)源通過(guò)數(shù)據(jù)實(shí)現(xiàn),我們要做很多數(shù)據(jù)挖掘的工作。

從下往上看第二層,技術(shù)組合模塊,包括自然語(yǔ)言理解,決策過(guò)程,推薦,還有知識(shí)庫(kù),還有計(jì)劃的推論,或者分類聚類以及情感的分析,這些都是對(duì)話機(jī)器人不可缺少的模塊。淺綠色部分是集成,形成子系統(tǒng),包括開放領(lǐng)域的聊天系統(tǒng),基于檢索的問答系統(tǒng),基于結(jié)構(gòu)化數(shù)據(jù)的檢索系統(tǒng),還有任務(wù)驅(qū)動(dòng)的對(duì)話系統(tǒng)。希望它能夠更清楚理解用戶狀態(tài),我們需要借助用戶信息用戶模型的技術(shù),對(duì)人實(shí)現(xiàn)個(gè)性化的體現(xiàn)更好。最后是主題推薦。再往上層是系統(tǒng)API層面的集成,把子系統(tǒng)分裝成對(duì)外服務(wù),展示成不同硬件或者不同的產(chǎn)品形態(tài)。這里強(qiáng)調(diào)幾個(gè)方面,和大家分享一下三角獸人機(jī)交互系統(tǒng)對(duì)主要方向的理解。

第一個(gè)是人機(jī)交互聊天,他希望機(jī)器表現(xiàn)的更像人,具有和人無(wú)限領(lǐng)域的對(duì)話,就像你的朋友,可以和你聊一些他感興趣、你也感興趣的話題。這里涉及的方方面面很多,包括無(wú)目的聊天和有任務(wù)驅(qū)動(dòng)的系統(tǒng),需要一個(gè)控制模塊,能夠把這些內(nèi)容和系統(tǒng)集成在一起,并且能夠做輔助決策,這個(gè)決策舉一個(gè)例子。比如用戶說(shuō)了蘋果這句話,它的意義很多,有可能是范冰冰演的電影,也可能是一個(gè)水果,通過(guò)電商渠道購(gòu)買的商品;可能是一個(gè)公司,他希望了解蘋果公司的新聞;到底該是哪個(gè)服務(wù)來(lái)完成,需要控制,整合聊天的事,對(duì)話的上下關(guān)系,以及用戶的興趣點(diǎn),最終決策出一個(gè)真正應(yīng)該響應(yīng)的問題。這里就是我們開放語(yǔ)對(duì)話,在你沒有這種驅(qū)動(dòng)的時(shí)候整個(gè)對(duì)話往下順暢進(jìn)行,當(dāng)你沒有辦法決策出我應(yīng)該往哪個(gè)服務(wù)進(jìn)行,又不希望你的對(duì)話表露尷尬,開放語(yǔ)聊天起的很大作用是順暢整個(gè)對(duì)話過(guò)程,引導(dǎo)出更多的信息需求和服務(wù)需求,滿足這樣的基礎(chǔ)。

我們之前做度秘、小冰這樣產(chǎn)品的時(shí)候有幾個(gè)數(shù)據(jù)可以看到,70%以上用戶的PV屬于開放聊天對(duì)話,這里是人機(jī)對(duì)話系統(tǒng)做的很好的標(biāo)準(zhǔn),自由開放的對(duì)話能力。有很多種實(shí)現(xiàn)方式,在產(chǎn)品間使用最好的方式是基于檢索,基于檢索分成大概兩部分內(nèi)容實(shí)現(xiàn)。第一部分是PPT最下方,我們需要從互聯(lián)網(wǎng)公開資料獲取大量文本,來(lái)自于人和人日常對(duì)話,通過(guò)深度學(xué)習(xí)和機(jī)器學(xué)習(xí)的手段,來(lái)完成人和人之間發(fā)生對(duì)話,人和人之間的對(duì)話是必要的手段,我們這里也下很大精力去挖掘數(shù)據(jù),我們現(xiàn)在積累的是500億(英文),來(lái)自于社區(qū)、論壇。這些語(yǔ)料我們需要清洗,把人與人之間對(duì)話隱私數(shù)據(jù)洗掉,變成可以用來(lái)直接在系統(tǒng)使用的數(shù)據(jù)。在線上的時(shí)候,我們會(huì)用各種模型和算法擬合這個(gè)數(shù)據(jù),當(dāng)用戶發(fā)一個(gè)問題給機(jī)器人的時(shí)候,我們找歷史上某一個(gè)人說(shuō)的非常相似的話,同時(shí)把對(duì)方回復(fù)的話作為信息的特征,變成一個(gè)可以用來(lái)回復(fù)的后續(xù)。

另外一個(gè)方法在學(xué)術(shù)界比較流行的方法,跟剛才的區(qū)別是,系統(tǒng)里面需要一個(gè)大的搜索引擎,或者語(yǔ)料檢索系統(tǒng),搜索人和人之間的對(duì)話哪句相似,把剛才的語(yǔ)料在線下搜索出概率模型,一般我們用深度學(xué)習(xí)比較重要的兩個(gè)模型,去擬合數(shù)據(jù),線上不需要檢索這個(gè)過(guò)程,而是一個(gè)詞一個(gè)詞生成我們應(yīng)該回復(fù)的話。

剛才聊的話題屬于有無(wú)目的的驅(qū)動(dòng)對(duì)話,像你和朋友之間的聊天范疇。還有一種對(duì)話方式是有目的的,比如訂票,或者完成點(diǎn)餐操作的機(jī)器人,這種機(jī)器人對(duì)話是有任務(wù)目的驅(qū)動(dòng)的。我們希望聊的時(shí)間越長(zhǎng)越好,機(jī)器人和人能夠無(wú)縫交流,這里有幾個(gè)產(chǎn)品給大家。像度秘聊天系統(tǒng)最好的是一個(gè)男孩子兩個(gè)月和它聊過(guò)兩萬(wàn)多句,這兩萬(wàn)多句能夠挖掘出很多工具里沒有體驗(yàn)到的數(shù)據(jù)或者用戶的個(gè)性化特點(diǎn)。另外,機(jī)器人最終要服務(wù)于人,這部分希望越來(lái)越好,好比我去餐廳點(diǎn)菜,我不希望和餐廳服務(wù)員進(jìn)行多輪對(duì)話,我希望越快越好,點(diǎn)菜完成就好。這個(gè)過(guò)程中我希望以最短路徑實(shí)現(xiàn),另外一種不同架構(gòu)方式,分成大概四個(gè)部分。

第一個(gè)是我們要理解對(duì)方說(shuō)話的意思,這里包含兩個(gè)部分,一個(gè)是我要了解這句話的意圖,比如訂票,或者希望查一條信息,這個(gè)意圖分析出來(lái)之后,我們需要在該意圖之下分析表象,比如北京到上海的飛機(jī)票。第二個(gè)是為了完成任務(wù),我們需要收集不同種類的狀態(tài),比如訂機(jī)票,我們還要獲取他希望訂什么時(shí)間的機(jī)票,這個(gè)情況下我們要維護(hù)一個(gè)狀態(tài),收集的集合,看我們現(xiàn)在已經(jīng)收集的狀態(tài),是不是足夠完成這個(gè)任務(wù),如果不足夠的話,第三階段就同時(shí)做出一個(gè)策略,去詢問澄清或者直接展示某一個(gè)結(jié)果。第四個(gè)是機(jī)器人回復(fù),有任務(wù)驅(qū)動(dòng)的機(jī)器人一般是通過(guò)產(chǎn)品經(jīng)理設(shè)計(jì),通過(guò)模板這樣的方式去生成回復(fù)的話。

以上是兩類機(jī)器人,一個(gè)是有任務(wù)驅(qū)動(dòng)的機(jī)器人,一個(gè)是無(wú)任務(wù)驅(qū)動(dòng)的機(jī)器人,對(duì)話機(jī)器人實(shí)現(xiàn)的方式。反過(guò)來(lái),比較抽象,我們?cè)趺丛u(píng)判一個(gè)機(jī)器人,它好還是壞?下面舉幾個(gè)例子,把剛才不同種類的機(jī)器人做一個(gè)對(duì)比。

第一個(gè),我們先對(duì)開放機(jī)器人做對(duì)比,我們希望一個(gè)機(jī)器人,它的對(duì)話首先是相關(guān)的,你說(shuō)吃飯了嗎,他告訴你我還不困,這樣的對(duì)話是沒辦法持續(xù)下去的,所以相關(guān)性是需要衡量的。在此基礎(chǔ)上,需要討論趣味性,即使對(duì)方是個(gè)人,你也很有可能出現(xiàn)聊不下去的情況,比如他總呵呵,或者總讓你喝熱水,這樣的話一個(gè)正常人也沒辦法讓對(duì)話進(jìn)行下去,所以趣味性也是維持對(duì)話的質(zhì)量標(biāo)準(zhǔn)和因素。再是滿意度,如果每句話都聊的相關(guān)也有趣,但整體像神經(jīng)質(zhì)的人,東一句西一句幫你做牽扯,這個(gè)體驗(yàn)也不好。所以要衡量自然度和順暢度。第三是用戶活躍度,從兩方面衡量,第一個(gè)是每個(gè)人平均給機(jī)器人對(duì)話多少輪,第二個(gè)是同樣用戶平均來(lái)多少次,用戶平均對(duì)話次數(shù),以此來(lái)評(píng)判機(jī)器人好壞。

這是相關(guān)不相關(guān)、趣味不趣味的例子,人工方式打分,聊天機(jī)器人偏主觀,仁者見仁,智者見智,所以一般這樣的評(píng)估會(huì)采用多人共同去打同樣的數(shù)據(jù),這樣的評(píng)估方式,最終取一個(gè)平均分。順暢度、自然度也是主觀打分。這是一些例子,越高的分越好,越低的分越不好,當(dāng)一個(gè)機(jī)器人每一句話都清楚,但每一句話所說(shuō)的內(nèi)容都不是你喜歡的,你對(duì)這個(gè)機(jī)器人的印象肯定也很低,所以這里有一個(gè)主觀打分。這是對(duì)客觀數(shù)據(jù)的舉例。

另一方面,對(duì)任務(wù)驅(qū)動(dòng)的對(duì)話評(píng)估系統(tǒng)分為四個(gè)維度,第一個(gè)是意圖識(shí)別維度,準(zhǔn)不準(zhǔn)。第二個(gè)是召回情況。第三個(gè)是policy完成情況,當(dāng)這個(gè)任務(wù)需要多輪完成,這樣的系統(tǒng)肯定打分比較低。另外一個(gè),沒有幫你完成對(duì)話目標(biāo),這是非常重要的因素。第四個(gè)是自然語(yǔ)言生成,看可理解的程度和自然度。舉一個(gè)例子,在意圖識(shí)別這塊,來(lái)首劉德華的歌,這是作為正例,負(fù)例是你喜歡劉德華嗎,這兩句話都提到了歌手的名字,但第一句話是希望找到這首歌嗎,是正確的,第二個(gè)是開放的問題。槽粒度的召回率和準(zhǔn)確率,比如來(lái)首劉德華的今天,我雖然能夠理解他找首歌的意圖,但如果把今天放在前面,今天來(lái)首劉德華的,意思就完全不一樣了。這里要評(píng)估的是這樣的情況,如果我們希望正確播出這首歌的話,我們需要解析出歌手是劉德華,今天是這首歌的項(xiàng)目,如果都解析出來(lái)就是對(duì)的。

這個(gè)舉例還是在找歌的意圖下,我們希望交互過(guò)程能夠順利完成的任務(wù),第一個(gè)例子認(rèn)為完成率是已經(jīng)達(dá)成,系統(tǒng)會(huì)播出這首歌,非常好。下邊的對(duì)話是說(shuō)了很多次他也沒有理解,最終用戶放棄了,交互以失敗為告終,這是任務(wù)未完成的舉例。右邊是判斷完成的情況,一輪是我們最希望看到的情況,如果系統(tǒng)和用戶交互非常多輪,這個(gè)時(shí)候用戶基本上會(huì)失去耐心,我們看到很多音箱也好,車載交互方式,都會(huì)讓人很尷尬的狀態(tài),你說(shuō)很多次他都沒有分析出來(lái),讓你失去了耐心,下次再使用的概率就很小了。

以上是我們對(duì)人機(jī)對(duì)話領(lǐng)域的拆解,包括一些技術(shù)實(shí)現(xiàn)的方式和舉例,這塊展開來(lái)講可能需要花很長(zhǎng)時(shí)間,今天也是拋磚引玉,給大家做這樣一個(gè)討論。

三角獸在這方面一直在做落地解決方案,首先是toB,我們的合作方目前來(lái)說(shuō)有PPT上的這些羅列,當(dāng)然這個(gè)不全,我們包括幾大領(lǐng)域,硬件方面,除了手機(jī)也包括智能音箱,還有小米電視這些解決方案。另外是跟一些企業(yè)合作,例如商場(chǎng),媒體,一起打造機(jī)器人。另外,我們和BAT公司也有很好的合作,現(xiàn)在和阿里、騰訊、百度都有聊天對(duì)話系統(tǒng)。

可能大家了解三角獸是從老羅那個(gè)發(fā)布會(huì),我們錯(cuò)被叫成獨(dú)角獸,老羅當(dāng)場(chǎng)也做了修正,我們并沒有給手機(jī)植入整體對(duì)話解決方案,而是把對(duì)話的分詞模塊嵌入到里面,最近這個(gè)事又重新炒起來(lái)了。我們進(jìn)行了語(yǔ)義片段解析,很多大塊模塊超過(guò)詞的范疇,三角獸作為手機(jī)本地解決方案,盡可能用非常小的手機(jī)資源完成最小的切入準(zhǔn)確率。今年3月份,們首次在小米電視發(fā)布會(huì)上植入了語(yǔ)義交互系統(tǒng),我們解決了用戶在使用小米電視時(shí)通過(guò)語(yǔ)音方式找到他想看的電視資源。

小米電視作為互聯(lián)網(wǎng)電視他已經(jīng)有了更多承載的內(nèi)容資源,不太像我們小時(shí)候看電視幾十個(gè)頻道用一個(gè)遙控器就能解決,現(xiàn)在成千上百萬(wàn)的電視資源,語(yǔ)音交互是很好的體驗(yàn),我們又不希望只是做一個(gè)遙控器,如果只是做一個(gè)遙控器是語(yǔ)音廠商就能解決的問題,我們需要解決的是用戶在找電影、電視劇的時(shí)候,經(jīng)常記不住一個(gè)電影的名字,或者沒有辦法記住全稱,比如《肖申克的救贖》,大部分搜肖申克。還有的沒辦法記住正確的名字,比如英劇《神探夏洛克》,但很多人會(huì)把它叫神探夏洛特,如果不加語(yǔ)義理解可能就會(huì)變成《夏洛特的煩惱》。所以我們?cè)谛∶捉鉀Q方案上會(huì)解決兩個(gè)問題,當(dāng)你記不住電影的名字,或者記不住準(zhǔn)確完整的電影名字的時(shí)候,我?guī)湍阏Z(yǔ)義糾錯(cuò)。另外,就像男人和女人逛商場(chǎng)不一樣的角度,很多人是直指目標(biāo),很多人是瀏覽行為,我們需要借助數(shù)據(jù)挖掘技術(shù),把電影打上標(biāo)簽,然后加上語(yǔ)義理解,這個(gè)場(chǎng)景下解決,我希望找到一部奧斯卡里男主角非常帥的電影,來(lái)自用戶電影的影評(píng),來(lái)自粉絲對(duì)貼吧的討論,我們把電影加入豐富的文本表示,在線上做語(yǔ)義匹配理解,找到他可能想要的電影范圍,然后由他做進(jìn)一步的選擇。

這個(gè)是我們另外一個(gè)的合作落地,是香港新世界集團(tuán),這里想打造一個(gè)場(chǎng)景,商場(chǎng)一樓咨詢臺(tái)變成移動(dòng)咨詢臺(tái),因?yàn)槊看稳ド虉?chǎng)我都有個(gè)困惑,我希望找的商戶經(jīng)常沒有辦法找到準(zhǔn)確位置,甚至要去問服務(wù)員,甚至廁所在哪都要問。這個(gè)時(shí)候就希望有個(gè)隨身帶著的咨詢臺(tái),問有關(guān)商場(chǎng)的問題,甚至幫我引導(dǎo)出我的興趣點(diǎn)。從左往右不同對(duì)話的機(jī)器人,你可以隨便聊天,像小冰一樣,幫你解決問題并對(duì)話順暢。第二個(gè)是咨詢類對(duì)話,包括怎么停車、營(yíng)業(yè)時(shí)間等等跟商場(chǎng)有關(guān)的信息問答。第三個(gè)著重解決兩個(gè)場(chǎng)景,一個(gè)是餐飲推薦,另外是零售導(dǎo)購(gòu),它希望幫你解決當(dāng)你不知道這個(gè)商場(chǎng)有什么餐廳,但你又有吃飯需求的時(shí)候,我們幫你推薦餐館,這樣的機(jī)器人,加微信公眾號(hào),能夠給購(gòu)物帶來(lái)新的體驗(yàn)。以上是我今天分享的所有內(nèi)容,謝謝大家!

51CTO記者將持續(xù)為您帶來(lái)WOTI2017全球創(chuàng)新技術(shù)峰會(huì)前方精彩報(bào)道,敬請(qǐng)期待!

【51CTO原創(chuàng)稿件,合作站點(diǎn)轉(zhuǎn)載請(qǐng)注明原文作者和出處為51CTO.com】

責(zé)任編輯:劉妮娜 來(lái)源: 51CTO
相關(guān)推薦

2018-06-26 05:57:58

多云云計(jì)算公共云

2019-04-30 14:17:56

中關(guān)村零售業(yè)創(chuàng)業(yè)者

2019-12-09 10:08:00

超融合

2021-02-21 14:05:02

區(qū)塊鏈比特幣安全

2024-07-26 08:45:54

2021-03-07 16:31:20

云安全網(wǎng)絡(luò)安全網(wǎng)絡(luò)攻擊

2021-08-30 07:16:45

商業(yè)技術(shù)團(tuán)隊(duì)

2011-02-13 17:14:15

LinuxApacheNginx

2016-10-20 13:36:28

WebRTC瀏覽器服務(wù)器

2021-10-19 10:09:21

三角形個(gè)數(shù)數(shù)組

2024-01-24 13:08:00

2018-04-03 13:37:54

混合云云計(jì)算數(shù)據(jù)安全

2021-07-30 06:58:27

python實(shí)現(xiàn)三角函數(shù)

2022-03-16 14:27:49

CSS三角形前端

2022-02-16 08:21:28

CSS三角邊框動(dòng)畫SVG

2018-10-23 13:58:56

私有云云計(jì)算公共云
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)