自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

面向NLP的AI產(chǎn)品方法論之如何做好“多輪對話管理”

企業(yè)動態(tài)
看著這個標(biāo)題我就想笑,原來的標(biāo)題是,如何做好多輪對話管理,然后我就默默的加了個引號,用于斷句。

看著這個標(biāo)題我就想笑,原來的標(biāo)題是,如何做好多輪對話管理,然后我就默默的加了個引號,用于斷句。

[[323423]]

本文是前一篇文章《NLP方法論:如何設(shè)計多輪語音對話技能》的延續(xù),本文主要討論的是對話設(shè)計,是業(yè)務(wù)設(shè)計中的重中之重。

VUI相比于GUI,沒有流程預(yù)設(shè),全程使用對話輸入,用戶可以隨意表述,無法有效控制用戶的輸入行為。

有些人會一句話表達(dá)自己的訴求,有些人不能;有些人表述啰嗦,邏輯混亂,不能一次說清所有的要點,需反復(fù)追問;有些人頻繁改變主意,機器人需要不斷理解,并適配更改意圖;有些人就是跑題大王,經(jīng)常性的多個頻道切換;有些人壓根不知道自己要啥,希望機器人給建議;有些人就是無聊,純屬挑逗機器人。有些人……

畢竟“人工智能皇冠上的明珠”,理解不了,接不好話就是人工智障。

而當(dāng)用戶想怎么說就怎么說,好比脫韁的野馬,上下文指代、否定、反問,雙重否定、以漢語言的博大精深之處,又會分分鐘教計算機做人。

  • “中國:我們這邊快完了。
  • ”“歐洲:我們這邊快完了。
  • ”“中國:我們這邊好多了。
  • ”“歐洲:我們這邊好多了。”

以上對話也是2020年3月中旬這個場景才看懂,過一段時間后,大家偶爾翻到這篇文章,未必會理解。

此前的對話管理的學(xué)術(shù)報告的定義是:“考慮歷史對話信息和上下文的語境等信息進行全面地分析,決定系統(tǒng)要采取的相應(yīng)的動作,如追問、澄清和確認(rèn)等。主要任務(wù)有:對話狀態(tài)跟蹤和生成對話策略。實現(xiàn)途徑上,目前有檢索模型、生成模型等。”

我自己提煉了一套簡單便于理解的,對話設(shè)計的本質(zhì)是管理。目標(biāo)即:通過問答行為,控制用戶的表述,明確其需求,并方便計算機理解。

還是以買電影票舉例,我們就是基于各種主副詞槽,模擬出用戶各種各樣的表述,去完成每一輪的查詢,檢索行為。從結(jié)果上而言,用戶只要確認(rèn)好4個主詞槽(為什么是4個上篇文章有討論過思路)就可以完成下單行為了。

當(dāng)用戶的話術(shù)中,一旦分析出,用戶有買電影票的意圖的時候,此時主動權(quán)就應(yīng)該完全由對話管理去掌控了。

接下來的問題是?(以買電影票場景為例)如何設(shè)計問題?

一、自己如何問?

設(shè)計話術(shù)問題之前,先要把基本功打牢固。

問題有兩種,一種是開放式,一種是封閉式。

開放問題:問題提得比較籠統(tǒng),圈定的范圍很不固定,給回答者很多自由發(fā)揮的空間。用戶回答起來比較輕松,更易于展示自己,沒有太多的壓力。

封閉問題:問題提得很具體,圈定的范圍比較固定,要求回答者在范圍內(nèi)給予明確回答。用戶會感到壓力,有種被審問的感覺。

所以,面試的時候,相親的時候,盡量提開放性問題,以方便對方自由發(fā)揮,更容易展示自己,容易發(fā)散,容易給彼此接話,也不會把天給聊死。

而在統(tǒng)計問卷,做填表,調(diào)查的時候,封閉問題更容易做到統(tǒng)計,文科生理科生的思維就在于此,要不怎么說程序員嚴(yán)謹(jǐn)刻板不浪漫呢,畢竟跟計算機打交道過多。此處沒有黑程序員的意思,畢竟我也敲過一些代碼,也認(rèn)識很多有趣的可愛的程序員。這是社會偏見,是刻板印象,不可取。

故而,我們可以對不同的提問方式做一個總結(jié)和提煉。

PS:NER(命名實體識別)常見的有時間、數(shù)字、人名、地名……等等,大家理解為方便做填空題即可,具體可以查詢百科。

回到買電影票場景,我們的核心目標(biāo)是引導(dǎo)用戶說出4個主槽位,最終完成下單的目標(biāo)。

我們可以嘗試著做下練習(xí),以便自己熟悉語感。

練習(xí)填入開放性的問題,并且自己寫上答案是為了培養(yǎng)自己“寫問句”的業(yè)務(wù)敏感度,確認(rèn)自己使用的話術(shù)是否會引發(fā)用戶的開發(fā)性回答。同樣我們可以需要做一下封閉型問句的練習(xí)。

之所以每個都寫,完全是出于幫大家理解,以及感受合適不合適。

比如確認(rèn)座位,直接替用戶選好,然后用【確認(rèn)】的問法去請求“肯定”回答,就比較合適,如果用戶不滿意可以交付給GUI,絕不推薦語音選座。

比如影片名這類,用【確認(rèn)】問句去求“肯定”回答,就不合適,有限條件下,我們無法命中用戶的喜好,視當(dāng)時的情況,用【填空】或者【選擇】比較合適

在實際的過程中,還會加入一些話術(shù)比如“為您找到……為您推薦……附近有……請問……您看這個可以么?”等語氣助詞,顯得不那么生硬。

工作中很多的同學(xué),一開始就寫句子經(jīng)常無頭緒,畢竟任何一個問句都是合理的。

語感不好的人一定要練習(xí),規(guī)避“開放問題”,同時掌握好,使用【填空】【選擇】【確認(rèn)】三種問法結(jié)構(gòu)的選擇,做到熟練應(yīng)用,在我們部門是所有人的基本功。

以后再遇見任何業(yè)務(wù),便可基于業(yè)務(wù)情況做問法選擇,做到“運用之妙,存乎一心 ”。

本階段重點:

  • 理解開放問題和封閉問題,以及封閉問題的三種方案。
  • 使用封閉問題去管理用戶答案,以便于計算機理解。

問,是非常重要的基本功,是做好對話設(shè)計的前提。

二、用戶如何答?

經(jīng)常有人說用戶的回復(fù)千奇百怪,就固定域?qū)υ捊换ザ?,事實并非如此。本章?jié)主要做預(yù)判,嘗試窮舉用戶的可能答復(fù)。

直接公布方法論,筆者歸納總結(jié)如下:

無論對話行為是單輪還是多輪,只要你把對話的機會交給用戶表述,每回復(fù)均有可能發(fā)生。讓我們來看一下各種情況,以及不同場景下的應(yīng)對方案。

(1)用戶回復(fù)歸類:跟隨

以看電影舉例,用戶如果每個都依據(jù)話術(shù),完成指定回答,很容易完成任務(wù),我私下稱這類用戶為“小乖型用戶”。

應(yīng)對策略:成功提取槽位后,推進程就好。

(2)用戶回復(fù)歸類:篩選與修訂

在對話的過程中,對方會基于自己的需求做篩選行為,亦或者是,明明需要用戶確認(rèn)當(dāng)前詞槽(確定電影場次),而用戶臨時起意,需要改此前的槽位,比如換電影,或者換影院。

首先,如果每次都讓用戶做肯定否定,必然出現(xiàn)推薦不到位不精準(zhǔn),把用戶逼成“挑選型用戶”。同時,再者,用戶也有挑挑揀揀的權(quán)力啊。我十分不好意思,稱之為“挑選型用戶”。

應(yīng)對策略:應(yīng)該基于用戶的需求,進行調(diào)整,幫助用戶完成查詢/修訂結(jié)果。

語境內(nèi)篩選,非常考慮語義理解,是做好NLP必備的功底,篩選做的好,體驗才能夠穩(wěn)穩(wěn)超過GUI,用戶有需求才篩選,當(dāng)用戶篩選完,自然最終完成填槽行為,最終達(dá)成目的。

還有一種情況,我稱之為無法處理的篩選,請看例句:

“幫我找一個高大上的電影院;好看的/有內(nèi)涵的/羞羞的電影;舒服的,觀影效果好的座位;適合我南山吳彥祖/福田劉亦菲看的電影院;”

人類看來,這是屬于無意義的前置條件,其實取決于內(nèi)容標(biāo)簽和指代關(guān)系。

例如,“我想看關(guān)于海戰(zhàn)的電影;停車比較方便的電影院;想選一個靠門的座位”,這句話在人類看來是有意義的,如果內(nèi)容層面沒有這個標(biāo)簽,篩選也無法做起,從計算機角度,我統(tǒng)一歸納為,無法處理的篩選。而不是無意義篩選。

應(yīng)對策略統(tǒng)一處理成,隨機推薦,并反饋封閉問句,請求對方的封閉回答即可。

如果你反復(fù)跟人類糾結(jié),企圖讓對方定義更為明確的篩選條件。

“抱歉,我不太明白,什么是羞羞的/有內(nèi)涵的電影。”

“抱歉,我不太明白,什么是海戰(zhàn)有關(guān)的電影。”

那又變成開放問題了,這種情況是就算是用戶給AI解釋,AI也未必聽得懂,對話變長不利于業(yè)務(wù)的后續(xù)推進,這種體驗就十分不爽了。

(3)用戶回復(fù)歸類:關(guān)聯(lián)咨詢

在某些對話語境下,很容易問出邊界外的問題,畢竟有些問題是影響用戶購買決策的。

例如用戶買機票的時候會問天氣情況,人類能懂能猜測能推理,因為這些是常識,但是計算機是否理解常識并推理,就看各家的設(shè)計了。

應(yīng)對策略:本質(zhì)上是如何處理好,任務(wù)、問答、閑聊之間的關(guān)系。其實各家都處理得不一致。

這種基于業(yè)務(wù)需求的關(guān)聯(lián)咨詢,某種意義上也是開放域了,你可以選擇認(rèn)慫,無法回答此類問題,并請求用戶重新確認(rèn)該關(guān)鍵點上的詞槽。

再者你比較負(fù)責(zé),會盡量覆蓋一些對話領(lǐng)域,并訓(xùn)練各種FAQ的響應(yīng),但要處理好交叉對話之間的記憶關(guān)系。

例如:訂機票業(yè)務(wù),下單之前。

  • AI:blablabla(介紹機票的各種情況)……需要為你預(yù)定么?
  • 用戶:哎對了,上海那天天氣怎么樣?
  • AI:blablabla……
  • 用戶:那杭州呢?
  • AI:blablabla……
  • 用戶:行吧,下單吧。

此時AI應(yīng)該如何處理?兩輪天氣對話之后的下單?好,如果用戶再問三輪,關(guān)于機場,行李托運,打折情況,然后決定下單,此時AI應(yīng)該如何處理?

以上并非杜撰,是筆者在用戶對話log后臺看到用戶的真實使用情況。

應(yīng)對策略的選擇,凡事考量性價比,在此前的一篇文章中,在思考場景和確定業(yè)務(wù)邊界的時候,應(yīng)該考量到位,此處不展開。

(4)用戶回復(fù)歸類:無意圖表述

在某些對話語境下,很容易問出邊界外的問題,畢竟有些問題是影響用戶購買決策的。

例如用戶買機票的時候會問天氣情況,人類能懂能猜測能推理,因為這些是常識,但是計算機是否理解常識并推理,就看各家的設(shè)計了。這也是一種可能存在的情況。這首先是用戶的權(quán)力,會出現(xiàn)的異常情況。亦或者是自己的語義理解覆蓋不到位,用戶的明確意圖,識別成了無意圖。

應(yīng)對策略:語義理解不到位的不討論,自己通過對話log強化語義覆蓋即可。而真的確定為無意圖表述,轉(zhuǎn)向做推薦,請求用戶確認(rèn)。

如果用戶反復(fù)選擇無意圖表述,不填槽便始終無法推進,對話進入死循環(huán),AI只需要處理,隨機回復(fù)策略即可。

(5)用戶回復(fù)歸類:命令控制

命令控制是一個全局的指令,它僅僅在特定的語境、技能、場景、流程點上完成激活行為。買電影票這個例子用命令控制的場景較少。其實相當(dāng)多的技能在某些場合會激活命令控制,比如播放類的音樂/視頻和或者游戲等。

應(yīng)對策略:

每個流程點的命令控制都是特定的規(guī)則是提前定義好的。如果用戶在未激活的場景下說了命令控制,也不會響應(yīng),而是交由其他業(yè)務(wù)邏輯完成回復(fù)。一種比較通用的回復(fù)是AI:抱歉超出我的理解范圍……(增加一個封閉提問請求用戶回答)?

(6)用戶回復(fù)歸類:跳出或退出

任何輪次,用戶都可以做出“跳出或退出”行為。跳出和退出都是結(jié)束當(dāng)前任務(wù)的表現(xiàn)。

一般而言跳出是打開某個其他的技能。退出則是明確說再見。

同樣存在誤識別的可能性,特別是看電影,或者聽歌,作品名字可以隨意取。比如《我想去拉薩》就是一個歌名,會不會被導(dǎo)航識別呢?比如說有些音樂或者電影名,可以完全可以命名為《滾》《退出》《再見》等等。

應(yīng)對策略:

1、語義理解增強NER的識別表現(xiàn),以規(guī)避歧義雙關(guān)語表述。2、明確跳出,開啟另一輪任務(wù)對話,明確退出就結(jié)束對話。3、基于用戶付出的成本,增加挽留確認(rèn)和退出話術(shù)引導(dǎo)。

為方便記憶,這一段的知識點歸納于此,做到了以下圖中的幾點就完成了對話管理,且這種方法論,可用于絕大多數(shù)的任務(wù)型業(yè)務(wù)場景。

三、對話管理思維

再次重申對話管理的目標(biāo):通過問答行為,控制用戶的表述,明確其需求,并方便計算機理解。

達(dá)成目標(biāo)需要行動,而思維是統(tǒng)一行動綱領(lǐng)的。

最開始我想說“理性思維”和“感性思維”的,但是從個人語感上,從各位讀者的理解角度而言,用在這個場景下,不精準(zhǔn),遂修訂為“直男思維”和“暖男思維”。

直男思維:目標(biāo)性強,簡潔準(zhǔn)確,不繞彎。

暖男思維:識別意圖,幽默風(fēng)趣,有溫度。

我們設(shè)計一個技能,就是利用VUI的特性,快速幫助用戶達(dá)成目標(biāo)。即:任務(wù)導(dǎo)向,結(jié)果導(dǎo)向。

全程是幫助用戶快速完成任務(wù)的心態(tài),想讓對方快速達(dá)成結(jié)果的,用封閉提問。

用戶找AI助手是解決問題的,而不是調(diào)情的。所有的填槽行為都是為了完成某個任務(wù),用戶有需求,就應(yīng)該快速給結(jié)果,不墨跡。

下面我用一個例子來解釋這兩個詞兒的準(zhǔn)確與方便記憶所在。

就好比,女生跟男生說肚子痛。

男生的身份如果是醫(yī)生,直接封閉型問題走起:“痛了幾天了,具體哪個位置啊,睡眠好不好”,基于用戶的特征判斷,填槽即可,然后開藥、休息、多喝熱水都是解決方案。

男生的身份如果是男朋友或者男同事,上來就“多喝熱水”,直男無法識別意圖(渣男往往更有嗅覺),直男回復(fù)無法滿足其預(yù)期,就別怪女生翻白眼了。

這一切的原因是,AI助手在用戶心中是一個怎樣的角色定位,以及用戶使用AI助手的目的。如果AI助手的定位是情感機器人,那么處理策略又另當(dāng)別論了,受限于篇幅此處不展開討論。

其實直男思維和暖男思維并不對立沖突,跟理和感性思維一樣,可以融合統(tǒng)一,但在不同的場景下,分主次。

在快速幫助用戶解決問題的前提下,AI助手一樣能做到幽默風(fēng)趣有溫度。

處理策略歸屬于理性,實際話術(shù)表現(xiàn)處理歸屬于感性。這一塊需要大量的語感練習(xí),有天賦才能夠發(fā)現(xiàn)對話文字之間的細(xì)微差別之處。

對話設(shè)計,在掌握了理性的邏輯思考之后,余下部分其實是文科生發(fā)揮優(yōu)勢的戰(zhàn)場。

這里,一張圖片整理本篇方法論知識點。

文末提幾個問題,給大家思考,也留作后續(xù)的NLP方法論文章的遞進,同時也是做好一個對話助手的遞進。

以下是工作中的同事以及一些讀者朋友留言的問題。

1、新用戶對VUI是陌生的,有時候看用戶使用非常掙扎,偶爾突破性的提問就會碰到邊界,如何教會用戶使用各種巧妙的表述,快速達(dá)成任務(wù)目標(biāo)?

2、機器人的回復(fù)是固定套路,很多時候用戶僅僅改了一個篩選條件,AI又不得不從頭到尾念完,然后請求用戶確認(rèn),我自己用都覺得羅嗦,何況是用戶,而這類信息又必不可少,如何處理好這類問題?

私以為,只有當(dāng)我們面對的問題,達(dá)到這種顆粒度,才更能夠做好對話管理行為。歡迎各位同學(xué)留言評論,期待著與你的交流。

【本文來自51CTO專欄作者“老曹”的原創(chuàng)文章,作者微信公眾號:喔家ArchiSelf,id:wrieless-com】

戳這里,看該作者更多好文

 

責(zé)任編輯:武曉燕 來源: 51CTO專欄
相關(guān)推薦

2020-04-20 10:10:44

NLPAI語音

2020-04-13 13:13:20

NLPAI語音

2020-05-07 11:13:44

NLPAI產(chǎn)品

2020-06-19 09:58:53

人工智能

2023-04-28 09:02:24

智能客服人工智能Siri

2016-11-17 10:46:10

2013-12-25 09:50:27

華為馬悅企業(yè)業(yè)務(wù)

2015-04-13 16:00:24

數(shù)據(jù)庫選型關(guān)系型數(shù)據(jù)庫NoSQL

2022-06-27 08:47:29

BEM修飾符元素

2021-11-05 08:28:27

內(nèi)存泄漏調(diào)試

2017-04-19 14:23:08

項目管理分配

2018-11-21 10:13:35

2023-04-21 15:54:46

AI開源

2015-08-12 17:06:28

2022-08-22 11:45:59

架構(gòu)技術(shù)

2025-04-01 02:22:00

2022-03-14 08:40:48

數(shù)據(jù)MRDPRD

2022-06-08 10:05:43

技術(shù)管理數(shù)據(jù)

2023-08-30 11:50:28

2019-08-19 09:01:54

項目管理
點贊
收藏

51CTO技術(shù)棧公眾號