客服機(jī)器人是怎么實(shí)現(xiàn)的?對話推薦系統(tǒng)
本文轉(zhuǎn)載自微信公眾號「活在信息時代」,作者活在信息時代。轉(zhuǎn)載本文請聯(lián)系活在信息時代公眾號。
大家在使用很多APP的時候,一定對于智能機(jī)器人客服系統(tǒng)都有所了解??头C(jī)器人就像真人客服一樣,可以與人進(jìn)行簡單的對話,并針對人們的需求給出相應(yīng)的回答。雖然大部分時間得到的答案并不怎么靠譜吧,但是總的還是比較節(jié)省人工的。
近期火熱的聊天機(jī)器人ChatGPT本質(zhì)上也是一個客服機(jī)器人,只不過它背后依據(jù)的算法更精細(xì),預(yù)訓(xùn)練的數(shù)據(jù)量也更大。
下面我們就一起來看看客服機(jī)器人背后的技術(shù):對話推薦系統(tǒng)。
一、對話推薦系統(tǒng)概述
用戶使用對話推薦系統(tǒng)的過程,本質(zhì)上是一個經(jīng)過多輪信息互動,最終協(xié)助用戶進(jìn)行決策的過程。
對話推薦系統(tǒng)(Conversational Recommendation System,CRS)通過豐富的交互行為,打破了靜態(tài)推薦系統(tǒng)中系統(tǒng)與用戶之間信息不對稱的壁壘,允許推薦系統(tǒng)在與用戶的交互對話中,動態(tài)捕捉用戶偏好。一方向通過探索用戶當(dāng)前的興趣偏好,引導(dǎo)用戶發(fā)現(xiàn)自己新的興趣點(diǎn)。另一方面,在交互過程中,實(shí)時接受用戶的反饋,更新推薦模型的策略,實(shí)現(xiàn)動態(tài)學(xué)習(xí)與更新。這是一種以推薦為目標(biāo)導(dǎo)向的對話系統(tǒng),通過與用戶的在線對話達(dá)到捕捉用戶興趣從而推薦用戶所需要的答案或者商品的目的。
一般的對話系統(tǒng)通常分為兩類:任務(wù)導(dǎo)向型和非任務(wù)導(dǎo)向型。后者即是人們通常所說的聊天機(jī)器人。而任務(wù)導(dǎo)向的對話系統(tǒng)旨在幫助用戶完成具體的任務(wù),例如幫助用戶找尋所需要的商品、預(yù)訂酒店餐廳等。面向推薦任務(wù)的任務(wù)導(dǎo)向型對話系統(tǒng),通??梢钥醋魇且宰匀徽Z言文字、語音為交互形式的對話推薦系統(tǒng)。在推薦任務(wù)中,具有較高的商業(yè)價值。
二、對話推薦任務(wù)的特點(diǎn)
從對話推薦系統(tǒng)的應(yīng)用上來看,具有兩個典型的特點(diǎn):多輪交互和目標(biāo)導(dǎo)向。
1、多輪交互
傳統(tǒng)的系統(tǒng)中,例如在淘寶搜索商品的時候,用戶尋找具有特定屬性的商品時,會通過主動搜索來進(jìn)行。例如,可以搜索“春季的男士外套”,在這個場景中,用戶自己構(gòu)造查詢,推薦效果不僅依賴于搜索引擎,更多是依賴用戶自己的專業(yè)知識來構(gòu)造合適的查詢關(guān)鍵詞。這種傳統(tǒng)的推薦系統(tǒng)需要用戶根據(jù)自己的先驗(yàn)知識輸入可能的屬性選項(xiàng),才能準(zhǔn)確定位到合適的商品。但是在很多場景中,用戶并不具有這樣的先驗(yàn)知識。這種情況下,用戶期望系統(tǒng)能夠主動向用戶介紹他們可能喜歡的潛在物品。
而對話推薦系統(tǒng)中的多輪交互特點(diǎn)可以彌補(bǔ)傳統(tǒng)推薦系統(tǒng)中用戶主動搜索的不足。在系統(tǒng)與用戶的實(shí)時互動中,可以通過主動向用戶提問的方式,向用戶展示用戶未知的物品屬性空間,并利用用戶的反饋信息,直接了解用戶對某些屬性的需求和態(tài)度,構(gòu)建用戶興趣畫像,從而做出正確的推薦。
2、目標(biāo)導(dǎo)向
對話推薦系統(tǒng)要實(shí)現(xiàn)的目標(biāo)任務(wù)是給用戶推薦用戶感興趣的商品,因此以實(shí)現(xiàn)成功推薦為最終目標(biāo),進(jìn)行獲取用戶偏好信息的交互,CRS與傳統(tǒng)推薦系統(tǒng)有同樣的“推薦”目標(biāo),但是二者在系統(tǒng)的運(yùn)作與實(shí)現(xiàn)上完全不同。傳統(tǒng)的推薦系統(tǒng)可以看作是系統(tǒng)單方面向用戶輸出推薦物品。而CRS則注重實(shí)用的實(shí)時反饋,不斷主動試探用戶興趣點(diǎn),并更新后續(xù)的推薦策略。
三、對話推薦系統(tǒng)的基本功能模塊
一個標(biāo)準(zhǔn)的對話推薦系統(tǒng)由三個功能模塊組成:用戶意圖理解模塊、對話策略模塊和推薦模塊。
1、用戶意圖理解模塊
用戶意圖理解模塊是與用戶直接交換信息的模塊,其輸入早年主要是對話文本,而隨著技術(shù)的發(fā)展,多模態(tài)數(shù)據(jù)和用戶行為數(shù)據(jù)也越來越成為對話推薦系統(tǒng)主要的輸入數(shù)據(jù)來源。
2、對話策略模塊
對于推薦系統(tǒng)而言,能夠基于的正反饋數(shù)據(jù)是非常少的,這就造成了系統(tǒng)與用戶之間的信息并不匹配,而一次失敗的探索將浪費(fèi)用戶的時間,傷害用戶的偏好,進(jìn)行造成用戶的流失。因此,追求探索和收益的平衡是對話推薦系統(tǒng)中的一個關(guān)鍵問題。對話策略模塊的主要任務(wù)就是解決這一問題。
在多輪交互過程中,這一問題表現(xiàn)為系統(tǒng)在交互過程中需要確定當(dāng)前是否要繼續(xù)詢問用戶,還是基于已經(jīng)獲取到的信息來實(shí)現(xiàn)推薦商品,從而增加用戶選擇商品的概率。這是一個典型的博弈問題。過多的詢問可能造成用戶的厭惡,而過少的詢問又會造成用戶偏好信息的缺失。因此,好的對話策略需要智能地平衡對話輪次與推薦準(zhǔn)確率兩個指標(biāo)。
3、推薦模塊
推薦模塊是對話推薦系統(tǒng)中實(shí)現(xiàn)推薦功能的模塊,根據(jù)已經(jīng)捕捉到的用戶信息,推薦用戶當(dāng)前最感興趣的目標(biāo)物品。在大部分的CRS中,推薦模塊都采用簡單的推薦模型,例如矩陣分解,這是因?yàn)楹唵蔚耐扑]模型已經(jīng)能夠滿足對話推薦系統(tǒng)的推薦需求,使用過于復(fù)雜的推薦模型,反而會使系統(tǒng)整體復(fù)雜度上升,使對話推薦系統(tǒng)的訓(xùn)練變得困難。