智能客服閑聊模塊三種方案對(duì)比,你喜歡哪一種?
當(dāng)前市場(chǎng)上智能客服及其NLP領(lǐng)域,閑聊模塊是其非常重要的研究領(lǐng)域。目前業(yè)界針對(duì)于閑聊模塊的方案一般以下三個(gè)方案:
基于固定模板
我們都知道業(yè)務(wù)問(wèn)答通用方案是基于模板式問(wèn)答,同理模板式問(wèn)答也適用于閑聊系統(tǒng),這種方式的優(yōu)勢(shì)在于易于控制,用少量的模板滿足多種問(wèn)題需求,劣勢(shì)在于出現(xiàn)答非所問(wèn)的概率比較大。
基于語(yǔ)料庫(kù)
這種做法是先收集-整理一批閑聊庫(kù),一般情況是一個(gè)意圖對(duì)于一個(gè)標(biāo)準(zhǔn)問(wèn)題及相應(yīng)問(wèn)題的泛化,針對(duì)問(wèn)題有多個(gè)答案,形成類似一問(wèn)多答的效果,這種做法的優(yōu)勢(shì)在于回答內(nèi)容是可控,不會(huì)出現(xiàn)意料之外的答案,目前市場(chǎng)上閑聊語(yǔ)料庫(kù)作法是比較廣泛,如針對(duì)于金融保險(xiǎn)行業(yè)做的比較好的竹間機(jī)器人、平安等,針對(duì)兒童領(lǐng)域做的比較好北京光年的圖靈機(jī)器人、狗尾草的公子小白等都是使用這種方式,劣勢(shì)在于回答的內(nèi)容非常有限,畢竟都是在設(shè)計(jì)的語(yǔ)料庫(kù)內(nèi)的答案。
基于生成式
生成式一直都是NLP領(lǐng)域研究的前沿方向,早期的微軟小冰及各大研究院推出的閑聊系統(tǒng)都是生成式的,生成式對(duì)話系統(tǒng)的優(yōu)勢(shì)在于基于有限的語(yǔ)料,通過(guò)深度學(xué)習(xí)/神經(jīng)網(wǎng)絡(luò)可以獲得額外的答案,從而實(shí)現(xiàn)無(wú)中生有的效果,劣勢(shì)在于回答的內(nèi)容不可控,誰(shuí)都無(wú)法預(yù)估到會(huì)出現(xiàn)什么樣的答案,目前該種方式只能使用研究及部分真正的“閑聊”中,無(wú)法使用到企業(yè)業(yè)務(wù)中,畢竟沒(méi)人能真正控制的了回答的是什么內(nèi)容,假如出現(xiàn)性別,種族歧視吶?
總結(jié),這三種方式各有各的優(yōu)勢(shì),在我們實(shí)際使用中,需要根據(jù)業(yè)務(wù)需求采取相應(yīng)的設(shè)施,以下是三種方案的對(duì)比:
- 回答內(nèi)容可控性:基于語(yǔ)料庫(kù) > 基于固定模板> 基于生成式
- 回答內(nèi)容豐富度:基于生成式 > 基于固定模板 > 基于語(yǔ)料庫(kù)
- 回答內(nèi)容的可靠度性:基于語(yǔ)料庫(kù) > 基于固定模板> 基于生成式
目前企業(yè)生產(chǎn)的使用度來(lái)看,大多數(shù)企業(yè)采用的是語(yǔ)料庫(kù)+模板兩種方案結(jié)合一起,既能達(dá)到內(nèi)容的可控性,又能在一定程度上滿足豐富度。