如何評(píng)測(cè)語(yǔ)音技能的智能程度之服務(wù)提供
“你是做什么行業(yè)的?”
“我是做人工智能的。”
很多人覺(jué)得AI是一個(gè)行業(yè),但AI其實(shí)并不是行業(yè),真實(shí)的情況是行業(yè)+AI,即原本的各個(gè)行業(yè)如何釋放AI的能力促使產(chǎn)業(yè)升級(jí),提升運(yùn)轉(zhuǎn)效率,創(chuàng)造更多的社會(huì)價(jià)值。
在前一篇文章里,用戶提出一個(gè)需求。
“我就想要一個(gè)聰明且好用的智能助理,能夠滿足我生活中的各種需求。”
這個(gè)“各種需求”的滿足,其實(shí)是原本已經(jīng)存在解決方案的,AI只是試圖去革新體驗(yàn)。
我們都知道那個(gè)著名的公式:用戶價(jià)值=(新體驗(yàn)-舊體驗(yàn))-替換成本。
那么問(wèn)題來(lái)了,用戶原本用得好好的,為什么要來(lái)用你呢?
很多AI創(chuàng)業(yè)公司就是理解以及處理不好這個(gè)問(wèn)題,經(jīng)營(yíng)不好而半路夭折。
任何一個(gè)服務(wù)背后的構(gòu)建,智能助手其實(shí)都依賴于CP(內(nèi)容提供商)和SP(服務(wù)提供商)的能力,那么如何將這些能力巧妙地與AI結(jié)合,是非常值得研究的部分。
在談及這個(gè)模塊的時(shí)候,評(píng)測(cè)考量的是場(chǎng)景理解及整合應(yīng)用CP和SP的能力。
【服務(wù)提供】(1)資源/服務(wù)的全面性
機(jī)器貓有一個(gè)百寶袋能夠解決足夠多的問(wèn)題。
超能陸戰(zhàn)隊(duì)的大白最初的定位是在醫(yī)療健康領(lǐng)域,相對(duì)就比較窄一些。當(dāng)然后續(xù)大白經(jīng)過(guò)版本迭代升級(jí),也開(kāi)發(fā)出自己的其他能力,這就是能力拓展。
“你看我家的這只大白,他又大又圓,能治病救人,還能打,要是能在多做一些事就好了”
所以,智能語(yǔ)音助手的技能服務(wù),能力范圍自然是越多越好?
在理解這個(gè)維度之前,我們一定要明白比較的對(duì)象。
在前面一篇文章里筆者曾經(jīng)提到過(guò):“市面上,例如騰訊叮當(dāng)、小愛(ài)同學(xué)、天貓精靈、小度音箱這類大生態(tài)的集合的處理方案,屬于最大的開(kāi)放域。”
這種產(chǎn)品形態(tài)的背后,其實(shí)是把集團(tuán)的資源整合進(jìn)一個(gè)智能硬件中,為音箱這個(gè)智能硬件提供更多附加價(jià)值。
筆者的視角看來(lái),這也是在未來(lái),各CP和SP在未來(lái)注定會(huì)到來(lái)的智能時(shí)代,嘗試以音箱這類硬件載體,找到AI為用戶提供服務(wù)價(jià)值的一種探索性行為。
從這個(gè)角度去評(píng)判,他們無(wú)疑是大而全的。
巨頭們的打法,他們做的是生態(tài)。用評(píng)價(jià)應(yīng)用商店的角度,去評(píng)判智能助手,根本就不對(duì)。
故而SIRI的未來(lái),定位一定是基于蘋(píng)果的大生態(tài),做一個(gè)向用戶提供SP和CP的連接器。它是中介,提供的服務(wù)能力是,幫助用戶尋找CP和SP。
而實(shí)際上,真正去解決我們生活中的問(wèn)題的是,各個(gè)行業(yè)細(xì)分領(lǐng)域的CP和SP們。
CP角度:視頻、音樂(lè)、音頻內(nèi)容、文字內(nèi)容、游戲等領(lǐng)域。SP角度:出行、教育、醫(yī)療、金融、電商、旅游、餐飲、客服、線下生活服務(wù)等領(lǐng)域。
所以,真正比拼服務(wù)全面性的,指的是解決某個(gè)具體問(wèn)題的能力。
例如滴滴的定位是解決用戶的出行問(wèn)題,如何解決一公里內(nèi)的出行服務(wù)需求,收購(gòu)一家“自行車”唄。
在實(shí)際的業(yè)務(wù)評(píng)測(cè),體驗(yàn)測(cè)試很多市面上的AI助理,就覺(jué)得有些服務(wù)有,但是服務(wù)的覆蓋不夠。
例如很多的AI助手都是訂機(jī)票功能的,但是似乎少有的能做到整個(gè)服務(wù)鏈條的全覆蓋。比如:
- 能定國(guó)內(nèi)的機(jī)票,沒(méi)法定海外的機(jī)票;
- 買機(jī)票的同時(shí),不能買出行相關(guān)的保險(xiǎn);
- 乘坐飛機(jī)相關(guān)的各種FAQ服務(wù)問(wèn)題能不能答得上來(lái);
- 行程單郵寄以及發(fā)票報(bào)銷,解決得是否到位;
- 預(yù)約送機(jī)和接機(jī)的服務(wù)需求如何解決;
- 商旅人士定酒店的服務(wù)是不是也得加上;
- ……
定位可大可小,只有先明確產(chǎn)品的定位,然后基于定位所覆蓋的服務(wù)范圍,去滿足用戶需求,基于這個(gè)角度去評(píng)測(cè)“資源/服務(wù)的全面性”才更準(zhǔn)確。
而作為AI從業(yè)者,實(shí)際上應(yīng)該思考的是,用如何用現(xiàn)在的AI能力升級(jí)某個(gè)產(chǎn)業(yè),更好的為用戶提供更多的價(jià)值,爭(zhēng)取做到某個(gè)細(xì)分需求領(lǐng)域里面的最好。
此為,我輩中人,應(yīng)該反復(fù)思考的命題。
【服務(wù)提供】(2)資源/服務(wù)的質(zhì)量
既然有全面性考量,相對(duì)應(yīng)也有質(zhì)量的追求。
行業(yè)內(nèi)能提供最好質(zhì)量的也就是BAT的那幾家,這個(gè)背后是接口,即SP和CP的比拼。無(wú)非就是把手機(jī)上獲取的內(nèi)容和服務(wù),換一個(gè)硬件載體所承載。
從用戶角度而言,是通過(guò)點(diǎn)觸找到自己想要的內(nèi)容/服務(wù),還是和通過(guò)語(yǔ)音找到自己想要的內(nèi)容/服務(wù),這個(gè)過(guò)程并不重要,而真正在意的是能否滿足需求,有無(wú)體驗(yàn)升級(jí)?
即,只要讓我能拿到能回家的火車票,我才不管哪個(gè)軟件,通過(guò)什么形式完成交易行為。
在這一點(diǎn)上,巨頭的SP和CP非常齊備,而小廠往往就慘兮兮,比如我想聽(tīng)周杰倫的歌,我也能做好相關(guān)的語(yǔ)義理解,結(jié)果公司的背后沒(méi)有QQ音樂(lè)的支持,那只能找一些替代方案,還擔(dān)心版權(quán)問(wèn)題。
中等廠商如喜馬拉雅,基于內(nèi)容做音箱,然后捆綁內(nèi)容完成銷售。
那么問(wèn)題來(lái)了,如果自己不是巨頭公司,手里也沒(méi)有內(nèi)容,公司也沒(méi)太多的錢(qián),買不到版權(quán),如何去做呢?
在一些細(xì)分領(lǐng)域,是存在內(nèi)容自建這一說(shuō)的。我們可以開(kāi)一些也許不嚴(yán)謹(jǐn)?shù)哪X洞。
先定義一下場(chǎng)景:智能廚房,如何給用戶帶來(lái)革新的體驗(yàn)?
比如說(shuō),電冰箱上開(kāi)個(gè)屏幕,外加麥克風(fēng)揚(yáng)聲器wifi模組,這個(gè)硬件成本是可控的,如此可以構(gòu)成一個(gè)廚房AI機(jī)器人。
每天推特價(jià)菜,整合每日優(yōu)鮮或樓下便利店,對(duì)廚房的需求直接語(yǔ)音配送下單。在廚房這個(gè)場(chǎng)景下,屏幕上可以語(yǔ)音搜索,做菜烘培類的視頻資源等,可以用知乎,抖音,下廚房等任意地方的內(nèi)容,這個(gè)細(xì)分領(lǐng)域,維系好內(nèi)容建設(shè),成本并不高。
再比如說(shuō),市面上一些熱門(mén)游戲,已經(jīng)有了自己的智能助手,有些做的好,有些不好。
在這里可以尋求的服務(wù)可以有:提供游戲攻略、提供客服入口以及服務(wù)、收集用戶建議,做運(yùn)營(yíng)營(yíng)收類動(dòng)作一類系統(tǒng)整合服務(wù)。
就單單一個(gè)服務(wù)點(diǎn),當(dāng)用戶在游戲中挫敗的時(shí)候,卡在某個(gè)關(guān)卡下死活過(guò)不去,可以提供游戲圖文/視頻攻略,貼心的送一些臨時(shí)性的道具關(guān)懷,甚至幫助用戶完成戰(zhàn)斗。這些都是可以通過(guò)助手實(shí)現(xiàn),并有效提升用戶留存的。
所以,智能助手能不能基于場(chǎng)景和需求,給予用戶高質(zhì)量的內(nèi)容價(jià)值,是非常重要的考量點(diǎn)。
【服務(wù)提供】(3)反饋樣式的豐富性
簡(jiǎn)單來(lái)說(shuō),就是智能助手的回復(fù)類型有多豐富。
還是舉個(gè)例子:現(xiàn)實(shí)生活中,你向其他人提問(wèn)我想了解一下這個(gè)房子,你能介紹一下么?
如果現(xiàn)在同樣的問(wèn)題,拋給語(yǔ)音助手,對(duì)方回復(fù)的內(nèi)容樣式包含如下:
1、純文本介紹;
2、圖片搭配文本,語(yǔ)音介紹;
3、視頻內(nèi)容介紹;
4、帶交互的功能式頁(yè)面;
5、導(dǎo)購(gòu)講解外加VR視覺(jué)交互;
無(wú)論是問(wèn)問(wèn)題和反饋需求,我的智能助手怎樣回復(fù)我,總會(huì)有一個(gè)反饋樣式。
在實(shí)際使用其他的智能客服交流的時(shí)候,問(wèn)他一些非?;A(chǔ)的問(wèn)題,比如說(shuō)找一下簽到功能頁(yè)面。
機(jī)器人會(huì)非常細(xì)心的告訴我,先點(diǎn)哪里,然后點(diǎn)哪里,然后點(diǎn)哪里就可以找到了。
問(wèn)題就是他是一串純文本,為什么就不能給我一個(gè)直接跳轉(zhuǎn)到指定頁(yè)面的功能按鈕呢?顯然,它并沒(méi)有提供一個(gè)【跳轉(zhuǎn)】的功能樣式。
故而,智能助手輸出結(jié)果樣式的豐富性也應(yīng)該作為評(píng)測(cè)指標(biāo)。
列舉一下當(dāng)前的回復(fù)樣式,文本、圖文、視頻播放器、音軌、選項(xiàng)卡、表單、功能按鈕、多模態(tài)交互等等。
必要說(shuō)明的是,樣式并非越華麗炫酷越好,而是恰當(dāng)好處就好,往往越是華麗炫酷的東西,越是加載效果多,反饋速度慢也是評(píng)測(cè)丟分項(xiàng)(這個(gè)后面的評(píng)測(cè)維度會(huì)提及)。
樣式的選擇,就是具體場(chǎng)景具體分析了。
所以評(píng)測(cè)點(diǎn)是,是否能夠理解用戶需求,使用豐富的反饋樣式,提升用戶體驗(yàn)。
【服務(wù)提供】(4)內(nèi)容展示合理程度
這一塊其實(shí)非??简?yàn)人的設(shè)計(jì)功底,好的UI界面一定是簡(jiǎn)單而優(yōu)雅的。
它只在用戶需要的時(shí)間,展示需要的內(nèi)容
展示是分為GUI(圖形界面)的和VUI(語(yǔ)音界面)兩個(gè)部分的。
就好比飛機(jī)的駕駛艙,一定是讓人抓狂和惱火的,太多的儀表盤(pán)和功能按鈕會(huì)讓人決策癱瘓。而這種設(shè)計(jì)我一般稱之為勸退性設(shè)計(jì)。而汽車的駕駛艙的設(shè)計(jì)就好的多,因?yàn)樗?jiǎn)化了操作。
而就算是汽車的駕駛艙,不同的廠商處理能力也完全不一樣,Tesla的處理表現(xiàn)是非常優(yōu)雅的。
經(jīng)歷過(guò)功能機(jī)年代的人都知道,那個(gè)年代實(shí)體鍵盤(pán)占據(jù)屏幕的一大部分,而當(dāng)前的手機(jī)鍵盤(pán)僅僅在需要出現(xiàn)的時(shí)候出現(xiàn),類似的例子實(shí)在是太多了。
故而內(nèi)容展示的合理程度,也應(yīng)該成為一個(gè)評(píng)測(cè)標(biāo)準(zhǔn)。
就算是復(fù)雜的內(nèi)容,也需要做好信息處理,根據(jù)用戶的情況,分層次分階段,進(jìn)行內(nèi)容展示。
為了幫助大家理解,我舉幾個(gè)語(yǔ)音交互層面的例子。
比如說(shuō),大家周末相約到你家聚會(huì),有些同學(xué)由于不熟悉路況,然后打電話給你。你通過(guò)語(yǔ)音跟對(duì)方完成指路行為。注意,這是一個(gè)純語(yǔ)音對(duì)話的場(chǎng)景。
一般情況下,你采用的的話術(shù)表示是東南西北,一二三四某個(gè)街道樓棟門(mén)牌號(hào)這類語(yǔ)言結(jié)構(gòu),這種固然沒(méi)什么問(wèn)題,但是往往是對(duì)空間感較好的男生比較友好。
而這類話術(shù)在女生那邊就不那么管用了,她們熟悉什么呢?商店品牌,廣告牌標(biāo)識(shí),建筑形狀,顏色等等,所以你自然就應(yīng)當(dāng)調(diào)整自己的話術(shù),相信她們會(huì)更接受。
上述例子就是基于用戶的情況,去設(shè)計(jì)自己的話術(shù)呈現(xiàn)。
前面一個(gè)智能廚房的場(chǎng)景,詢問(wèn)如何做菜,一般會(huì)給予視頻推薦。如此,解放雙手,邊看邊聽(tīng)邊做,這個(gè)是我們想象的美好場(chǎng)景。
如果內(nèi)容不加以控制和處理的話,用戶的使用路徑是,先看視頻后做菜,或者是邊看視頻邊做菜。如此,大概率會(huì)出現(xiàn),一看就會(huì),一做就廢的情況。
原因無(wú)他,信息過(guò)載,細(xì)節(jié)過(guò)多,記不住。
而對(duì)內(nèi)容進(jìn)行管理,加以處理的話,合理的處理分層次分階段,體驗(yàn)便能再上升一個(gè)臺(tái)階。
上述例子就是基于分層次分階段,去設(shè)計(jì)自己的內(nèi)容呈現(xiàn)。
筆者曾經(jīng)設(shè)計(jì)過(guò)一些語(yǔ)音交互游戲。在進(jìn)行業(yè)務(wù)教學(xué)的時(shí)候,曾經(jīng)走過(guò)類似的彎路。
往往我們一開(kāi)始是需要向用戶介紹基本狀態(tài),以及基本操作指令的,在介紹游戲指令的時(shí)候,有這一段描述:
……游戲的命令列表分別是:“繼續(xù)”、“重復(fù)一遍”、“下一步”、“退出游戲”。
問(wèn)題1:命令列表是計(jì)算機(jī)語(yǔ)言,不具備親和力,更好的表述應(yīng)該是替換成你可以對(duì)我說(shuō):
而在后續(xù)實(shí)際的體驗(yàn)過(guò)程中,以及觀察用戶實(shí)際使用情況是:
當(dāng)AI講完,用戶并不知道接下來(lái)該怎么辦,卡頓在那里里發(fā)呆。當(dāng)AI講完,用戶走神沒(méi)聽(tīng)清楚,也忘記了前面“重復(fù)一遍”的命令列表。脫口而出你說(shuō)啥?
問(wèn)題2:一開(kāi)始用戶拿到這一串命令的時(shí)候,其實(shí)是不知所措的,就好比跟你念了一段說(shuō)明書(shū)。因?yàn)樾畔⑦^(guò)載,而可能會(huì)遺漏掉某些信息。
這就是語(yǔ)音交互的尷尬所在,操控命令無(wú)法圖形化顯示,只能想辦法在用戶需要的時(shí)候提示。(這就非常考量出現(xiàn)的時(shí)機(jī))而交代也需要細(xì)節(jié),比如:
AI:說(shuō)“繼續(xù)”進(jìn)入下一步。用戶:繼續(xù)進(jìn)入下一步。我們真的不希望用戶如此表述。
問(wèn)題3:我們期望用戶的表述,與預(yù)想不符,而修訂后的是 助手:進(jìn)入下一步請(qǐng)說(shuō)“繼續(xù)”
類似的例子還能列舉很多,無(wú)論是GUI還是VUI,對(duì)用戶一股腦呈現(xiàn),不加以管理是非常不負(fù)責(zé)的。
在自然語(yǔ)言處理領(lǐng)域,特別是純語(yǔ)言的表述,邏輯順序非常非常重要。所以我提煉成,內(nèi)容展示合理程度,故而列為評(píng)測(cè)點(diǎn)。
【服務(wù)提供】(5)兜底處理表現(xiàn)
盡管我們都希望自己的智能助手能夠給予最好的回復(fù)。
而在實(shí)際的業(yè)務(wù)中,總會(huì)有一些搞不定的情況。
此處搞不定分為兩種,一種情況是,AI聽(tīng)懂了,但是需求超出范圍,如何回復(fù)?
另外一種情況是,AI真的沒(méi)聽(tīng)懂,但是能猜測(cè)一個(gè)大概,但拿不準(zhǔn),如何回復(fù)?
實(shí)際業(yè)務(wù)中的解決方案,每個(gè)業(yè)務(wù)單元處理均不一致。
私以為常見(jiàn)的處理方案如下。
下面的這個(gè)例子中,有什么理財(cái)推薦和我想買理財(cái)其實(shí)意圖近似,但是AI則根據(jù)自己的理解,給予了兩種不同的處理方案。
下面的三個(gè)例子中,其實(shí)都是歸屬于成功理解意圖,但是回復(fù)不一致。
案例1,采用閑聊接話的方式,顯然是不過(guò)關(guān)的。(這類不過(guò)關(guān)真的非常多)
而案例2和案例3,則是相對(duì)過(guò)關(guān)的。
案例2和案例3,都無(wú)法直接滿足,雖然方向不同,但也是努力兜底,為用戶解決問(wèn)題。
一種是通過(guò)下載APP作為解決方案,一種是交給導(dǎo)航去處理,提供解決方案。這兩種選擇的背后,都是可以產(chǎn)生商業(yè)價(jià)值的。
所以兜底回復(fù)的表現(xiàn),衡量的是,能夠?yàn)橛脩?,為公司帶?lái)多少價(jià)值。故而列為評(píng)測(cè)點(diǎn)。
階段性結(jié)尾
寫(xiě)東西不光光是羅列和定義評(píng)測(cè)點(diǎn)是什么,筆者更期望在每個(gè)點(diǎn)上,加入更多的業(yè)務(wù)思考和理解。
實(shí)際上,原本在【服務(wù)提供】這個(gè)維度,有更多評(píng)測(cè)點(diǎn)去列舉,受應(yīng)用性所限,刪掉的一些內(nèi)容。
用提問(wèn)的方式,列舉一下我刪除掉的指標(biāo)。
第(6)點(diǎn),列舉一個(gè)例子,特別跟我們工作中一樣,馬總下周去北京出差,你幫忙安排一下相關(guān)行程。然后秘書(shū)會(huì)溝通具體時(shí)間,航班的班次,酒店,路上的交通,出差相關(guān)的事項(xiàng)提醒以及資料。當(dāng)這類事情,交付給AI的時(shí)候,AI如何處理。
第(7)點(diǎn),智能助理可以出現(xiàn)的地方,麥克風(fēng),揚(yáng)聲器,wifi模塊,就可以使用語(yǔ)音交流了,如果有屏幕,則多一種點(diǎn)觸交互。那么這意味著智能助理,可以存在的載體非常多,手表/環(huán)、手機(jī)、電腦、眼鏡、耳機(jī)、音箱、車載硬件等任何地方。那么當(dāng)用戶在不同場(chǎng)景的下的需求,到了另外的地方,如何對(duì)人類提供反饋。
第(8)點(diǎn),開(kāi)放域閑聊,解決用戶的寂寞問(wèn)題。要知道,“樹(shù)洞”也是一種待滿足的需求。表現(xiàn)得最好的是電影《Her》里面的薩曼莎,不熟悉這個(gè)電影的朋友可以去B站搜下內(nèi)容。其次表現(xiàn)得最好的,我所知道的,應(yīng)該是被很多人調(diào)戲了這些年的微軟小冰了。
(6)、(7)、(8)三點(diǎn)畢竟高難度,雖然想過(guò)方案,但是對(duì)絕大多數(shù)智能助手而言,相對(duì)低頻,故而棄之。當(dāng)然也可以把這些評(píng)測(cè)點(diǎn)納入,作為加分項(xiàng)。如果能實(shí)現(xiàn)得比較好,那就是亮點(diǎn),甚至是當(dāng)成重要賣點(diǎn)去贏得市場(chǎng)競(jìng)爭(zhēng)力!
當(dāng)用戶提出需求后,AI先理解,后反饋,這個(gè)反饋表現(xiàn),就是本文【服務(wù)提供】維度各個(gè)考量角度。
我們都知道那個(gè)著名的公式:用戶價(jià)值=(新體驗(yàn)-舊體驗(yàn))-替換成本。前段時(shí)間讀《俞軍產(chǎn)品方法論》時(shí),更是加深了理解。
我們?nèi)绾吾尫臕I的能力去革新體驗(yàn),盡量提升(新體驗(yàn))的價(jià)值。
同時(shí)用戶(替換成本)是什么,如何降低。如何兩頭用力,最大化創(chuàng)造用戶價(jià)值。
此為,我輩中人,反復(fù)思考的命題。
以上,關(guān)于第二大維度【服務(wù)提供】的考量部分,就此完結(jié)。