自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

如何評(píng)測(cè)語(yǔ)音技能的智能程度之指標(biāo)權(quán)重設(shè)計(jì)

企業(yè)動(dòng)態(tài)
這是一份前面四篇評(píng)測(cè)維度介紹文章的總結(jié),同時(shí)也是一份清單使用說(shuō)明書(shū)?!敖Y(jié)構(gòu)清晰,主次分明”,用解構(gòu)的方式去理解一款產(chǎn)品,這才是人工智能從業(yè)者思考的專業(yè)化表現(xiàn)。

 這是一份前面四篇評(píng)測(cè)維度介紹文章的總結(jié),同時(shí)也是一份清單使用說(shuō)明書(shū)。

[[330150]]

“結(jié)構(gòu)清晰,主次分明”,用解構(gòu)的方式去理解一款產(chǎn)品,這才是人工智能從業(yè)者思考的專業(yè)化表現(xiàn)。

對(duì)于這四大維度,什么是重點(diǎn)呢? 面向需求進(jìn)行自定義。

如何定義各個(gè)維度的權(quán)重

權(quán)重高低的定義有兩個(gè)考量維度,一個(gè)是行業(yè)需求,另一個(gè)是硬件載體。行業(yè)需求包括出行、旅游、餐飲、教育、醫(yī)療、金融、電商、客服等;硬件載體包括智能音箱、智能手表、車機(jī)、智能耳機(jī)、機(jī)器人等等。

智能語(yǔ)音技能,往往都會(huì)解決某個(gè)行業(yè)領(lǐng)域的特定業(yè)務(wù)需求,也往往都存在于一個(gè)或多個(gè)硬件載體上,與人類進(jìn)行交互行為。大維度自定義權(quán)重,同理,每個(gè)維度上的指標(biāo)也基于需求自定義。

 

例如:某語(yǔ)音技能的定位是用來(lái)聽(tīng)歌的,“意圖理解“中的模塊做得非常好,但是由于版權(quán)原因,很多歌曲無(wú)法播放,這個(gè)技能的用戶體驗(yàn)就會(huì)非常糟糕,因?yàn)闈M足不了用戶聽(tīng)歌的需求。

如果該語(yǔ)音技能是線下生活服務(wù),比如訂外賣或者是電影票,這類往往不具備版權(quán)壟斷特質(zhì),但由于業(yè)務(wù)流程的復(fù)雜,有太多疊加查詢條件,自然對(duì)“意圖理解“就會(huì)有很高的權(quán)重要求。

如果某個(gè)玩具/手辦具備語(yǔ)音交互功能,用戶非常在意玩具/手辦的語(yǔ)音交互是否匹配角色氣質(zhì),故而對(duì)這類用戶而言,“人格特質(zhì)“就要要求高權(quán)重。

語(yǔ)音技能評(píng)測(cè)指標(biāo)的選擇和量化

這份清單花了筆者太多的時(shí)間,仍然有太多的問(wèn)題值得討論:

  • 為什么是4個(gè)維度,而不是5個(gè)或者是3個(gè)?
  • 基于什么依據(jù)設(shè)置每個(gè)維度的重點(diǎn)和加分項(xiàng)?
  • 各維度是否窮盡了“智能化”評(píng)測(cè)的角度?
  • 每個(gè)指標(biāo)的用詞的和定義是否精準(zhǔn)無(wú)歧義且易于理解?
  • 每個(gè)維度的指標(biāo)是不是平行、獨(dú)立關(guān)系?
  • 每個(gè)維度的指標(biāo)是不是做到了窮舉?

特別是在保留哪些指標(biāo),合并哪些指標(biāo)之間,筆者做了很多的取舍和權(quán)衡。語(yǔ)音識(shí)別表現(xiàn),這個(gè)指標(biāo),與其說(shuō)是遺漏,不如說(shuō)是筆者的選擇。目前最好的ASR識(shí)別率是97%,且這已經(jīng)是非常成熟的技術(shù)。ASR和TTS是基礎(chǔ)服務(wù),在未來(lái)就像AI領(lǐng)域水電煤一樣,就跟選百度云還是阿里云一樣,花錢買服務(wù)就能搞定,差距不會(huì)太大,故而不值得納入評(píng)測(cè)范疇。

因此,這類語(yǔ)音識(shí)別的基礎(chǔ)表現(xiàn),就直接歸到【交互流暢】維度“服務(wù)穩(wěn)定性”指標(biāo)上了。

ASR這項(xiàng)技術(shù)未來(lái)差距很可能會(huì)被抹平,而如果做到了方言轉(zhuǎn)普通話然后轉(zhuǎn)文本那就是另外一個(gè)話題了,方言轉(zhuǎn)普通話和任何一種語(yǔ)言轉(zhuǎn)普通話是同一個(gè)邏輯。那筆者可能會(huì)歸納到【意圖理解】維度上。

筆者力求全面,但并非每一個(gè)都需要用到,可以基于自己的需求,自由添加、刪除和修改分類。例如:如果是一個(gè)智能耳機(jī)或者語(yǔ)義翻譯棒,那么“反饋樣式豐富性”上,就不必要納入評(píng)測(cè)范圍了。

但選擇本身就是一個(gè)難題,這件事情非常地考驗(yàn)我們的認(rèn)知。舉個(gè)例子:蘋果手機(jī)前面幾代產(chǎn)品,玻璃屏幕特別不耐摔,這在諾基亞的評(píng)測(cè)維度里面,是無(wú)法上市銷售的。后來(lái)的故事,我們都知道了,這個(gè)故事各位細(xì)品。

指標(biāo)的量化標(biāo)準(zhǔn)并不是一個(gè)難題。拿測(cè)試集去驗(yàn)證,最終統(tǒng)計(jì)各個(gè)指標(biāo)的表現(xiàn),然后再橫向比較競(jìng)品就好。

商業(yè)化服務(wù)比得是相對(duì)指標(biāo),而不是絕對(duì)指標(biāo),即不需要考滿分,只要在某個(gè)方向上,領(lǐng)先與其他競(jìng)品一段距離就好,然后就可以宣稱,這是當(dāng)前市面上“某某指標(biāo)”表現(xiàn)最好的產(chǎn)品。

 

語(yǔ)音技能服務(wù)的上限和下限

除去調(diào)研和評(píng)測(cè)其他智能語(yǔ)音技能,這份清單的還可以用于服務(wù)的產(chǎn)品定位,以及作為清單來(lái)評(píng)價(jià)語(yǔ)音技能服務(wù)表現(xiàn)。

語(yǔ)音技能服務(wù)在立項(xiàng)的時(shí)候,要哪些不要哪些,有多大的邊界和范圍,是一個(gè)思考題。開(kāi)始的無(wú)屏音箱都在抄亞馬遜的Echo,后面為什么又出現(xiàn)了有屏音箱呢?這個(gè)就是智能語(yǔ)音產(chǎn)品的定位和選擇。

從商業(yè)邏輯上來(lái)看,缺陷明顯的產(chǎn)品無(wú)法存活于市場(chǎng),沒(méi)有長(zhǎng)項(xiàng)的產(chǎn)品也注定平庸。企業(yè)也沒(méi)法把所有的資源平均分配,那樣的東西注定平庸,唯有極致才可以生存。

語(yǔ)音技能服務(wù)的上限就是自己的賣點(diǎn),這樣才能夠從競(jìng)爭(zhēng)之中脫穎而出。

例如,再爛的智能手機(jī)也要搭配一顆攝像頭,且攝像頭的性能表現(xiàn)不能低于某個(gè)標(biāo)準(zhǔn),如果這個(gè)太爛的話,注定無(wú)法存活。前面蘋果手機(jī)的屏幕其實(shí)也抗震,不是一摔就碎的東西,這種就是下限保障。

語(yǔ)音技能服務(wù)的下限要做到什么程度,這個(gè)就是及格線,存活于市場(chǎng)的前提。

在保證了及格線達(dá)到平均線標(biāo)準(zhǔn)之后,應(yīng)當(dāng)把更多的資源堆到某個(gè)維度上。大家比拼的是在資源有限的前提下,基于定位做產(chǎn)品交付。

戰(zhàn)略的第一步就是放棄,敢放棄什么,拼的是認(rèn)知。

綜上所述——

  • 基于定位來(lái)選擇重要的維度和指標(biāo),做權(quán)重優(yōu)先級(jí)排序。
  • 基于選擇的指標(biāo),使其數(shù)值可衡量,做量化標(biāo)準(zhǔn)。
  • 基于公司資源保障產(chǎn)品下限,基于人才提升上限。

掌握使用說(shuō)明書(shū),這份清單的價(jià)值也就到位了。

 

總結(jié)

人的理性是有限的,在遇到環(huán)境影響而情緒波動(dòng)的時(shí)候,結(jié)果往往不可控。如《清單革命》中所說(shuō)的那樣,以原則清單行事則更加可控,減少糾結(jié)猶豫,提升效率。

筆者在設(shè)計(jì)評(píng)測(cè)指標(biāo)的時(shí)候,往往是朝著最理想的人工智能去做比對(duì)的,它能幫助我們?cè)诟鱾€(gè)維度上去逼近超級(jí)人工智能,打造令人尖叫的產(chǎn)品。

謝謝各位看到這里,希望這份業(yè)務(wù)清單能夠幫助到大家。

責(zé)任編輯:武曉燕 來(lái)源: 51CTO專欄
相關(guān)推薦

2020-05-28 10:15:06

語(yǔ)音技能服務(wù)提供

2020-06-01 14:33:27

語(yǔ)音技能智能

2020-06-08 09:48:31

語(yǔ)音技能智能

2020-05-21 10:24:59

語(yǔ)音技能智能

2020-04-20 10:10:44

NLPAI語(yǔ)音

2023-09-20 16:33:09

大數(shù)據(jù)數(shù)據(jù)指標(biāo)

2021-04-13 06:13:33

微軟人工智能語(yǔ)音技術(shù)

2022-11-03 16:31:08

語(yǔ)音智能語(yǔ)音識(shí)別

2020-02-10 08:20:48

智能語(yǔ)音人工智能物聯(lián)網(wǎng)

2021-06-25 16:10:05

人工智能AI

2023-07-13 06:55:00

2019-05-27 08:00:00

2010-05-13 18:18:58

MySQL root

2020-06-24 07:44:45

JavaScript開(kāi)發(fā)代碼

2014-04-14 11:40:47

云知聲語(yǔ)音

2017-04-13 15:05:39

Gokit機(jī)智云

2015-07-28 14:35:40

2022-01-13 13:53:25

企業(yè)備份災(zāi)難準(zhǔn)備備份系統(tǒng)

2023-05-29 16:55:42

智能化電子秤小凌派

2017-02-23 08:00:04

智能語(yǔ)音Click
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)