自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

語音輸入四強(qiáng)爭霸 搜狗語音輸入后來居上

云計(jì)算
隨著技術(shù)的發(fā)展,互聯(lián)網(wǎng)行業(yè)如今已經(jīng)全面邁入無線時(shí)代,移動端產(chǎn)品在產(chǎn)業(yè)中的重要性正在不斷提高,可謂是“得無線者得天下”,語音識別技術(shù)將更加成熟、應(yīng)用也會更加廣泛。最新數(shù)據(jù)顯示,搜狗無線業(yè)務(wù)總體展現(xiàn)出蓬勃發(fā)展的勢頭,移動用戶總數(shù)和移動搜索份額均穩(wěn)居行業(yè)第二。

隨著智能手機(jī)的不斷推廣,越來越多的新輸入技術(shù)正在得到長足的發(fā)展,而作為最重要的人機(jī)接口之一,語音識別技術(shù)在近年來發(fā)展迅速,相關(guān)應(yīng)用也日趨廣泛。評論認(rèn)為,在不遠(yuǎn)的未來,智能語音接口將有可能促使各種穿戴設(shè)備進(jìn)一步發(fā)展成為可攜帶的“服務(wù)提供者”和“生活伙伴”。在這樣的趨勢下,語音輸入法市場發(fā)展迅猛,僅國內(nèi)就有多家公司推出了具有中文語音輸入功能的產(chǎn)品,其中訊飛、搜狗、百度、微信四家公司的語音產(chǎn)品具有自主研發(fā)的識別技術(shù),在互聯(lián)網(wǎng)業(yè)界產(chǎn)生的影響也較大。近期,北京郵電大學(xué)、重慶郵電大學(xué)針對上述幾家公司所開發(fā)的語音輸入產(chǎn)品做出了評測報(bào)告,展開了一場“四強(qiáng)爭霸賽”。兩所大學(xué)的測評參與人員均有200人之多,每名測試者所使用的測評文本總數(shù)也達(dá)200條,并以細(xì)致的分類覆蓋到語音輸入的各種應(yīng)用場景,使得這場比拼無論從專業(yè)性或是客觀程度上,都十分值得業(yè)界參考。

識別率之戰(zhàn),后來者居上

近十年來,對字、句的識別準(zhǔn)確率一直都是語音輸入技術(shù)研發(fā)的主攻方向。這并沒有看上去那么簡單,輸入法不僅要適應(yīng)不同個(gè)體迥異的聲音特征,更要克服外界環(huán)境中背景噪音所帶來的各種干擾。如果準(zhǔn)確率不足,使用者將被迫對同一輸入信息進(jìn)行重復(fù)識別,或者切換鍵盤輸入,大大影響語音輸入應(yīng)用的使用體驗(yàn)。有鑒于此,參與此次評測的兩所大學(xué)對輸入法準(zhǔn)確率的評估設(shè)計(jì)可謂細(xì)致入微:測試人的性別、地域,不同的環(huán)境干擾,均被考慮在內(nèi)。

 

 

數(shù)據(jù)顯示搜狗在語音輸入的各種場景下表現(xiàn)穩(wěn)定突出(數(shù)值越低越穩(wěn)定)

從測試的結(jié)果來看,4款被測的主流語音輸入法在字識別率上均能超過90%,而在整句準(zhǔn)確率方面則仍有14~24%不等的誤差。這其中,搜狗語音輸入法在各項(xiàng)測評中的表現(xiàn)優(yōu)異,各項(xiàng)測評中差錯(cuò)率均控制在14%~16%之間,比肩、甚至超過訊飛輸入法,而百度、微信語音輸入的性能較之前者則還存在著一定的差距。值得一提的是,語音識別界早就形成的一大共識是:只有識別技術(shù)的整句準(zhǔn)確率達(dá)到83%以上,產(chǎn)品才能真正具備有實(shí)際價(jià)值的可用性。

在四款被測產(chǎn)品中,訊飛以語音合成起家;百度從2010年其就開始了語音識別研究;微信依托騰訊研究院,語音技術(shù)研發(fā)其始于2011年;而搜狗2012年初才開始涉獵語音識別。因此,評測顯示完成自主研發(fā)時(shí)間最短的搜狗,其產(chǎn)品性能卻優(yōu)于同類,不能不說是令人意外。

“深度學(xué)習(xí)”或成點(diǎn)金手

語音輸入不僅需要支持自身產(chǎn)品,還要做到為其他垂直領(lǐng)域(如地圖,搜索和購物等)提供服務(wù)輸出,這就要求識別技術(shù)具有全面、穩(wěn)定的性能,除了能夠高效地處理長句,也要準(zhǔn)確地識別單詞輸入。從測評結(jié)果可以看出,與在整句識別中的高光表現(xiàn)相對的是,訊飛輸入在短詞識別中性能明顯下降。就全面性而言,搜狗則是本次測評中唯一兼具穩(wěn)定性和高性能的產(chǎn)品。

測評參與人員的分析認(rèn)為,能夠取得這樣的成績,離不開搜狗語音輸入所應(yīng)用的“深度神經(jīng)網(wǎng)絡(luò)”(或稱“深度學(xué)習(xí)”)技術(shù)。這一技術(shù)***由微軟引入語音識別領(lǐng)域,是最為前沿的識別技術(shù)之一。微軟技術(shù)報(bào)告顯示,深度神經(jīng)網(wǎng)絡(luò)能夠在各種不同的模式識別場景下提供***的準(zhǔn)確率,但也指出該技術(shù)在實(shí)際應(yīng)用中仍相當(dāng)具有挑戰(zhàn)性。從中不難看出:搜狗或許是國內(nèi)語音領(lǐng)域***個(gè)吃“深度學(xué)習(xí)”這只螃蟹的公司,而能夠在此基礎(chǔ)上以如此快的速度形成高度成熟的產(chǎn)品,搜狗技術(shù)人員的努力實(shí)在令人嘆為觀止。可以說,從開拓創(chuàng)新和擁抱前沿的角度上講,搜狗雖然***起跑,但今天卻已經(jīng)沖刺到了領(lǐng)先的位置上。

方言識別成技術(shù)攻堅(jiān)重點(diǎn)

整句識別是語音輸入最為重要的應(yīng)用場景之一。而從本次評測來看盡管技術(shù)進(jìn)步迅速,但幾大語音輸入產(chǎn)品在整句識別方面仍然存在著從一成多到近三成不等的錯(cuò)誤率,仍有很大的改進(jìn)空間。不得不說,訊飛作為語音識別領(lǐng)域的資深行家,技術(shù)積累從其產(chǎn)品在這一方面的性能上的優(yōu)勢中可見一斑——目前僅有搜狗語音輸入的性能以微弱地差距緊隨其后,其他產(chǎn)品則尚有較大的差距。

據(jù)參與測評的技術(shù)人員介紹,除性別差異外,整句識別誤差主要源自于測試人的地方口音差異(這一點(diǎn)也是此測評的一項(xiàng)關(guān)鍵設(shè)計(jì))。這一結(jié)果也確實(shí)反映出中文語音識別技術(shù)較之其他語言的一個(gè)特有難關(guān)。在此次測試中,僅訊飛和搜狗兩種語音輸入應(yīng)用在面對全國各種主要地方口音時(shí)均能表現(xiàn)出較好的性能(這其中,訊飛甚至已經(jīng)將“方言輸入”作為其主要特點(diǎn)之一)。盡管如此,當(dāng)測試人操較濃重方言時(shí),被測輸入法均只能在背景噪音干擾較低的情況下方能令人滿意地工作??梢灶A(yù)期,如何進(jìn)一步提高識別方言的能力,將成為語音識別領(lǐng)域接下來的研發(fā)重點(diǎn)。

隨著技術(shù)的發(fā)展,互聯(lián)網(wǎng)行業(yè)如今已經(jīng)全面邁入無線時(shí)代,移動端產(chǎn)品在產(chǎn)業(yè)中的重要性正在不斷提高,可謂是“得無線者得天下”,語音識別技術(shù)將更加成熟、應(yīng)用也會更加廣泛。***數(shù)據(jù)顯示,搜狗無線業(yè)務(wù)總體展現(xiàn)出蓬勃發(fā)展的勢頭,移動用戶總數(shù)和移動搜索份額均穩(wěn)居行業(yè)第二。而從搜狗在語音技術(shù)上令人意外的突破上看來,搜狗的確是敏銳而準(zhǔn)確地把握住了未來發(fā)展的主流趨勢,在移動布局上已經(jīng)占得先機(jī),而其在語音識別技術(shù)上的快速發(fā)展也將使其贏得更多。

北郵、重郵完整報(bào)告地址:http://openspeech.sogou.com/Sogou/php/intro/report_dowm.php

責(zé)任編輯:路途 來源: 財(cái)經(jīng)新聞網(wǎng)
相關(guān)推薦

2012-02-03 14:07:43

2023-09-26 06:23:55

OpenAIChatGPT

2016-10-21 20:45:55

商用辦公

2021-04-14 09:51:01

百度

2020-09-11 19:23:08

Windows 10功能語音輸入

2023-05-19 13:56:20

ChatGPTOpenAIAndroid

2023-05-22 09:36:45

ChatGPT功能

2009-05-31 08:42:03

RIAJavaFXFlash

2017-03-22 18:08:18

2022-02-05 08:20:25

DeepSpeech開源軟件開發(fā)

2020-04-27 10:39:19

人工智能技術(shù)語音識別

2011-11-04 09:30:05

虛擬化云計(jì)算虛擬機(jī)

2013-10-14 09:24:01

周回顧UbuntuGroovy

2020-09-22 15:16:49

Python編程語言Julia

2009-03-19 20:33:35

LinuxWindows上網(wǎng)本

2017-04-17 10:48:05

騰訊云

2020-02-12 16:55:51

云計(jì)算谷歌云業(yè)務(wù)

2013-01-10 10:11:27

桌面虛擬化VDIIDV

2023-07-12 13:29:44

2011-04-28 09:43:21

Chrome 11
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號