語(yǔ)音識(shí)別:市場(chǎng)前景可觀,但核心技術(shù)仍需突破
隨著人工智能產(chǎn)品在生活中的滲透率越來(lái)越高,其中技術(shù)的發(fā)展也成為了眾人關(guān)心的重點(diǎn)所在。作為人機(jī)自然交互的基本途徑之一,近期以來(lái),語(yǔ)音識(shí)別的發(fā)展不可謂不快速。
當(dāng)下,諸如科大訊飛、百度等多家企業(yè)聲稱,其研發(fā)的語(yǔ)音識(shí)別技術(shù)已經(jīng)達(dá)到了97%的準(zhǔn)確率。而在日前,谷歌研究員公開(kāi)表示其語(yǔ)音識(shí)別的錯(cuò)誤率(將一個(gè)詞語(yǔ)從語(yǔ)音轉(zhuǎn)錄成為文字時(shí)的錯(cuò)誤率)自2012年以來(lái)已經(jīng)降低了30%以上……縱觀過(guò)去的2016年,谷歌、蘋果和微軟等多家科技巨頭都公布了自己在語(yǔ)音識(shí)別上的進(jìn)展和突破,而在接下來(lái)的時(shí)間里,語(yǔ)音識(shí)別也將是2017年的發(fā)展重點(diǎn)之一。
新興產(chǎn)業(yè)市場(chǎng)廣闊,推動(dòng)語(yǔ)音識(shí)別技術(shù)發(fā)展
在剛剛過(guò)去不久的CES 2017展會(huì)上,我們見(jiàn)到了許多人工智能產(chǎn)品,要是來(lái)一場(chǎng)評(píng)比大賽,自動(dòng)駕駛和智能家居絕對(duì)是主角。不過(guò),再往深究,語(yǔ)音識(shí)別技術(shù)才是此次展會(huì)人工智能部分的“亮點(diǎn)”。
智能家居
在智能家居,不管是智能家電還是機(jī)器人,語(yǔ)音識(shí)別技術(shù)都是必備的基本功能之一。據(jù)知名市場(chǎng)調(diào)研公司《Markets And Markets》發(fā)布的調(diào)查報(bào)告稱,全球智能家居市場(chǎng)規(guī)模將在2022年達(dá)到1220億美元,2016-2022年年均增長(zhǎng)率預(yù)測(cè)為14%。而在機(jī)器人方面,研究機(jī)構(gòu)IDC預(yù)測(cè),至2020年,全球機(jī)器人與相關(guān)服務(wù)市場(chǎng)規(guī)模將由2016年的915億美元增至1880億美元。從這兩點(diǎn)數(shù)據(jù)來(lái)看,可想而知未來(lái)智能家居的市場(chǎng)之大。
在控制方式上,除了部分智能家電之外,語(yǔ)音控制已經(jīng)成為了市場(chǎng)的主流,而這就是語(yǔ)音識(shí)別市場(chǎng)的商機(jī)。未來(lái),作為人機(jī)自然交互的前提之一,語(yǔ)音識(shí)別必然是智能家居的發(fā)展趨勢(shì),只有語(yǔ)音識(shí)別的準(zhǔn)確率接近完美,人機(jī)的自然交互才能繼續(xù)開(kāi)展。在智能家居市場(chǎng)的推動(dòng)下,語(yǔ)音識(shí)別技術(shù)必將成為重點(diǎn)發(fā)展對(duì)象。
智能汽車
在CES 2017展會(huì)上,各大傳統(tǒng)汽車制造商都帶來(lái)了自己在自動(dòng)駕駛汽車的最新成果。與此同時(shí),在展會(huì)上,除了展示成果,不少?gòu)S商也宣布了自己的一系列計(jì)劃,其中就包括在汽車中加入虛擬助手平臺(tái),以促進(jìn)人車交互,進(jìn)一步提升用戶體驗(yàn),比如日產(chǎn)、寶馬與Cortana的合作,還有福特與Alexa的聯(lián)手。
根據(jù)美國(guó)市場(chǎng)研究機(jī)構(gòu)勒克斯的研究報(bào)告顯示,自動(dòng)駕駛汽車將在2030年創(chuàng)造價(jià)值870億美元的市場(chǎng)。此外,另有研究顯示,2030年全球范圍將售出約1.2億輛自動(dòng)駕駛汽車。從數(shù)據(jù)來(lái)看,自動(dòng)駕駛汽車的市場(chǎng)十分具有看頭。
自動(dòng)駕駛市場(chǎng)的推動(dòng)下,人車交互也成了自動(dòng)駕駛玩家的一個(gè)關(guān)注點(diǎn),是汽車智能化的一部分。此外,相對(duì)于自動(dòng)駕駛輔助技術(shù),語(yǔ)音識(shí)別等交互技術(shù)的實(shí)現(xiàn)則容易得多,目前也已有不少車型搭載了語(yǔ)音識(shí)別技術(shù)。在智能汽車中,語(yǔ)音識(shí)別已經(jīng)成為了一項(xiàng)基礎(chǔ)的服務(wù),而隨著智能化時(shí)代的來(lái)臨,人們對(duì)語(yǔ)音識(shí)別的要求也會(huì)進(jìn)一步提升。
未來(lái)市場(chǎng)可觀,而語(yǔ)音識(shí)別仍需“做事”
在新興產(chǎn)業(yè)市場(chǎng)需求的推動(dòng)下,語(yǔ)音識(shí)別的市場(chǎng)也是十分具有看頭的,有研究機(jī)構(gòu)指出,預(yù)計(jì)到2020年,全球語(yǔ)音識(shí)別的市場(chǎng)規(guī)模將從2015年的61.9億美元增長(zhǎng)到200億美元。然而,在市場(chǎng)規(guī)模壯大這一美好的預(yù)測(cè)面前,我們也不能忽視一些需要面對(duì)的問(wèn)題,只有解決了它們,語(yǔ)音識(shí)別才能得到完善,給用戶帶來(lái)極致服務(wù)。
首先就是對(duì)象識(shí)別的準(zhǔn)確性。現(xiàn)在,在應(yīng)用上,我們看見(jiàn)語(yǔ)音識(shí)別多是在智能家居領(lǐng)域,包括智能家電和服務(wù)機(jī)器人。此時(shí),我們就要考慮一個(gè)問(wèn)題了,當(dāng)多個(gè)家庭成員同時(shí)講話時(shí),智能家電和服務(wù)機(jī)器人該執(zhí)行誰(shuí)的命令呢?它們又如何能在眾聲音中找出自己主人的命令?這些都是當(dāng)前語(yǔ)音識(shí)別所需要解決的問(wèn)題,畢竟我們通常所說(shuō)的語(yǔ)音識(shí)別不僅僅只是單純的對(duì)語(yǔ)音內(nèi)容進(jìn)行識(shí)別。
在這個(gè)問(wèn)題上,人們也找到了一個(gè)解決方案——聲紋識(shí)別。一般來(lái)講,聲紋具有唯一性,對(duì)說(shuō)話人身份的確認(rèn)有著極大的幫助。借助于聲紋識(shí)別,語(yǔ)音識(shí)別能夠準(zhǔn)確對(duì)說(shuō)話人的位置和身份進(jìn)行定位,從而準(zhǔn)確識(shí)別語(yǔ)音內(nèi)容,執(zhí)行其中下達(dá)的指令。不過(guò),鑒于數(shù)據(jù)的極大空缺等問(wèn)題,聲紋識(shí)別技術(shù)還需完善。
其次是降低周邊環(huán)境的干擾。對(duì)于人類來(lái)講,在嘈雜環(huán)境中聽(tīng)別人說(shuō)話或是從眾多聲音中找出自己想聽(tīng)的內(nèi)容還是一件較為簡(jiǎn)單的事,而與此相反,這件事在機(jī)器這里并沒(méi)有那么容易。
為了降低周邊環(huán)境對(duì)語(yǔ)音識(shí)別的干擾,亞馬遜和谷歌都在智能音箱中使用了麥克風(fēng)陣列技術(shù),從而起到一定的“降噪”作用,增加語(yǔ)音識(shí)別的準(zhǔn)確率。不過(guò),到目前為止,環(huán)境的干擾依然沒(méi)有得到更好的解決,仍然是語(yǔ)音識(shí)別前進(jìn)道路中的一只“攔路虎”,尤其是在多段語(yǔ)音中準(zhǔn)確找出指定說(shuō)話人的情境中。
在一次采訪中,人工智能和機(jī)器學(xué)習(xí)權(quán)威學(xué)者、百度首席科學(xué)家吳恩達(dá)表示,2017年是“對(duì)話式電腦”快速發(fā)展的一年。對(duì)話式電腦,諸如聊天機(jī)器人、人工智能虛擬助手之類,作為展開(kāi)對(duì)話的第一步,語(yǔ)音識(shí)別也屬于這快速發(fā)展的一部分。
在智能家居、智能汽車等多種產(chǎn)業(yè)以及聊天機(jī)器人、虛擬助手這些產(chǎn)品市場(chǎng)的推動(dòng)下,語(yǔ)音識(shí)別的市場(chǎng)正在不斷擴(kuò)大,同時(shí)也是對(duì)它準(zhǔn)確性的一個(gè)挑戰(zhàn)。
2016年,在語(yǔ)音識(shí)別內(nèi)容的準(zhǔn)確率上,各科技企業(yè)和團(tuán)隊(duì)都有了相應(yīng)的突破,而在接下來(lái)的一年里,如何降低周邊環(huán)境的干擾以及如何提高對(duì)聲音的識(shí)別準(zhǔn)確率將是語(yǔ)音識(shí)別所要解決的問(wèn)題。