Windows語音功能,微軟無法言說的痛
原創(chuàng)【51CTO.com原創(chuàng)稿件】在這個(gè)AI橫行的科技時(shí)代,盛行著一種叫做語音輸入功能,它可以使人們脫離鍵盤或輸入設(shè)備的支配,設(shè)想一下,你所說的每一個(gè)字都能被輸入成文本,簡(jiǎn)直開心到起飛。這項(xiàng)功能逐漸被手機(jī)軟件所吸收,卻看不到PC端有任何動(dòng)作,作為編輯可是非常期待PC端可以有強(qiáng)大的語音輸入功能呢。其實(shí)Windows Vista那時(shí)候起就有了語音輸入功能,作者用過那天殺的Vista系統(tǒng),看系統(tǒng)介紹的時(shí)候說可以與系統(tǒng)進(jìn)行語音溝通,當(dāng)時(shí)覺得炫酷,可實(shí)際用起來才知道比訓(xùn)練哈士奇要難的多,哪怕我一字一頓的和系統(tǒng)說他也識(shí)別不出來,默默地留下了淚水后我就放棄了。
但其實(shí)微軟也在努力一雪前恥。
在硬件上,Surface Book等PC產(chǎn)品中的集成式麥克風(fēng)陣列的質(zhì)量,意味著無需使用專用麥克風(fēng)語音識(shí)別就可以達(dá)到很高的準(zhǔn)確率。在使用語音輸入軟件輸入長度為1028個(gè)單詞的文章時(shí),95%的準(zhǔn)確率意味著用戶必須修正逾15個(gè)錯(cuò)誤。在測(cè)試中,Windows語音輸入準(zhǔn)確率為93.6%,從理論上說這一數(shù)值并不高,低于測(cè)試的其他專用語音輸入軟件。Windows有個(gè)奇怪的習(xí)慣,在輸入逗號(hào)時(shí),它會(huì)在文檔中插入“comma”(逗號(hào))這個(gè)詞匯。語音輸入社區(qū)似乎對(duì)這類相對(duì)較小的失誤是否有重要影響有不同看法。
就像作者前面所說的,Windows語音識(shí)別技術(shù)是需要用戶來訓(xùn)練的,隨著時(shí)間推移,語音輸入軟件會(huì)了解用戶口音,“apricot”中“a”的發(fā)音與“bad”還是“ape”中的“a”相同,和如何過濾無意識(shí)的痙攣性語言障礙。微軟員工曾聲稱,經(jīng)過適當(dāng)訓(xùn)練,Windows語音識(shí)別技術(shù)的準(zhǔn)確率可以達(dá)到99%。1000個(gè)單詞出現(xiàn)10個(gè)錯(cuò)誤還不算太壞,但是很少有人愿意去訓(xùn)練一個(gè)系統(tǒng)……然而小娜和Siri不要求用戶進(jìn)行訓(xùn)練,那是因?yàn)樗鼈円呀?jīng)被訓(xùn)練了數(shù)以百萬計(jì)的語音樣本。
其實(shí),如果微軟有心,必定能做出一款出色的語音識(shí)別系統(tǒng),不難發(fā)現(xiàn)語音正在慢慢替代文字。
了解更多熱點(diǎn)新聞,請(qǐng)關(guān)注51CTO《科技新聞早報(bào)》欄目!
【51CTO原創(chuàng)稿件,合作站點(diǎn)轉(zhuǎn)載請(qǐng)注明原文作者和出處為51CTO.com】