微軟逆天突破全雙工語音交互!機(jī)器人真變成了“人”
微軟(亞洲)互聯(lián)網(wǎng)工程院宣布,率先推出新一代的語音交互技術(shù)“全雙工語音交互感官”(Full-duplex Voice Sense),并已完成產(chǎn)品化落地。
全雙工本是通訊傳輸領(lǐng)域的一個術(shù)語,允許數(shù)據(jù)在兩個方向上同時傳輸,與之對應(yīng)的就是半雙工。
傳統(tǒng)的語音識別和機(jī)器對話都類似半雙工,無論單輪還是多輪連續(xù)識別,都需要人說完一句話,機(jī)器才能理解并給出回應(yīng),有點(diǎn)像傳統(tǒng)武俠游戲的回合式戰(zhàn)斗。
而微軟的這項(xiàng)新技術(shù)可以實(shí)時預(yù)測人類即將說出的內(nèi)容,實(shí)時生成回應(yīng),并控制對話節(jié)奏,從而使長程語音交互成為可能。
采用該技術(shù)的智能硬件設(shè)備,也不需要用戶在每輪交互時都說出喚醒詞,僅需一次喚醒,就可以輕松實(shí)現(xiàn)連續(xù)對話,使人與機(jī)器的對話更像人與人的自然交流。
目前,這項(xiàng)技術(shù)已首先在微軟小冰全球產(chǎn)品線中落地,其中在中國市場,不但有中國科技館的小冰電話亭,微軟還與小米緊密合作,將其融入到米家生態(tài)鏈 Yeelight 語音助手的市售硬件產(chǎn)品。
這是全球***搭載全雙工語音交互感官的智能設(shè)備,也是內(nèi)置微軟小冰的***“雙 AI”智能設(shè)備。
在日本市場,小冰凜菜(りんな)已通過該技術(shù)實(shí)現(xiàn)在直播平臺中的落地,***車載智能項(xiàng)目也已開始路試。
微軟計劃在未來六個月內(nèi),完成該技術(shù)在更多產(chǎn)品線中的覆蓋。
微軟全球資深副總裁、微軟(亞洲)互聯(lián)網(wǎng)工程院院長王永東博士表示:“我們預(yù)測,未來一年中,人工智能應(yīng)用將越來越多地從某些單一技術(shù)領(lǐng)域,進(jìn)入到發(fā)揮綜合能力的階段。微軟已在這方面深入布局。此次全雙工語音交互技術(shù)的推出,不僅涉及到計算機(jī)語音技術(shù),還包括自然語言處理、人工智能內(nèi)容創(chuàng)造等多個領(lǐng)域。這正是微軟在這些領(lǐng)域長期儲備、綜合運(yùn)用的成果之一。”
微軟小冰全球研發(fā)負(fù)責(zé)人周力博士表示:“從已落地的產(chǎn)品數(shù)據(jù)和用戶反饋中,我們觀察到一個普遍現(xiàn)象:用戶一旦使用過微軟小冰的全雙工語音交互感官之后,再與其他語音助手交互時,他們普遍會開始感到不習(xí)慣,甚至?xí)l繁忘記要對其他語音助手說喚醒詞——新技術(shù)促進(jìn)擬人自然度的顯著提升,使人們對過去單輪或多輪連續(xù)語音交互體驗(yàn)的滿意度迅速下降。這種新老交替的現(xiàn)象,符合我們的研發(fā)預(yù)期。”