阿里虛擬主播上崗雙11,能說能跳還會Rap
記者獲悉,雙11前夕,阿里AI虛擬主播現(xiàn)身淘寶直播間,替代真人主播“上崗”雙11。該虛擬主播形神兼?zhèn)?,聲音、情緒、動作逼近真人,不僅能聽會說,與千萬觀眾對答如流,還會跳舞、Rap,完成各種復(fù)雜動作。據(jù)悉,阿里AI虛擬主播即將在紀(jì)梵希、歐萊雅和雀巢等商家直播間上線。
直播已成電商、金融等領(lǐng)域的標(biāo)配,由于真人主播成本高、在線時間有限,具有認(rèn)知能力的虛擬主播因此成為可以替代真人最佳選擇。
不同于傳統(tǒng)虛擬人機(jī)械化的表達(dá),阿里虛擬主播率先融合了達(dá)摩院最前沿的認(rèn)知智能和感知智能技術(shù),其表情動作、直播內(nèi)容可以根據(jù)直播情況而實時變化。例如,基于阿里自研的深度網(wǎng)絡(luò)模型,虛擬主播喊出 “OMG!”這樣的口頭禪時,會配合展現(xiàn)相應(yīng)的嘴型、表情和肢體語言動作,表露出驚訝的神態(tài)。另外,虛擬主播還可以和直播間的千萬級用戶實時互動,無論是閑聊還是對商品提出疑問,虛擬主播都會實時做出回應(yīng)。
據(jù)介紹,淘寶直播間背后還采用了窄帶高清、大規(guī)模低延時等基礎(chǔ)創(chuàng)新技術(shù),例如低延時技術(shù)可以讓世界各地不同環(huán)境、不同設(shè)備的消費(fèi)者,能同步接收到畫面和聲音。
達(dá)摩院智能服務(wù)團(tuán)隊負(fù)責(zé)人趙昆表示,“虛擬主播背后是一套復(fù)雜的算法和工程體系,涵蓋了視覺、語音、自然語言處理等多模態(tài)融合算法,這是機(jī)器能和人自然溝通的基礎(chǔ),未來,我們將繼續(xù)將這套人機(jī)交互技術(shù)應(yīng)用到金融、教育、醫(yī)療等領(lǐng)域。”






