微軟亞研前沿技術(shù):實時語音翻譯、Kinect 手語翻譯
在微軟亞洲研究院十五周年的紀念活動上,微軟亞研院長洪小文以一幅九宮格數(shù)字圖講述了研究院過去十五載的故事。作為微軟公司在美國本土以外最大的基礎(chǔ)研究機構(gòu),微軟亞研通過一些前瞻性的基礎(chǔ)性研究、產(chǎn)品來推動技術(shù)轉(zhuǎn)移,融入微軟產(chǎn)品,支持公司戰(zhàn)略。
在昨天的活動現(xiàn)場,我們親身體驗了一些前瞻性技術(shù)和產(chǎn)品,包括大數(shù)據(jù)與機器學(xué)習(xí)、云計算與移動技術(shù)、自然用戶界面以及科技引領(lǐng)產(chǎn)品創(chuàng)新等等。它們尚未轉(zhuǎn)化為商用技術(shù),但從中我們可以一窺未來技術(shù)生活的圖景。
實時語音翻譯系統(tǒng)
現(xiàn)場展示了微軟實時語音翻譯系統(tǒng),系統(tǒng)可以將用戶所說的話翻譯成另一種語言并通過語音播放出來,此外,它可以保留用戶說話時具有的口音、音色和語調(diào),盡可能地還原說話者的聲音。目前,這種方法可以實現(xiàn)微軟語音平臺支持的所有 26 種語言間的互譯。
現(xiàn)場演示雖然出現(xiàn)一些翻譯錯誤,但基本上實現(xiàn)了簡單溝通的目的。我們了解到,使用這種語音翻譯軟件,用戶需要進行約一個小時的訓(xùn)練,為自己的語音建立一個模式,并與微軟的標準文字-語音模式融為一體,用于對目標語言的翻譯。
(??Youku??)
基于 Kinect 的手語翻譯系統(tǒng):與聽障人士自由對話
洪小文在現(xiàn)場重點展示了“基于 Kinect 的手語翻譯系統(tǒng)”。這套系統(tǒng)借助了 Kinect 體感設(shè)備捕捉色彩和深度圖像信息,對手語進行識別和翻譯,可以同時對漢語手語和英語手語進行識別與翻譯,并通過語音反饋出來。
除此之外,系統(tǒng)可以將文本信息反向翻譯為手語,從而實現(xiàn)與聽障人士的正常溝通。
(??Youku??)
用大數(shù)據(jù)推斷空氣質(zhì)量
當(dāng)代都市人群對居住的生活環(huán)境越發(fā)關(guān)注,然而特別在大城市,不同地點的空氣質(zhì)量差異很大,而目前人們只能借助城市布局的有限的監(jiān)測站進行判斷,想要隨時了解身邊的空氣質(zhì)量幾乎不可能。
在展示區(qū),我們看到了這樣一套可以實時推斷城市任一地點空氣質(zhì)量的系統(tǒng),它運用數(shù)據(jù)挖掘和機器學(xué)習(xí)技術(shù),對大數(shù)據(jù)進行充分利用,在監(jiān)測信息和對應(yīng)結(jié)果之間建立一個隱式的映射,從而實時推斷出任一地點的空氣質(zhì)量數(shù)據(jù)。
據(jù)工作人員介紹,這一系統(tǒng)的數(shù)據(jù)來源包括氣象狀況、交通流量、人員流動趨向、路網(wǎng)結(jié)構(gòu)以及人口集中點等等。
開發(fā)人員還為改系統(tǒng)開發(fā)了一款 Windows Phone 應(yīng)用,除了顯示當(dāng)前所在位置的空氣質(zhì)量指數(shù),用戶可以自由在手機地圖中選點,并以可視化的方式呈現(xiàn)出來。
Power Map:讓 Excel 的數(shù)據(jù)活起來
在 Excel 中,用戶可以借助 2D 圖表功能,將數(shù)據(jù)轉(zhuǎn)化為餅圖、條形圖等可視化形式,便于 PPT 演示。在展示區(qū),我們看到了一款將 Excel 數(shù)據(jù)轉(zhuǎn)化為 3D 的可視化工具。
現(xiàn)場以 2008 年奧運會中國獎牌信息統(tǒng)計表為例,不同省份的獎牌數(shù)、獎牌種類可以通過 3D 柱形圖映射到地圖上,
洪小文表示,這一技術(shù)已經(jīng)進入到 beta 階段,相信不久就可以作為 3D 數(shù)據(jù)可視化的工具融入到 Excel 之中。