Microsoft Translator:打破語言障礙 拓展全球溝通新機遇
世界越來越小,全球協(xié)作、共同創(chuàng)新已經(jīng)成為常態(tài)。在微軟研究院,我們對此尤為感同身受——從北京到雷德蒙,從劍橋到班加羅爾,全球范圍內(nèi)的無邊界溝通與協(xié)作是我們科研合作與產(chǎn)品創(chuàng)新的關(guān)鍵基礎(chǔ)。全球一體化帶來的發(fā)展機遇應(yīng)該屬于每個人,為了幫助全球各地的人們跨越語言的障礙,實現(xiàn)高效溝通與廣泛協(xié)作,我們帶來了Microsoft Translator.
Microsoft Translator是微軟以機器學(xué)習(xí)、大數(shù)據(jù)、自然語言和云計算等前沿技術(shù)為基礎(chǔ)打造的自動翻譯服務(wù),也是微軟眾多人工智能研究成果中投入使用最早也最廣泛的應(yīng)用之一。Microsoft Translator現(xiàn)已支持50多種語言的文本翻譯、8種語言的實時語音翻譯和18種語言的語音識別和輸出。就在2016年7月底,我們在中文簡體和繁體的基礎(chǔ)上,***加入了粵語文本翻譯,進一步完善了對漢語應(yīng)用環(huán)境的支持。
自我學(xué)習(xí)的智能翻譯
“統(tǒng)計機器翻譯”是Microsoft Translator背后的主要技術(shù),它以微軟十幾年來在自然語言領(lǐng)域的研究為基礎(chǔ),加入了統(tǒng)計學(xué)與機器學(xué)習(xí)的原理。簡單地說,這套翻譯體系將“翻譯”轉(zhuǎn)變成了一個機器學(xué)習(xí)的課題,讓計算機不斷地對訓(xùn)練數(shù)據(jù)中的人工譯文和語言轉(zhuǎn)換結(jié)果進行判斷與學(xué)習(xí),在不斷的糾錯與改正中,促進系統(tǒng)算法的自我完善與優(yōu)化。通過統(tǒng)計建模技術(shù)和高效的算法,不斷學(xué)習(xí)優(yōu)化的機器翻譯系統(tǒng)能學(xué)會根據(jù)上下文的語境,而不是單詞的意思和生硬的語法規(guī)則來匹配最恰當(dāng)?shù)姆g結(jié)果。
要說Microsoft Translator的智能來自于機器學(xué)習(xí)、自然語言等技術(shù),而它的可靠運行與不斷優(yōu)化,則離不開微軟在各領(lǐng)域的資源優(yōu)勢。例如,作為一項云服務(wù),Microsoft Translator運行于Microsoft Azure云平臺,Azure提供了機器學(xué)習(xí)等高級分析功能的運行平臺,同時也確保了其作為SaaS云服務(wù)的高可用性和數(shù)據(jù)安全性,并且它還可以根據(jù)需要彈性擴展運算規(guī)模。另一方面,覆蓋全球的必應(yīng)搜索引擎,也為Microsoft Translator提供了全球規(guī)模的語言素材與學(xué)習(xí)資料,讓機器學(xué)習(xí)系統(tǒng)得以不斷地成長和完善。
與此同時,微軟旗下多樣化的產(chǎn)品與服務(wù),也為Microsoft Translator提供了施展才華的廣闊天地。從2006年起,Microsoft Translator便逐漸開始為越來越多的微軟產(chǎn)品提供自動文本翻譯功能,例如Office、必應(yīng)搜索、IE和Edge瀏覽器、Skype、微軟小娜(Cortana)等等。或許你還沒有意識到,但它其實一直都在你身邊——在電腦的Word界面中點擊“審閱”菜單項,然后選擇“翻譯”圖標(biāo),你就能領(lǐng)略到Microsoft Translator的本領(lǐng)了。
讓你自然交流的智能語音翻譯
在2016年3月底舉辦的Build 2016微軟開發(fā)者大會上,微軟CEO薩提亞·納德拉指明了微軟乃至IT產(chǎn)業(yè)未來的一個發(fā)展方向:讓人類的自然語言與先進的機器智能進行交互,也就是“對話即平臺(Conversation as a Platform)”的概念,并且發(fā)布了“微軟機器人框架(Microsoft Bot Framework)”以及微軟認(rèn)知服務(wù)(Microsoft Cognitive Service),用以幫助開發(fā)者打造新一代的人工智能應(yīng)用。事實上,作為一個能聽會說多種語言的人工智能服務(wù),Microsoft Translator在語音翻譯服務(wù)方面已經(jīng)提前取得了成功的實踐。
早在2014年,Microsoft Translator即推出了語音翻譯服務(wù),2016年3月又面向開發(fā)者開放了語音翻譯的API。目前Microsoft Translator支持對包括中文普通話在內(nèi)的8種語言的實時語音翻譯(英語、法語、中文、德語、意大利語、西班牙語、阿拉伯語、葡萄牙語)。在Skype Translator以及Windows、iOS或者Android版的Microsoft Translator應(yīng)用中,你都可以體驗到這項私人實時口譯服務(wù)。
語音翻譯要比文本翻譯復(fù)雜得多,需要經(jīng)過自動語音識別(ASR)、TrueText智能文本校正、自動文本翻譯以及文本到語音轉(zhuǎn)換(TTS)四個步驟。
圖1:Microsoft Translator語音翻譯背后的技術(shù)
其中,自動語音識別借助深層神經(jīng)網(wǎng)絡(luò),對數(shù)千小時不同語言的音頻數(shù)據(jù)進行分析和學(xué)習(xí),以達到“聽懂”人類自然語音的目的——基于機器學(xué)習(xí),語音識別的效果也會隨數(shù)據(jù)的積累而不斷完善。
TrueText智能文本校正則負(fù)責(zé)將人們口語化的交流轉(zhuǎn)換為規(guī)范的文本,比如,去掉“嗯”、“啊”、“這個”、“那個”之類的贅詞以及重復(fù)、口吃等語病,并添加斷句、標(biāo)點符號,從而讓文本更貼近用戶本來的意圖,也更易閱讀和翻譯。在文本翻譯基礎(chǔ)上增強的語音翻譯引擎,增加了更多口語文本語料庫,從而為口語會話類翻譯構(gòu)建了更好的模型。 ***是文本到語音的轉(zhuǎn)換過程,如果翻譯的目標(biāo)語言是Microsoft Translator目前所支持的 18 種轉(zhuǎn)換語言之一,那么就能使用語音合成技術(shù)將翻譯后的文本轉(zhuǎn)換成語音播放出來。整個語音翻譯過程中,深層神經(jīng)網(wǎng)絡(luò)(DNNs)技術(shù)的引入,則極大程度地降低了翻譯的錯誤率,提高了可靠性。
帶上你的私人翻譯,暢行天下
為了讓更多用戶可以隨時隨地、便捷地使用翻譯服務(wù),Microsoft Translator面向不同平臺推出了移動端應(yīng)用。這款應(yīng)用不僅適用于Windows設(shè)備,同時還支持使用iOS、Android平臺的設(shè)備,甚至包括Apple Watch和Android Wear智能手表。
圖2:Microsoft Translator移動端應(yīng)用
運行于智能終端的Microsoft Translator經(jīng)過持續(xù)的完善與升級,目前已經(jīng)發(fā)展的非常成熟,不但支持眾多語言的翻譯功能,而且還可以提供離線翻譯選項。用戶既可以用鍵盤輸入或者粘貼文本,也可以利用麥克風(fēng)直接錄入語音,或者是將看到的外國文字拍攝下來,讓軟件自動識別并翻譯。在***版本中,我們還加入了支持8種語言的實時語音翻譯功能,讓語言不通的兩個人,僅憑一部手機就能進行面對面的實時語音交流。
Microsoft Translator移動端應(yīng)用絕對是海外旅行必備的利器,它不但可以幫我問路,還能靠拍照辨認(rèn)街道、商鋪和沒有圖片的菜單,甚至可以讓我和五湖四海的新朋友進行一次真正有意義的談話,真正體會到四海一家的暢快溝通。
在中國越來越流行的“海淘”則是Microsoft Translator的另一個用武之地?;贛icrosoft Translator技術(shù)的必應(yīng)翻譯(bing.com/translator)提供了在線文本翻譯和網(wǎng)站翻譯功能,只需輸入你的海淘網(wǎng)址,就能實現(xiàn)整個網(wǎng)頁的機器翻譯,并且同樣支持50多種語言,讓你的海外購物無障礙。Windows 10用戶通過添加Edge瀏覽器的Translator擴展插件,即可一鍵翻譯整個網(wǎng)頁或者文本。
在你最熟悉的微信中,也有Microsoft Translator的身影。只需在對話界面中,長按對話氣泡內(nèi)出現(xiàn)的法語、日語或者阿拉伯語等文本,選擇“翻譯”,就會出現(xiàn)“微軟翻譯”給你帶來的中文譯文。
企業(yè)要國際化,還是本土化?我們都能幫忙
在全球市場一體化的今天,Microsoft Translator在商業(yè)領(lǐng)域和企業(yè)市場的應(yīng)用前景也越發(fā)清晰起來。無論是海外企業(yè)拓展中國市場的本土化改造,還是中國企業(yè)出海發(fā)展的“走出去”戰(zhàn)略,我們都能助一臂之力。
Microsoft Translator所提供的文本和語音翻譯服務(wù),可以幫助跨國企業(yè)實現(xiàn)無障礙的內(nèi)部溝通和內(nèi)部培訓(xùn)、面向全球市場提供客戶支持、建設(shè)在線社區(qū),并實現(xiàn)網(wǎng)站、文檔資料、商業(yè)智能的實時、雙向或多向的翻譯。相比傳統(tǒng)的本土化手段,作為云服務(wù)出現(xiàn)的Microsoft Translator提供了按需付費的低成本、可定制的跨平臺開發(fā)和接入能力,可以確保符合企業(yè)IT的安全策略,并提供了業(yè)界唯一支持行業(yè)用戶定制的翻譯語料庫。目前,Microsoft Translator已經(jīng)服務(wù)于全球上千家企業(yè)客戶,包括亞馬遜、eBay、Twitter、惠普、戴爾等,都在各自的業(yè)務(wù)全球化、本土化領(lǐng)域中得到了Microsoft Translator的幫助。
圖3:Microsoft Translator的客戶
在7月份剛剛結(jié)束的WPC 2016微軟合作伙伴大會上,微軟宣布將在今年年底前為Office 365企業(yè)用戶提供Skype Meeting Broadcast服務(wù),它可以自動為網(wǎng)絡(luò)會議添加字幕,并將會議實時地翻譯成不同語言展現(xiàn)出來——這同樣都是基于Microsoft Translator實現(xiàn)的。
開放的API帶來開放的發(fā)展機遇
今天的微軟是一家生產(chǎn)力與平臺公司,我們致力于打造創(chuàng)新平臺,助力合作伙伴和生態(tài)系統(tǒng)的共同發(fā)展。在應(yīng)用前景廣闊的智能文本和語音翻譯領(lǐng)域, Microsoft Translator也為人們帶來了創(chuàng)新機遇。
事實上,從2011 年起,Microsoft Translator便開放了 API,并以Azure云平臺SaaS服務(wù)的形式向第三方提供云端接入服務(wù)。目前,全球已有數(shù)千家客戶在使用此服務(wù),來實現(xiàn)網(wǎng)站本地化、多語言客戶支持、電子商務(wù)、社交媒體、網(wǎng)絡(luò)游戲、商業(yè)智能等典型應(yīng)用場景。Microsoft Translator API 可以輕松實現(xiàn)跨平臺接入第三方系統(tǒng)及應(yīng)用,開發(fā)者只需在Azure Data Market網(wǎng)站 (datamarket.azure.com/browse/Data)上注冊使用,即可獲得每月200萬字符的免費翻譯服務(wù)。
微軟的使命是予力全球每一人、每一組織成就不凡。我們希望Microsoft Translator通過微軟的產(chǎn)品為消費者提供服務(wù)的同時,可以予力更多開發(fā)者和企業(yè),為全球更多用戶提供多樣的翻譯服務(wù),打破語言間的壁壘,促進世界各地人們的溝通、交流。