自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

AI能夠自學(xué)翻譯地球上的任何語言了

新聞 人工智能
據(jù) fastcompany 報(bào)道,最新出現(xiàn)的兩個(gè)機(jī)器翻譯系統(tǒng)完成了嶄新的突破——可以在無需人類翻譯文本的學(xué)習(xí)資料的情況下,自主學(xué)習(xí)翻譯地球上的任何語言。

 據(jù) fastcompany 報(bào)道,***出現(xiàn)的兩個(gè)機(jī)器翻譯系統(tǒng)完成了嶄新的突破——可以在無需人類翻譯文本的學(xué)習(xí)資料的情況下,自主學(xué)習(xí)翻譯地球上的任何語言。機(jī)器翻譯發(fā)展驚人,但是地球上還是有數(shù)以億計(jì)的人無法享受它的好處——因?yàn)樗麄兊恼Z言在翻譯器的下拉菜單中根本找不到。

現(xiàn)在,兩個(gè)新的人工智能系統(tǒng)——一個(gè)來自西班牙的 delPaísVasco 大學(xué)(UPV),另一個(gè)來自卡內(nèi)基梅隆大學(xué)(CMU)——承諾會(huì)改變這一切,為像《星際迷航》(Star Trek)中那樣的真正的宇宙通用譯者(universal translator)的到來打開大門。

[[212151]]

要了解這些新系統(tǒng)的潛力,首先要了解當(dāng)前的機(jī)器翻譯是如何工作的。 目前機(jī)器翻譯的事實(shí)標(biāo)桿是谷歌翻譯,這個(gè)系統(tǒng)涵蓋了從南非語到祖魯語的 103 種語言,包括世界上前 10 種語言——順序?yàn)闈h語,西班牙語,英語,印度語,孟加拉語,葡萄牙語,俄語,日語,德語, 和爪哇語。

Google 的系統(tǒng)使用人類監(jiān)督的神經(jīng)網(wǎng)絡(luò),比較平行文本——以前由人類翻譯過的書籍和文章。 通過比較這些平行文本中的大量數(shù)據(jù),Google 翻譯可以學(xué)習(xí)任意兩種指定語言之間的對(duì)等關(guān)系,從而獲得在它們之間快速轉(zhuǎn)換的能力。有時(shí)候翻譯結(jié)果會(huì)很有趣,可能并不能真正反映原文的意思,但總的來說,這些翻譯是功能性的,隨著時(shí)間的推移,他們會(huì)越來越好。

Google 的做法很好,而且很有效。但不幸的是,它并不是全球通用。

這是因?yàn)橛斜O(jiān)督的培訓(xùn)需要很長的時(shí)間以及很多監(jiān)督人員——因?yàn)樘嗔耍雀枋褂昧吮姲?mdash;—也因?yàn)椴⒎鞘澜缢姓Z言之間都有足夠多的并行翻譯文本。想想看:根據(jù)世界語言民族學(xué)目錄,地球上有6,909 種生活語言。其中 414 種的使用人數(shù)占人類總數(shù)的 94%。由于 Google 翻譯涵蓋了 103 個(gè),因此會(huì)留下6,806 種語言沒有機(jī)器翻譯——其中有 311 種語言的使用人數(shù)超過百萬??偟膩碚f,至少有八億人不能享受機(jī)器自動(dòng)翻譯的好處。

這兩個(gè)新的系統(tǒng)——可以在任何語言之間翻譯單詞和句子——無需通過比較大量由人類翻譯的平行文本來學(xué)習(xí)。他們也不需要監(jiān)督。相反,他們使用未監(jiān)督的機(jī)器學(xué)習(xí),并比較不同語言的隨機(jī)文本。這是如何運(yùn)作的?由于語言的詞語分類是相似的,所以系統(tǒng)猜測(cè)這些詞是否相等,用這些信息構(gòu)建翻譯詞典。他們從中找出句子結(jié)構(gòu),通過在不同的語言之間來回翻譯來評(píng)估他們猜測(cè)的結(jié)果。

正如 UPV 的研究員 Mikel Artetxe 所描述的那樣:“想象一下,你給了一個(gè)人很多的中文書籍和阿拉伯語書籍——這些書都不重疊——然后這個(gè)人必須學(xué)會(huì)把中文翻譯成阿拉伯語。 這似乎是不可能的,對(duì)吧?“事實(shí)上,這看起來實(shí)在太不可能了,以至于微軟人工智能專家 Di He(這兩個(gè)研究項(xiàng)目的啟發(fā)者)告訴科學(xué)界,他得知”即使沒有人工監(jiān)控,電腦也可以學(xué)習(xí)翻譯”的時(shí)候,整個(gè)人都震驚了。

一個(gè)警告就是,這個(gè)系統(tǒng)并不像目前的平行文本深度學(xué)習(xí)系統(tǒng)那么精確——但是正如 Di He 指出的那樣,電腦能夠在沒有任何人類指導(dǎo)的情況下猜測(cè)所有這些事實(shí),這一事實(shí)本身簡直不可思議。 我們只是接觸到了這種新的學(xué)習(xí)方法的表面。看起來,可能很快就有一個(gè)真正的通用翻譯,讓我們能夠與任何人用對(duì)方的母語交談了,這不再僅僅是科幻的東西。

責(zé)任編輯:張燕妮 來源: 雷鋒網(wǎng)
相關(guān)推薦

2022-09-07 08:58:52

AI科技樹機(jī)械

2020-06-04 09:22:46

谷歌AI翻譯

2021-02-06 13:58:22

編程語言工業(yè)互聯(lián)網(wǎng)學(xué)習(xí)

2022-07-07 12:38:58

PlatformsMetaNLLB-200

2020-10-21 15:24:42

阿里AI翻譯

2010-03-09 19:27:42

Python翻譯腳本

2020-09-07 14:10:26

AI 數(shù)據(jù)人工智能

2020-10-11 22:05:22

機(jī)器翻譯谷歌AI

2022-04-15 11:52:07

模型開源代碼

2024-06-17 08:49:00

模型語言

2015-11-27 10:37:10

數(shù)據(jù)中心地下數(shù)據(jù)中心

2015-11-09 11:04:49

密碼身份驗(yàn)證生物特征認(rèn)證

2020-11-20 06:12:32

編程語言代碼開發(fā)

2023-10-10 12:19:35

AI指南人工智能

2020-04-21 08:30:32

AI人工智能語言

2020-06-07 15:53:36

人工智能

2020-12-30 10:43:01

人工智能食品安全

2017-08-23 18:31:28

華為

2019-02-18 11:26:49

AI 數(shù)據(jù)人工智能

2019-02-15 14:33:56

AI模型翻譯語言
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)