自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

并非里程碑! Facebook的100種語言互譯模型夸大宣傳遭質(zhì)疑

新聞 人工智能
昨天,F(xiàn)acebook剛剛宣布其機(jī)器翻譯取得里程碑式進(jìn)展,可在100種語言之間實(shí)現(xiàn)互譯,并且不依賴英語這個(gè)「中介」,今天reddit網(wǎng)友就來掀車了。

[[347640]]

 Facebook又翻車了?

昨天,F(xiàn)acebook剛剛宣布其機(jī)器翻譯取得里程碑式進(jìn)展,可在100種語言之間實(shí)現(xiàn)互譯,并且不依賴英語這個(gè)「中介」,今天reddit網(wǎng)友就來掀車了。

該網(wǎng)友稱,F(xiàn)acebook此前也有過夸大宣傳,但這次有點(diǎn)過了。

Facebook 的100種語言互譯并非里程碑?

Facebook聲稱,最新的模型可直接進(jìn)行多達(dá)100種語言的機(jī)器翻譯,比如從漢語到法語,且訓(xùn)練的時(shí)候的無需英語作為中介。在評(píng)估機(jī)器翻譯廣泛使用的 BLEU 指標(biāo)上,它比以英語為中心的翻譯系統(tǒng)性能高出10個(gè)百分點(diǎn)。

而Facebook AI實(shí)驗(yàn)室的博客中并未提及,谷歌早在4年前就做了這件事。

谷歌在16年發(fā)布的這一研究成果,也是一個(gè)端到端的學(xué)習(xí)框架,從數(shù)以百萬計(jì)的例子中學(xué)習(xí),并顯著提高了翻譯質(zhì)量。

這個(gè)翻譯系統(tǒng)不僅提高了測(cè)試數(shù)據(jù)上的翻譯質(zhì)量,而且可以支持103種語言的互譯,每天翻譯超過1400億個(gè)單詞。雖然還面臨一些問題,但是谷歌確實(shí)做到了100種語言。

那我們來看看,谷歌的這套系統(tǒng)是如何運(yùn)作的。

谷歌的這一算法是零樣本學(xué)習(xí)的,假設(shè)我們用日語、英語和韓語的例子來實(shí)現(xiàn)一個(gè)多語言翻譯系統(tǒng),與單個(gè) GNMT 系統(tǒng)的大小相同,它通過共享參數(shù)來在這幾個(gè)不同的語言對(duì)之間進(jìn)行翻譯。這種共享使系統(tǒng)能夠?qū)ⅰ阜g經(jīng)驗(yàn)」從一種語言對(duì)轉(zhuǎn)移到另一種語言對(duì)。

「Facebook宣稱的不依賴英語數(shù)據(jù),也是不準(zhǔn)確的」。

Facebook的論文圖表顯示,使用的數(shù)據(jù)集中有一部分是包含英語的,要說完全沒有依賴英語,有點(diǎn)抹殺英語起到的作用了。

到目前為止,谷歌有論文討論關(guān)于103種語言的訓(xùn)練,以及一篇不「依賴英語數(shù)據(jù)」的單獨(dú)論文。

谷歌2019年發(fā)表的大規(guī)模多語言機(jī)器翻譯,支持103種語言,但是源語言或者目標(biāo)語言是英語。

從技術(shù)準(zhǔn)確性的角度來看,的確很難找到一篇能同時(shí)滿足兩個(gè)要求的論文: 不依賴英語數(shù)據(jù)和超過100種語言。

網(wǎng)友認(rèn)為,一個(gè)非誤導(dǎo)性的說法應(yīng)該是,「Facebook 創(chuàng)造了一個(gè)巨大的NMT 數(shù)據(jù)集,并在上面訓(xùn)練一個(gè)Transformer?!?/p>

不管Facebook的說法準(zhǔn)不準(zhǔn)確,它的模型效果確實(shí)比以前更好了,也開源了相關(guān)的數(shù)據(jù)集和代碼,有計(jì)算資源的同學(xué)可以去驗(yàn)證一下。

那么,人類翻譯會(huì)被機(jī)器翻譯所取代嗎?

機(jī)器翻譯將全面取代人類翻譯?想多了!

隨著機(jī)器翻譯技術(shù)的不斷進(jìn)步,這也成為越來越多的人尤其是翻譯行業(yè)的人,最關(guān)心的問題。

這并非「杞人憂天」。

無論是Facebook最近開源的M2M-100模型,還是谷歌之前發(fā)布的支持103種語言的AI翻譯,都顯示出機(jī)器翻譯在取代人類翻譯上的巨大可能性。

不過,就機(jī)器翻譯目前的發(fā)展情況來看,想要完全取代人類翻譯還是不太現(xiàn)實(shí)的。

從技術(shù)上來看,目前機(jī)器翻譯還存有很多技術(shù)難點(diǎn)亟待攻克,比如語序混亂、詞義不準(zhǔn)確、孤立地進(jìn)行句法分析等。

從實(shí)際應(yīng)用上來看,在一些偏口語化的翻譯場(chǎng)景、對(duì)專業(yè)知識(shí)背景要求比較高的場(chǎng)景以及大段對(duì)話的場(chǎng)景,機(jī)器翻譯都無法做到準(zhǔn)確而迅速的翻譯。

此前就有媒體爆料出許多機(jī)器翻譯的「翻車」事件,例如大型會(huì)議的機(jī)器同傳翻譯出現(xiàn)大段語句不通的內(nèi)容,一些人名無法識(shí)別,一些日常對(duì)話也被翻譯得啼笑皆非…

盡管從表現(xiàn)上來看不那么盡如人意,但機(jī)器翻譯的快速發(fā)展無疑會(huì)淘汰掉一批低水平的人類翻譯者,那些只能進(jìn)行「低端」翻譯的人類翻譯者無疑會(huì)被機(jī)器翻譯所替代。

而真正的高水平翻譯者則完全不需要擔(dān)心這個(gè)問題。即便是目前最先進(jìn)的機(jī)器翻譯,距離「信、達(dá)、雅」的翻譯要求也還有很大差距。

相反,機(jī)器翻譯可以把高水平的翻譯者們從一些機(jī)械、枯燥的簡(jiǎn)單翻譯工作中解放出來,讓機(jī)器翻譯成為工具,抽出精力去從事更富有創(chuàng)造性的工作。

實(shí)際上,未來的譯者可能更接近編輯和質(zhì)量把關(guān)專家,更多的是對(duì)機(jī)器翻譯的初稿進(jìn)行修改潤(rùn)色和文學(xué)創(chuàng)作。

總而言之,機(jī)器翻譯全面取代人類翻譯目前來看是個(gè)沒譜的事。

AI公司喜歡夸大宣傳,人工智能基于「ifelse」?

Facebook這個(gè)看似要替代人類翻譯的模型,引起了不少討論。

有網(wǎng)友甚至認(rèn)為機(jī)器學(xué)習(xí)領(lǐng)域總是被輿論誤導(dǎo)。

一些大公司的研究或者發(fā)聲更容易被聽到,甚至在論文接受上,也享有一定的優(yōu)勢(shì)。

雖然現(xiàn)在大多數(shù)頂會(huì)的論文審核都是雙盲的,但是審稿人很容易判斷作者的背景情況,比如說論文中的模型使用了幾千個(gè)TPU,那來自大廠無疑了。

谷歌、Facebook這樣的大型科技公司確實(shí)占據(jù)了很多有利地位。

一些AI公司喜歡利用這些論文,夸大AI在實(shí)際中的作用。

而且新聞稿有時(shí)是由非研究人員根據(jù)有限的描述或論文摘要撰寫的,可能沒有進(jìn)行任何事實(shí)核查,導(dǎo)致一定的偏差。

之前,推特上有一條點(diǎn)Uber的消息吸引了不少關(guān)注,這則推文引用了一份新聞稿,其中指出:「Uber 將使用人工智能來識(shí)別醉酒的乘客,AI系統(tǒng)使用當(dāng)前時(shí)間、上車地點(diǎn)以及用戶的猶豫時(shí)間等參數(shù)來判斷?!?/p>

下面寫了一句:「那不是AI。那只是if語句而已」,還給出了實(shí)現(xiàn)這一智能識(shí)別系統(tǒng)的代碼,一共需要兩行:

事實(shí)上可能并不這么簡(jiǎn)單。

Uber 可能會(huì)使用機(jī)器學(xué)習(xí),并根據(jù)以往的數(shù)據(jù)來微調(diào)模型的權(quán)重,還可以把錯(cuò)誤的判斷用來更新預(yù)測(cè)模型,但是有些AI應(yīng)用的確沒有論文中那么好。

那么,你寫過基于ifelse的人工智能應(yīng)用嗎?

 

責(zé)任編輯:張燕妮 來源: 新智元
相關(guān)推薦

2016-09-29 09:46:41

JavascriptWeb前端

2011-09-10 19:23:22

2012-01-13 13:50:46

博科100千兆以太網(wǎng)

2011-09-09 13:42:16

2010-10-11 10:52:58

Facebook

2017-08-01 10:15:56

數(shù)據(jù)分析大數(shù)據(jù)

2021-02-04 14:31:30

RISC-V架構(gòu)GPU

2013-01-18 10:09:10

互聯(lián)網(wǎng)網(wǎng)絡(luò)發(fā)展撥號(hào)上網(wǎng)

2010-04-09 15:24:55

2015-12-21 16:12:06

紅帽CloudForms混合云

2011-05-25 10:19:17

2024-12-04 10:39:00

Linux內(nèi)核技術(shù)性

2015-07-28 11:29:59

電商亞馬遜沃爾瑪

2013-10-21 10:38:19

Ubuntu 13.1Canonical

2019-03-08 09:54:29

華為

2017-05-10 09:57:11

小米手機(jī)智能

2022-09-14 08:01:54

語法樹編譯器語法糖

2023-06-23 14:15:09

Rust編程

2012-04-17 16:02:41

Marvell西部數(shù)據(jù)

2016-09-01 08:07:02

Linux MinixUbuntu
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)