自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

大數(shù)據(jù)和機(jī)器翻譯如何結(jié)合起來對抗冠狀病毒

大數(shù)據(jù)
大數(shù)據(jù)和機(jī)器翻譯可以結(jié)合在一起對抗冠狀病毒疫情,人們需要了解這兩種技術(shù)如何提供幫助以及如何發(fā)揮作用。

大數(shù)據(jù)和機(jī)器翻譯可以結(jié)合在一起對抗冠狀病毒疫情,人們需要了解這兩種技術(shù)如何提供幫助以及如何發(fā)揮作用。

歷史上很少比冠狀病毒疫情更能讓大眾意識到大數(shù)據(jù)的重要性。從世界各地收集的統(tǒng)計數(shù)據(jù)正在推動公共政策并塑造私人行為。以下將重點關(guān)注疫情的語言學(xué)層面,以便向決策者、醫(yī)療保健提供者以及公眾傳達(dá)基本信息。面臨的挑戰(zhàn)是如何跨越語言邊界交流快速變化的數(shù)據(jù),以使基本信息不會在翻譯中丟失。但是在尋找用戶的過程中,大數(shù)據(jù)的使用也存在更多爭議。

[[327791]]

行業(yè)領(lǐng)先組織使用大數(shù)據(jù)進(jìn)行機(jī)器翻譯

考慮到問題的嚴(yán)重性,翻譯服務(wù)越來越依賴于機(jī)器翻譯的效率和吞吐量。根本就沒有足夠的人工翻譯和口譯員。令人高興的是,由于神經(jīng)網(wǎng)絡(luò)方法在過去十年的應(yīng)用,機(jī)器翻譯的質(zhì)量得到了提高,主要是在這一領(lǐng)域發(fā)展的最大的科技公司,統(tǒng)稱為FAMGA(Facebook、蘋果、微軟、谷歌和亞馬遜)。這些公司都以自己的方式依靠大數(shù)據(jù)在領(lǐng)先的語言優(yōu)勢上展開競爭。然而,他們不是在處理數(shù)字,而是在處理文字。

跟蹤冠狀病毒蔓延的社交媒體翻譯和隱私挑戰(zhàn)

Facebook公司利用大規(guī)模的樣本反向翻譯(一種基于神經(jīng)機(jī)器翻譯的大數(shù)據(jù)技術(shù)),在2019年WMT競賽的多個類別中均獲得第一名,需要大量的雙語培訓(xùn)數(shù)據(jù),也就是可供參考翻譯的句子。雙語數(shù)據(jù)很難獲得,因此Facebook公司團(tuán)隊使用反向翻譯作為解決方法。最終,該團(tuán)隊使用了大約100億個單詞的額外數(shù)據(jù)來完成其任務(wù)。Facebook公司利用其20億個左右用戶的評論和帖子作為訓(xùn)練材料,并具有無與倫比的內(nèi)容訪問權(quán)限。

在語言競賽中,出于實驗?zāi)康氖褂冒l(fā)布的語言是一回事,而在新冠病毒等敏感的健康問題上利用用戶提供的信息是另一回事。正如Bruegel研究所的J.Scott Marcus所觀察到的那樣,用戶以各種方式“自愿”提供信息:在社交媒體上的帖子中,在他們使用移動服務(wù)和提供位置數(shù)據(jù)時在尋找健康信息。Marcus表示,大數(shù)據(jù)已用于對抗新冠病毒的戰(zhàn)略規(guī)劃,用于跟蹤潛在感染者,并為感染者和公眾提供指導(dǎo)、建議和信息。

翻譯與自愿收集的數(shù)據(jù)有關(guān)的隱私問題

很多人可能不知道提供“自愿”數(shù)據(jù)將被用來追蹤或暴露其行程的追蹤。不僅僅是一個國家,先從中國開始,然后是韓國、日本、以色列等其他國家,已經(jīng)明確使用了部分或全部這些信息。通常,高科技公司與各國政府合作以提供其數(shù)據(jù),盡管歐洲的通用數(shù)據(jù)保護(hù)條例等法規(guī)等隱私保護(hù)措施阻止了此類使用。

病毒跟蹤計劃使用機(jī)器翻譯實現(xiàn)“標(biāo)準(zhǔn)化”通信,并使公共衛(wèi)生官員可以首選的語言對其進(jìn)行訪問。例如,在以色列,阿拉伯語的社交媒體通信通過機(jī)器翻譯技術(shù)自動翻譯為希伯來語,其目的是尋找潛在的病毒攜帶者。

大規(guī)模機(jī)器翻譯和口譯的公共用途

機(jī)器翻譯大規(guī)模應(yīng)用的另一個例子是在國際機(jī)場對乘客進(jìn)行篩選。除了熱成像設(shè)備和手持測溫度儀之外,檢測人員還使用手持語音翻譯器向到達(dá)的乘客詢問他們的旅行史或醫(yī)療癥狀。

同樣的考慮也適用于向使用其他語言的公眾提供信息。提供有關(guān)冠狀病毒的最新信息是移民的一個問題。據(jù)美國之音報道,荷蘭的志愿者設(shè)立了一個健康服務(wù)臺,為不會說荷蘭語的新移民幫助。在澳大利亞在其邊境采用了一個大規(guī)模的翻譯項目。筆譯和口譯服務(wù)是澳大利亞移民和邊境保護(hù)部為同時使用人工翻譯和機(jī)器翻譯的非英語使用者提供的服務(wù)。

美國醫(yī)院的需求量很大。《紐約時報》于2020年4月報道了美國的西班牙裔冠狀病毒患者所遭受的巨大苦難,其所遭受的痛苦不成比例,約占紐約患病人數(shù)的34%。為了滿足這種需求,紐約的醫(yī)院越來越多地轉(zhuǎn)向視頻遠(yuǎn)程口譯,醫(yī)療保健提供者可以在需要時提供口譯服務(wù)。

在冠狀病毒疫情爆發(fā)之前,在思科公司的支持下,非營利性無國界翻譯公司(TWB)推出了一項名為Gamayun的創(chuàng)新機(jī)器翻譯計劃,旨在幫助那些少數(shù)民族語言的人員。TWB計劃的負(fù)責(zé)人Grace Tang說:“少數(shù)族裔語言的人無法獲得重要的救生信息。”思科公司發(fā)言人表示,基于人工智能和大數(shù)據(jù)技術(shù)的語音翻譯和文本翻譯工具將在5年內(nèi)幫助該計劃擴(kuò)展至10種少數(shù)族裔語言。

大數(shù)據(jù)和機(jī)器翻譯項目的風(fēng)險與陷阱

結(jié)合大數(shù)據(jù)和機(jī)器翻譯的項目中最著名的案例是Project Baseline,這是由Alphabet公司支持的Verily發(fā)起的。2020年3月,美國總統(tǒng)特朗普聲稱谷歌公司支持一項全國性的計劃,利用雙語篩選問題追蹤新型冠狀病毒。

Vital Software公司的新冠病毒癥狀檢查器也引發(fā)了類似的爭議,該檢查器在俄勒岡州可以翻譯成15種語言用。在啟動基于社區(qū)的項目時,但在選定的州,其規(guī)模仍在縣級,而不是國家一級。值得稱贊的是,考慮到從個人身上收集的大量敏感信息,該項目認(rèn)真對待數(shù)據(jù)隱私問題。

在新冠病毒疫情期間,將大數(shù)據(jù)用于機(jī)器翻譯和其他目的的底線是,它是在巨大的壓力下動態(tài)完成的,這幾乎總是會導(dǎo)致偷工減料和高期望值,但這并不總是能夠滿足。Facebook公司在WMT的應(yīng)用報告中表示,其收集數(shù)據(jù)是嘈雜且次優(yōu)。希望在疫情期間,將大數(shù)據(jù)和機(jī)器語言方法相結(jié)合的努力也能取得成功,為對抗疫情提供幫助。

 

責(zé)任編輯:趙寧寧 來源: 360機(jī)房
相關(guān)推薦

2023-05-26 00:28:33

PandasAIChatGPTOpenAI

2023-07-31 00:14:28

2020-09-23 10:36:32

ASESD-WAN安全訪問服務(wù)邊緣

2022-08-09 11:14:45

首席信息官企業(yè)

2023-08-07 16:26:54

LinuxNautilus文件管理器

2020-08-03 23:16:51

物聯(lián)網(wǎng)冠狀病毒IOT

2020-09-23 10:36:38

安全

2019-12-19 14:07:33

IT運營CIO安全

2021-10-13 18:59:42

AI

2017-08-04 10:33:52

人工智能神經(jīng)科學(xué)Deepmind

2017-08-07 11:15:34

人工智能神經(jīng)科學(xué)神經(jīng)網(wǎng)絡(luò)

2021-11-01 17:14:28

物聯(lián)網(wǎng)區(qū)塊鏈技術(shù)

2023-07-18 11:23:55

2021-02-18 21:51:57

大數(shù)據(jù)冠狀病毒醫(yī)療

2020-02-06 12:37:59

新型冠狀病毒勒索病毒病毒

2020-06-12 17:36:09

機(jī)器人疫情5G

2012-05-09 11:47:15

HTML5游戲開發(fā)Easel.js

2021-04-25 15:19:19

數(shù)據(jù)分析商業(yè)智能大數(shù)據(jù)

2020-02-28 09:17:16

冠狀病毒移動安全病毒

2020-05-06 11:30:37

人工智能冠狀病毒AI
點贊
收藏

51CTO技術(shù)棧公眾號