自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

一個(gè)鮮為人知卻可以保護(hù)隱私的訓(xùn)練方法:聯(lián)合學(xué)習(xí)

人工智能 機(jī)器學(xué)習(xí) 大數(shù)據(jù)
無論是國內(nèi)還是國外,公眾對隱私保護(hù)的意識(shí)越來越強(qiáng)烈。尤其是醫(yī)療數(shù)據(jù),因?yàn)榇蟛糠植∪瞬辉敢鈱⒆约旱脑\斷結(jié)果等這類隱私信息拿出來,所以機(jī)器學(xué)習(xí)在疾病診斷和探索潛力被大大壓制。

[[261420]]

大數(shù)據(jù)文摘出品

來源:麻省理工科技評論

編譯:stats熊

無論是國內(nèi)還是國外,公眾對隱私保護(hù)的意識(shí)越來越強(qiáng)烈。

尤其是醫(yī)療數(shù)據(jù),因?yàn)榇蟛糠植∪瞬辉敢鈱⒆约旱脑\斷結(jié)果等這類隱私信息拿出來,所以機(jī)器學(xué)習(xí)在疾病診斷和探索潛力被大大壓制。

在2017年的時(shí)候,谷歌曾經(jīng)悄悄的發(fā)表了一篇關(guān)于機(jī)器學(xué)習(xí)新方法的博客。

與常規(guī)方法需要把數(shù)據(jù)集中不同的是,新的方法會(huì)從多個(gè)數(shù)據(jù)源獲取數(shù)據(jù)進(jìn)行學(xué)習(xí)。這種新方法的出現(xiàn),讓谷歌可以不需要通過讀取或者轉(zhuǎn)移安卓手機(jī)用戶的短信,就可以訓(xùn)練他們用在這些收發(fā)短信上的預(yù)測語義模型。

這是一個(gè)鮮為人知卻可以保護(hù)隱私的訓(xùn)練方法。

數(shù)據(jù)不離開每家醫(yī)院就可以完成整體模型訓(xùn)練,并且準(zhǔn)確率可以媲美整合多家醫(yī)院數(shù)據(jù)訓(xùn)練的模型。

盡管這種聯(lián)合學(xué)習(xí)方式很聰明,但正如那些研究人員所言,這個(gè)在當(dāng)時(shí)人工智能的圈子里并沒有太多吸引力?,F(xiàn)在,隨著在全新領(lǐng)域得到應(yīng)用,這種情況也將發(fā)生改變:這種隱私優(yōu)先的方法將會(huì)是解決人工智能在醫(yī)療健康領(lǐng)域障礙的一針強(qiáng)心劑。

MIT計(jì)算機(jī)科學(xué)相關(guān)的副教授Ramesh Raskar,曾這樣說過:“在病人數(shù)據(jù)隱私方面和數(shù)據(jù)對于社會(huì)的效用之間存在著一種錯(cuò)誤的二分法,現(xiàn)在我們可以同時(shí)實(shí)現(xiàn)數(shù)據(jù)的隱私和效用,而數(shù)據(jù)就像腳下流走的沙子,人們完全察覺不到。”

過去的十年間,深度學(xué)習(xí)的迅速崛起引起了很多企業(yè)的變革。正是因?yàn)檫@種崛起推動(dòng)了無人汽車的發(fā)展,從根本上改變了我們與設(shè)備交互方式,讓我們對網(wǎng)絡(luò)安全產(chǎn)生了新發(fā)明。在健康領(lǐng)域,盡管有許多研究表明深度學(xué)習(xí)可以探測和診斷疾病,但是利用機(jī)器學(xué)習(xí)來幫助真正的病人方面還是進(jìn)展緩慢。

[[261421]]

現(xiàn)在那些流行的算法需要有大量數(shù)據(jù)做學(xué)習(xí),在絕大多數(shù)情況下,越多數(shù)據(jù)算法的結(jié)果會(huì)越好。如果醫(yī)院和研究機(jī)構(gòu)想要有一個(gè)又大又多的數(shù)據(jù)資源池,那他們就需要把數(shù)據(jù)存儲(chǔ)在一起。

特別在美國和英國,將那些掌握在科技巨頭手中的敏感醫(yī)療信息中心化被多次證明極不受歡迎,而且并不讓人感到意外。

因此,將人工智能投入診斷研究的眼界和適用性就變得十分狹小。你不能在全世界推廣乳腺癌的探測模型,因?yàn)樗辉趤碜酝患裔t(yī)院的幾千名病人身上做過驗(yàn)證。

這些都會(huì)通過聯(lián)合學(xué)習(xí)改變。這種技術(shù)可以用來自幾家不同醫(yī)院的數(shù)據(jù),同時(shí)這些數(shù)據(jù)從來沒有離開過醫(yī)院環(huán)境或者觸碰一家技術(shù)公司的服務(wù)器。

具體操作方式

[[261422]]

這是如何做到的?首先在不同醫(yī)院用它自己的數(shù)據(jù)訓(xùn)練出來不同的模型,然后把這些模型送到中心處理器并整合為一個(gè)完美模型。

當(dāng)每個(gè)醫(yī)院不停獲取數(shù)據(jù),通過把全新優(yōu)秀模型下載到醫(yī)院端,并將新數(shù)據(jù)導(dǎo)入,再推送回中心服務(wù)器。通過這樣的步驟,新的數(shù)據(jù)不會(huì)被交換出去,被交換的只有模型,所以數(shù)據(jù)也不會(huì)被反向揭露。

聯(lián)合學(xué)習(xí)面臨的挑戰(zhàn)

當(dāng)然這種聯(lián)合學(xué)習(xí)還面對許多挑戰(zhàn)。其中之一,將幾個(gè)獨(dú)立模型合并成一個(gè)完美模型面臨的風(fēng)險(xiǎn),要比每一個(gè)單獨(dú)的模型都要大。Raskar說,研究人員正在改善現(xiàn)有技術(shù),以保證這類問題不再發(fā)生。

[[261423]]

另一個(gè)挑戰(zhàn),就是聯(lián)合學(xué)習(xí)需要每個(gè)醫(yī)院有訓(xùn)練機(jī)器學(xué)習(xí)模型的基礎(chǔ)設(shè)施和基本能力。同時(shí),如何把從全醫(yī)院收集來的數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化也是一大障礙。但是正如Raskar所說,“雖然說還有許多工作需要完成,但大多只是創(chuàng)可貼一樣的修修補(bǔ)補(bǔ)”,沒有什么困難是不能克服的。

其他隱私優(yōu)先的機(jī)器學(xué)習(xí)

事實(shí)上,其他的隱私優(yōu)先分布式學(xué)習(xí)技術(shù)已經(jīng)可以解決那些問題。例如,Raskar和他的學(xué)生近期研究出了分離學(xué)習(xí)。在聯(lián)合學(xué)習(xí)中,每個(gè)醫(yī)院開始都是訓(xùn)練獨(dú)立模型,但只僅僅訓(xùn)練半程。這些半成品模型之后被送往中心服務(wù)器去合并,同時(shí)完成訓(xùn)練。

這樣做的優(yōu)點(diǎn)可以減輕一些醫(yī)院獨(dú)立計(jì)算的負(fù)擔(dān)。雖然說這個(gè)技術(shù)還是停留在概念證明階段,但是先前的試驗(yàn),讓Raskar的研究團(tuán)隊(duì)同樣也證明了,如果在中心數(shù)據(jù)池里進(jìn)行訓(xùn)練,會(huì)形成一個(gè)接近于完美的模型。

少部分公司,包括IBM研究中心在內(nèi),正在推動(dòng)聯(lián)合學(xué)習(xí)在現(xiàn)實(shí)生活中的人工智能在醫(yī)療健康方面的應(yīng)用??偛吭O(shè)在巴黎的Owkin公司,在Google投資公司的幫助下,開始應(yīng)用聯(lián)合學(xué)習(xí)來預(yù)測病人的抗藥性和抗治療性,同時(shí)觀測他們在確定疾病下的存活率。

這家公司同時(shí)借助在美國和歐洲的癌癥研究中心提供的數(shù)據(jù)來進(jìn)行模型研究。公司創(chuàng)始人提到,合作的結(jié)果會(huì)被發(fā)表在一篇即將發(fā)表的研究論文上,是一個(gè)基于病人病理圖可以預(yù)測一種罕見癌癥存活率的模型。

Owkin公司聯(lián)合創(chuàng)始人兼臨床研究醫(yī)生Thomas Clozel,這樣說到:“我十分激動(dòng)?,F(xiàn)如今在腫瘤學(xué)最大的障礙就是知識(shí)。讓我們感到非常興奮的是現(xiàn)在有能力解鎖這些知識(shí),同時(shí)也可以在醫(yī)療領(lǐng)域開展創(chuàng)新性探索。”

Raskar相信這些在分布式學(xué)習(xí)應(yīng)用將會(huì)遠(yuǎn)遠(yuǎn)拓展到醫(yī)療健康之外的企業(yè),尤其是那些人們不想分享數(shù)據(jù)的地方。最后他總結(jié)到:“在分散的、缺乏信任的環(huán)境下,這種學(xué)習(xí)方法將會(huì)十分十分十分有用。”

Karen Hao是MIT技術(shù)評論人工智能板塊記者。特別是,她的報(bào)道涵蓋了技術(shù)的倫理和社會(huì)影響,也包括那些對于社會(huì)的應(yīng)用。

相關(guān)報(bào)道:

https://www.technologyreview.com/s/613098/a-little-known-ai-method-can-train-on-your-health-data-without-threatening-your-privacy/

【本文是51CTO專欄機(jī)構(gòu)大數(shù)據(jù)文摘的原創(chuàng)譯文,微信公眾號(hào)“大數(shù)據(jù)文摘( id: BigDataDigest)”】

     大數(shù)據(jù)文摘二維碼

戳這里,看該作者更多好文

 

責(zé)任編輯:趙寧寧 來源: 51CTO專欄
相關(guān)推薦

2024-03-19 00:00:00

ReactJavaScript開發(fā)

2024-09-10 08:35:57

2009-09-14 09:45:20

Chrome谷歌操作系統(tǒng)

2014-07-29 14:25:43

Unix命令

2019-10-08 16:24:33

Chrome瀏覽器

2023-04-23 15:11:26

2017-11-08 14:55:16

Linux命令sudo

2010-01-07 10:05:51

IT顧問特質(zhì)

2019-12-12 20:49:05

JavaScript語言運(yùn)算符

2024-03-04 16:32:02

JavaScript運(yùn)算符

2024-03-21 14:27:13

JavaScript數(shù)組

2022-07-19 08:46:15

NeofetchLinux

2024-07-08 08:31:56

2021-08-01 22:41:07

微信功能技巧

2013-07-15 09:14:00

2011-05-03 13:13:52

編程PHPJava

2014-04-22 16:38:12

GitHubGitHub 使用技巧

2018-12-10 19:30:45

2009-01-03 09:00:00

2019-11-20 10:54:32

Python數(shù)據(jù)結(jié)構(gòu)數(shù)據(jù)庫
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)