白宮的大數(shù)據(jù)報告:隱私問題解決宜早不宜晚
關(guān)鍵的關(guān)注點(diǎn):大數(shù)據(jù)正在創(chuàng)造大量的隱私主題需要及時處理,宜早不宜晚。
該報告的引文說到:”本報告一個顯著的發(fā)現(xiàn)是大數(shù)據(jù)分析將個人信息用于供房、信貸、雇用、健康、教育和商場購物,有潛力使長期存在的公民權(quán)利保護(hù)黯然失色。美國人與數(shù)據(jù)的關(guān)系,她(他)們的機(jī)會和潛力將得以擴(kuò)展而不是消減”。
報告討論了一系列有關(guān)隱私的主題,包括以下5個:
1.”去識別化”并不總是有效
機(jī)構(gòu)常常采用隱私保護(hù)技術(shù)來去除與特定個人或設(shè)備數(shù)據(jù)的連接識別性。不幸的是,再識別技術(shù)又同樣有效地把這些數(shù)據(jù)連接起來。
報告提出:”綜合性的多種數(shù)據(jù)可能導(dǎo)致某些分析師所說的”馬賽克效應(yīng)”,即個人可識別信息可以從甚至不包括個人識別碼的數(shù)據(jù)集里衍生或推斷出來,關(guān)注點(diǎn)在于描繪一個人的形象和她(他)們所喜歡的東西”。
隨著再識別匿名數(shù)據(jù)的技術(shù)日益強(qiáng)大,個人如何管理她(他)們的私人信息和身份,或者基于多種數(shù)據(jù)集信息做出決策,這逐漸變得撲朔迷離。
2.”***的個性化”可以有助于識別力
報告說,不同類型非結(jié)構(gòu)化數(shù)據(jù)的融合使得營銷人員可以”在消費(fèi)者提出要求之前就準(zhǔn)確地把她(他)們想要的消息、產(chǎn)品或服務(wù)發(fā)送過去”。”可惜的是,***的個性化也為定價、服務(wù)和機(jī)會方面精細(xì)的和不那么精細(xì)的識別力留下了空間。”
3.”小”數(shù)據(jù)造成更大的隱私威脅
不論對大數(shù)據(jù)潛在侵犯個人權(quán)利的言論多么洶涌,今天大多數(shù)最常見的隱私風(fēng)險都與”小數(shù)據(jù)”有關(guān),比如黑客以個人銀行信息為目標(biāo)實(shí)施金融詐騙。報告指出:”這些風(fēng)險并不總是大量、快速或信息種類繁多的,也不隱含某種與大數(shù)據(jù)相關(guān)的復(fù)雜分析”。報告認(rèn)為,小數(shù)據(jù)的保護(hù)已經(jīng)由美國隱私法律、強(qiáng)有力的實(shí)施細(xì)則,以及全球隱私保護(hù)機(jī)制修正規(guī)范起來。即使這是事實(shí),最近的2篇文章顯示出在這個領(lǐng)域還有很大的改進(jìn)空間。
4.預(yù)測醫(yī)學(xué)可能導(dǎo)致隱私混亂
“預(yù)測醫(yī)學(xué)”是一個前景遠(yuǎn)大的大數(shù)據(jù)應(yīng)用,它深入挖掘病人的健康和基因信息,以預(yù)測她(他)們是否將得一種特殊的疾病,以及對具體治療方法的接受程度。這兒數(shù)據(jù)濫用的潛力是巨大的。比如,通過”預(yù)測醫(yī)學(xué)”收集來的健康信息也許就被運(yùn)用于擁有類似基因的人們(比如病人的孩子們)的醫(yī)療決策中。
報告提到:”目前覆蓋信息并運(yùn)用于健康的隱私框架體系并沒有很好的適應(yīng)處理這些新發(fā)展,或者對驅(qū)動新發(fā)展的研究起到促進(jìn)作用”。
5.相反地,隱私法律反而阻礙了某些重要的分析
報告說:”大數(shù)據(jù)分析使得數(shù)據(jù)科學(xué)家可以積累大量的數(shù)據(jù),包括非結(jié)構(gòu)化數(shù)據(jù),并且發(fā)現(xiàn)異常現(xiàn)象和模式”,”這個發(fā)現(xiàn)模型中一個關(guān)鍵的隱私挑戰(zhàn)是,你不得不去大海里撈針。為了獲得一定的洞察力,你就需要一定數(shù)量的數(shù)據(jù)。”
因此難題就出來了:研究人員可以受益于獲得更大量敏感的基因信息數(shù)據(jù)集,但是隱私法律卻限制她(他)們獲取這些數(shù)據(jù)。報告說,舉個例子,布羅德研究所的一位基因研究者就未能探測與3500個精神分裂癥基因數(shù)據(jù)集相關(guān)的基因變異,但卻取得了35000個案例的”統(tǒng)計顯著性”結(jié)果。