淺淡隱私增強(qiáng)技術(shù)的類型和用途
現(xiàn)在,許多企業(yè)會收集越來越多的敏感數(shù)據(jù),不可避免地會遭遇數(shù)據(jù)泄露的問題,隱私成為當(dāng)下科技界備受關(guān)注的一個(gè)熱門話題。隱私是指個(gè)人有權(quán)利控制或影響其信息如何被收集、使用和存儲,以及誰可以披露這些信息、如何披露。第三方不得通過某人提供的數(shù)據(jù)直接追溯其身份,或者通過統(tǒng)計(jì)信息來追溯。這最后一個(gè)要求使企業(yè)難以收集和分析用戶數(shù)據(jù)以洞察用戶行為、改進(jìn)決策流程以及衡量產(chǎn)品、臨床試驗(yàn)或廣告活動的效果。
為了繼續(xù)使用這些數(shù)據(jù),遵守CCPA和GDPR等數(shù)據(jù)隱私和保護(hù)法規(guī),并避免因違規(guī)而挨罰,許多組織紛紛采用隱私增強(qiáng)技術(shù)(Privacy Enhancing Technology,簡稱“PET”)。PET可確保個(gè)人或敏感信息在整個(gè)生命周期內(nèi)保持私密性。PET涵蓋一系列廣泛的技術(shù),旨在遵守隱私和數(shù)據(jù)保護(hù)原則,同時(shí)保持從用戶提供的數(shù)據(jù)中提取價(jià)值的能力。為此,大多數(shù)PET采用的方法是,使用加密和統(tǒng)計(jì)技術(shù)來混淆敏感數(shù)據(jù),或減少所處理的實(shí)際數(shù)據(jù)量。
以下是一些最常見的加密和統(tǒng)計(jì)PET及其用途。
加密隱私增強(qiáng)技術(shù)
?差分隱私
差分隱私將處理過的干擾信息添加到數(shù)據(jù)集,這樣既可以識別數(shù)據(jù)集中的組模式,同時(shí)保持個(gè)人的匿名性。這使得龐大數(shù)據(jù)集可以發(fā)布用于公共研究??萍脊疽彩褂貌町愲[私來分析大量用戶數(shù)據(jù),并從中獲得洞察力。
?同態(tài)加密
同態(tài)加密能夠?qū)用軘?shù)據(jù)進(jìn)行計(jì)算操作。任何分析的結(jié)果都保持加密狀態(tài),只有數(shù)據(jù)所有者才能解密和查看。這種加密方法使企業(yè)能夠分析云存儲中的加密數(shù)據(jù),或與第三方共享敏感數(shù)據(jù)。谷歌已發(fā)布了開源庫和工具,對加密數(shù)據(jù)集執(zhí)行同態(tài)加密的操作。
?安全多方計(jì)算(SMPC)
安全多方計(jì)算(Secure multiparty computation,簡稱“SMPC”)是同態(tài)加密的一個(gè)子領(lǐng)域,將計(jì)算分布到諸多系統(tǒng)和多個(gè)加密數(shù)據(jù)源上。這項(xiàng)技術(shù)確保任何一方都看不到整個(gè)數(shù)據(jù)集,并限制了任何一方可以獲得的信息。OpenMined在其PyGrid對等平臺中使用SMPC,用于私密數(shù)據(jù)科學(xué)和聯(lián)合學(xué)習(xí)。
?零知識證明(ZKP)
零知識證明(Zero-Knowledge Proof或Zero-Knowledge Protocol,簡稱“ZKP”)是一組加密算法,可以在不泄露證明信息的數(shù)據(jù)這種情況下驗(yàn)證信息。它在身份認(rèn)證中起到了至關(guān)重要的作用。比如說,可以使用ZKP驗(yàn)證某人的年齡,而不透露其實(shí)際出生日期。
統(tǒng)計(jì)隱私增強(qiáng)技術(shù)
?聯(lián)合學(xué)習(xí)
聯(lián)合學(xué)習(xí)是一種機(jī)器學(xué)習(xí)技術(shù),它使單個(gè)設(shè)備或系統(tǒng)能夠協(xié)同學(xué)習(xí)共享的預(yù)測模型,同時(shí)將數(shù)據(jù)保存在本地。比如說,手機(jī)下載當(dāng)前模型,通過學(xué)習(xí)手機(jī)上的數(shù)據(jù)來改進(jìn)該模型,然后僅將匯總后的變更內(nèi)容上傳到集中式模型。之后,變更內(nèi)容結(jié)合其他設(shè)備上的更新內(nèi)容,改進(jìn)共享的模型。聯(lián)合學(xué)習(xí)減少了需存儲在集中式服務(wù)器或云存儲的數(shù)據(jù)量。谷歌在安卓的Gboard中使用了聯(lián)合學(xué)習(xí)。
?生成式對抗網(wǎng)絡(luò)(GAN)
生成式對抗網(wǎng)絡(luò)(GAN, Generative Adversarial Networks,簡稱“GAN”)生成模擬真實(shí)數(shù)據(jù)集的新合成數(shù)據(jù)實(shí)例。這種方法為分析人員、研究人員和機(jī)器學(xué)習(xí)系統(tǒng)提供了大量高質(zhì)量的合成數(shù)據(jù)。GAN識別數(shù)據(jù)中復(fù)雜模式的能力被用于快速發(fā)現(xiàn)醫(yī)療測試和網(wǎng)絡(luò)流量中的異常情況。
?假名化/混淆/數(shù)據(jù)屏蔽
多種方法可以用來通過將敏感數(shù)據(jù)與虛構(gòu)性、分散注意力或誤導(dǎo)性的數(shù)據(jù)相結(jié)合,從而替換或隱藏敏感信息,包括假名化、混淆和數(shù)據(jù)屏蔽等方法。這是企業(yè)用來保護(hù)用戶的敏感數(shù)據(jù)、遵守隱私法規(guī)的一種常見做法。但是某些匿名化措施(比如僅僅刪除含有個(gè)人身份信息即PII的列或屏蔽數(shù)據(jù)),可能會使處理后的數(shù)據(jù)仍有機(jī)會通過“再識別”還原信息,從而追蹤到提供數(shù)據(jù)的個(gè)人。
?設(shè)備端學(xué)習(xí)
可以分析用戶在設(shè)備端的操作來識別模式,無需將個(gè)人數(shù)據(jù)發(fā)送到遠(yuǎn)程服務(wù)器。設(shè)備端學(xué)習(xí)可用于使算法更智能化,比如自動更正。蘋果的Face ID就使用設(shè)備端學(xué)習(xí)來收集有關(guān)用戶臉部不同外觀的數(shù)據(jù),因此其識別方法更準(zhǔn)確更安全。
?合成數(shù)據(jù)生成(SDG)
合成數(shù)據(jù)生成(Synthetic Data Generation,簡稱“SDG”)是從具有相同統(tǒng)計(jì)特征的原始數(shù)據(jù)集中人工創(chuàng)建的數(shù)據(jù)。由于SDG數(shù)據(jù)集可能遠(yuǎn)大于原始數(shù)據(jù)集,除了用于人工智能和機(jī)器學(xué)習(xí)外,這項(xiàng)技術(shù)還用于測試環(huán)境,以減少數(shù)據(jù)共享和所需的實(shí)際數(shù)據(jù)量。
結(jié)語
PET是多方共享和分析數(shù)據(jù)的一種安全方式,這對用戶、組織和社會具有巨大的潛在好處,因?yàn)楦哔|(zhì)量數(shù)據(jù)的可訪問性和可用性是創(chuàng)新的第一步。PET已經(jīng)用于不同方面,比如應(yīng)用程序和系統(tǒng)測試,尤其是在物聯(lián)網(wǎng)、金融交易和醫(yī)療保健服務(wù)等領(lǐng)域。
英國數(shù)據(jù)倫理和創(chuàng)新中心已發(fā)布《PET采用指南》,旨在幫助組織考慮PET如何為數(shù)據(jù)驅(qū)動的創(chuàng)新帶來機(jī)遇。負(fù)責(zé)監(jiān)督GDPR執(zhí)行的歐洲數(shù)據(jù)保護(hù)委員會和歐盟網(wǎng)絡(luò)安全管理局也發(fā)布了技術(shù)指南,支持SMPC作為一種有效的隱私保護(hù)措施,并列出了在醫(yī)療保健和網(wǎng)絡(luò)安全領(lǐng)域的用途。
參考鏈接:
https://www.techtarget.com/searchsecurity/tip/Privacy-enhancing-technology-types-and-use-cases