五分鐘技術(shù)趣談 | 隱私計算之安全多方計算
Labs 導(dǎo)讀
隨著5G技術(shù)的加速發(fā)展,我國的各個產(chǎn)業(yè)逐步進入數(shù)字化轉(zhuǎn)型階段。日益增長的數(shù)據(jù)作為數(shù)字時代的核心生產(chǎn)要素,對社會和企業(yè)的價值越來越重要。然而,在數(shù)據(jù)流通與共享的過程中卻存在數(shù)據(jù)泄漏的風險,數(shù)據(jù)安全和隱私保護問題愈發(fā)被重視,國家逐步完善管控制度,先后發(fā)布《數(shù)據(jù)安全法》,《網(wǎng)絡(luò)安全法》,這也意味著數(shù)據(jù)安全不容忽視。那是否有一種技術(shù)既可以保護用戶的個人數(shù)據(jù)不被濫用,同時又能滿足各行各業(yè)“實現(xiàn)數(shù)據(jù)共享,打破數(shù)據(jù)孤島”的需求呢?隱私計算在這種情況下應(yīng)運而生,而安全多方計算作為隱私計算中最成熟的技術(shù),是如何讓隱私計算逐步進入實用化場景的呢?本文將深入淺出的做一個介紹。
數(shù)字化轉(zhuǎn)型時代
企業(yè)對數(shù)據(jù)的渴求越來愈大
數(shù)據(jù)的價值越來越高
然而
數(shù)據(jù)流通和分享過程中
被泄漏的個人隱私數(shù)據(jù)也不在少數(shù)
【數(shù)據(jù)隱私】成為網(wǎng)絡(luò)熱詞
......
有沒有一種技術(shù)
能保護數(shù)據(jù)的私密性
又讓數(shù)據(jù)產(chǎn)生價值呢?
隱私計算或許就是一種選擇
本期Labs帶大家認識下隱私計算
以及隱私計算中的安全多方計算的那些事兒
Part 01什么是隱私計算
隱私計算(Privacy compute)是一種由多個參與方聯(lián)合計算的技術(shù),參與方不需要泄漏各自的數(shù)據(jù)就能夠協(xié)作計算,聯(lián)合分析得出想要的結(jié)果。與傳統(tǒng)的數(shù)據(jù)協(xié)作相比,隱私計算提升了數(shù)據(jù)流通與分享的安全性,可以讓原來不愿意或者不敢于開放的數(shù)據(jù),在隱私計算技術(shù)下得以開放;讓原來脫敏開放的數(shù)據(jù),借助于隱私計算技術(shù)實現(xiàn)原始化數(shù)據(jù)的開放。各個行業(yè)能夠借助隱私計算打破數(shù)據(jù)孤島,促進數(shù)據(jù)的融合使用。
- 分支
隱私計算涉及到多方技術(shù)的融合,目前主流研究分為三個方向:
1、基于協(xié)議的安全多方計算:歷史最悠久,積累了大量底層的安全技術(shù),其他兩個方向都或多或少用到了安全多方計算的底層技術(shù),是我們今天討論的重點。
2、基于現(xiàn)代密碼的聯(lián)邦學習:后起之秀,結(jié)合密碼學和分布式計算實現(xiàn)了多方協(xié)作的機器學習,未來主要應(yīng)用于人工智能領(lǐng)域。
3、基于硬件的可信執(zhí)行環(huán)境:不同于前兩種軟件技術(shù),可信執(zhí)行環(huán)境是通過硬件技術(shù)對數(shù)據(jù)進行隔離保護的。
下圖展示了隱私計算的一個整體架構(gòu):
Part 02隱私計算下的“加密主軍”
- 起源
安全多方計算起源于姚明智教授提出的一個有趣的問題:
有兩個百萬富翁Alice和Bob,他們想比一比兩個人誰的財富更多,但是由于財產(chǎn)是比較隱私的問題,因此兩個人都不想向?qū)Ψ酵嘎蹲约河卸嗌儇敻?并且他們也不信任任何第三方。在這種前提下,該如何解決這個難題呢?
為解決這個問題,姚明智教授提出構(gòu)建一種模型:在無可信第三方的前提下通過一個約定的函數(shù),進行協(xié)同計算得到自己的計算結(jié)果,并且無法通過交互數(shù)據(jù)推測出其他任意一方的輸入和輸出數(shù)據(jù)?;谶@個模型,發(fā)展出的密碼學基礎(chǔ)理論后來經(jīng)過技術(shù)人員的設(shè)計和運用逐步成長為安全多方計算。
- 組成
安全多方計算不是一種單一的技術(shù),它是由一系列技術(shù)組成的集合,這些技術(shù)能幫助數(shù)據(jù)參與方在不泄露己方原始數(shù)據(jù)的前提下獲取到需要的整體數(shù)據(jù)信息。通用組成結(jié)構(gòu)有以下兩層:
支撐技術(shù)層
支撐技術(shù)層作為底層結(jié)構(gòu)提供了最基本的一些加密解密算法,構(gòu)筑了安全多方計算的基礎(chǔ)。包括hash函數(shù)、密鑰交換、同態(tài)加密(Homomorphic Encryption)、偽隨機函數(shù)等,此外還包含安全多方計算中的基礎(chǔ)工具:秘密分享(Secret Sharing)、不經(jīng)意傳輸協(xié)議(Oblivious Transfer)、不經(jīng)意偽隨機函數(shù)(Oblivious Pseudorandom Function)等;
專用算法層
專用算法層是利用支撐技術(shù)層構(gòu)建的安全多方計算協(xié)議,包括專用算法和通用框架。專用算法是指為了特殊問題所構(gòu)建的特殊算法,效率較高,包括了四則運算,比較運算,矩陣運算等;通用架構(gòu)是指可以滿足大部分需求的隱私計算邏輯,雖然效率相比專用算法較低,但是適用范圍更廣。
- 技術(shù)手段
秘密分享
秘密分享算法能夠?qū)?shù)據(jù)拆解成幾個沒有意義的數(shù)字,分發(fā)給多個參與方。每個參與方拿到數(shù)據(jù)的一部分,并且用這部分數(shù)據(jù)參與計算。這樣既保證了各個參與方無法還原出原始數(shù)據(jù),又能得到正確的計算結(jié)果。我們以計算平均工資為例,A,B,C想計算一下他們的平均工資,但又不想暴露自己的薪資,用秘密分享可完美解決這個問題,具體看下表:
假設(shè)A工資10萬,他把自己的薪資信息拆分后,分發(fā)給了B(3萬)和C(5萬),B和C進行相同邏輯拆分,最后這些秘密分享的數(shù)據(jù)共同計算得到了正確結(jié)果。
不經(jīng)意傳輸
不經(jīng)意傳輸指數(shù)據(jù)發(fā)送方有N個數(shù)據(jù),數(shù)據(jù)接收方請求接收一個數(shù)據(jù),發(fā)送方收到請求后隨機發(fā)送一個數(shù)據(jù),并且自己并不知道發(fā)送的是哪個數(shù)據(jù)。這種方法保護了被選擇之外數(shù)據(jù)的隱私性。
混淆電路
混淆電路將安全多方計算當做布爾電路進行處理,每一路的計算都進行加密,并且打亂加密順序達到混淆的目的?;诨煜娐芳夹g(shù)可以構(gòu)造出通用的安全多方計算協(xié)議。
同態(tài)加密
同態(tài)加密是指每個參與方的輸入數(shù)據(jù)首先經(jīng)過同態(tài)加密算法之后再給到計算方,計算方在本地進行解密并計算。在返回計算結(jié)果時,同樣進行加密處理。參與方拿到計算結(jié)果后進行解密得出目標數(shù)據(jù)。同態(tài)加密的類型分為加法同態(tài),乘法同態(tài),全同態(tài)加密三種。
Part 03安全多方計算實用場景
醫(yī)療領(lǐng)域:安全多方計算在醫(yī)療領(lǐng)域的應(yīng)用可以為原來相對封閉的醫(yī)療數(shù)據(jù)參與方建立起安全可信的數(shù)據(jù)交換網(wǎng)絡(luò),如當前全國正在著力推動的全民病歷互通,在各個醫(yī)療機構(gòu)針對用戶病歷進行共享的時候,安全多方計算可提供一種可靠,安全的方式構(gòu)建一個交換網(wǎng)絡(luò)來保護用戶病歷數(shù)據(jù)的隱私性,從而實現(xiàn)醫(yī)療數(shù)據(jù)價值的最大效用
金融領(lǐng)域:安全多方計算支持的本地數(shù)據(jù)采集,秘密分享,多樣化的協(xié)調(diào)計算能幫助金融機構(gòu)將用戶征信數(shù)據(jù)分析范圍從單純的金融信貸數(shù)據(jù)擴展到醫(yī)療,保險,交通等領(lǐng)域,獲得更完善和精準的用戶信用畫像
營銷領(lǐng)域:安全多方計算在移動家庭業(yè)務(wù)營銷中已經(jīng)得到了運用?;谝延械拇髷?shù)據(jù)分析基礎(chǔ),安全多方計算為家庭業(yè)務(wù)營銷提供了一種保護數(shù)據(jù)隱私的營銷方案:利用隱私數(shù)據(jù)求交集運算去判斷用戶畫像和消費意愿,只有交集部分用戶能夠被需求方獲得。這個方案能在保護用戶隱私信息的前提下判斷用戶的購買意愿和風險承受能力,達到改善用戶體驗和拓展市場的目的。
作者:李佳斌,單位:中國移動智慧家庭運營中心