數(shù)據(jù)流通關(guān)鍵技術(shù)探究
數(shù)據(jù)流通
數(shù)據(jù)流通是指在數(shù)據(jù)供方和需方之間按照一定流通規(guī)則進行的以數(shù)據(jù)為對象的行為。數(shù)據(jù)流通在技術(shù)實現(xiàn)上有諸多需求,主要在數(shù)據(jù)安全、質(zhì)量保障、權(quán)益分配、追溯審計和透明度等方面。
數(shù)據(jù)流通區(qū)塊鏈在保證數(shù)據(jù)流通環(huán)節(jié)安全高效的基礎(chǔ)上,具有以下優(yōu)勢:不緩存數(shù)據(jù)、保護個人隱私、保護數(shù)據(jù)版權(quán)、可追溯數(shù)據(jù)來源且保證不會被篡改、有效遏制造假等。其去中心化的共識架構(gòu)有效解決了數(shù)據(jù)交換和流通環(huán)節(jié)中數(shù)據(jù)歸屬不明的痛點。作為一個有安全保障的數(shù)據(jù)流通平臺,旨在支持數(shù)據(jù)所有權(quán)不變的情況下實現(xiàn)數(shù)據(jù)使用權(quán)的可信流通共享。
安全屋實現(xiàn)數(shù)據(jù)流通
UCloud安全屋是一個數(shù)據(jù)流通平臺,它真正意義上實現(xiàn)了數(shù)據(jù)所有權(quán)和數(shù)據(jù)使用權(quán)的分離,確保數(shù)據(jù)流通過程安全可控不泄露 ,打破數(shù)據(jù)壟斷,讓數(shù)據(jù)流通便捷安全,實現(xiàn)數(shù)據(jù)民主化,讓所有者安心、使用者開心。
安全屋采用區(qū)塊鏈技術(shù)實現(xiàn)去中心化方案,精準連接了數(shù)據(jù)提供方、數(shù)據(jù)源需求方、算法提供方等,聚合不同類型的算法,并充當數(shù)據(jù)方、算法方角色,使用可信第三方(政府、第三方機構(gòu))保存所有區(qū)塊鏈記錄,起到信用背書的作用。
數(shù)據(jù)流通關(guān)鍵技術(shù)
同態(tài)加密
同態(tài)加密是密碼學(xué)界廣泛研究的重要課題,Ron Rivest等在1978年以銀行為應(yīng)用背景提出這一概念。同態(tài)加密是指對加密數(shù)據(jù)進行處理得到一個輸出,將此輸出進行解密,其結(jié)果與用同一方法處理但未加密原始數(shù)據(jù)得到的輸出結(jié)果一致。
在數(shù)據(jù)流通過程中的委托計算場景中,數(shù)據(jù)持有方本身算力有限,需委托第三方進行大規(guī)模數(shù)據(jù)統(tǒng)計分析計算,但其數(shù)據(jù)又不能透露給第三方,因此必須對敏感數(shù)據(jù)進行加密保護。使用同態(tài)加密技術(shù)的委托計算場景涉及兩類角色——數(shù)據(jù)持有方和數(shù)據(jù)處理方,技術(shù)方案示意圖如下所示:
數(shù)據(jù)持有方擁有原始數(shù)據(jù)并選擇需要保護的敏感屬性。在本地生成公私鑰對后,使用生成的用戶公鑰,同態(tài)加密原始數(shù)據(jù)中的敏感屬性,得到密文文件。之后,數(shù)據(jù)持有方將密文文件發(fā)送給數(shù)據(jù)處理方,數(shù)據(jù)處理方對密文文件進行同態(tài)操作,在明文數(shù)據(jù)信息不可知的情況下,生成密文統(tǒng)計結(jié)果,此結(jié)果和明文狀態(tài)直接加密得到的處理結(jié)果一致。數(shù)據(jù)處理方得到密文統(tǒng)計結(jié)果后,將其返回給數(shù)據(jù)持有方。數(shù)據(jù)持有方接收到處理后的密文統(tǒng)計結(jié)果,使用用戶私鑰解密,獲取明文統(tǒng)計結(jié)果。
零知識證明
在分布式賬本中,需滿足群體共識特性,即各方通過共識機制確認數(shù)據(jù)的合法性,而前提是包括個人或機構(gòu)隱私數(shù)據(jù)在內(nèi)的所有數(shù)據(jù)對所有方透明可見,因此需要對共識數(shù)據(jù)進行處理。零知識證明可提升數(shù)據(jù)合法性的隱性共識,讓驗證方既不知道數(shù)據(jù)具體內(nèi)容,又能確認該內(nèi)容是否有效或合法,應(yīng)用包括交易有效性證明、供應(yīng)鏈金融、數(shù)據(jù)防偽溯源等。
在數(shù)據(jù)流通過程中的分布式財務(wù)數(shù)據(jù)共享場景中,各企業(yè)的財務(wù)數(shù)據(jù)上鏈存儲,允許跨組織間進行標準財務(wù)記錄,改進財務(wù)報告并降低審計成本?;诜植际降呢攧?wù)數(shù)據(jù)記錄,按照一定的標準與傳統(tǒng)系統(tǒng)有互操作性,能改進從財務(wù)報告到審計之間的所有流程。
技術(shù)方案示意圖如下:
在分布式賬本中,企業(yè)需將財務(wù)數(shù)據(jù)加密上鏈存儲,包括資產(chǎn)負債表、上稅金額等,同時生成零知識證明π。π能證明:資產(chǎn)負債表中資產(chǎn)合計及負債與所有者權(quán)益合計等于對應(yīng)各項相加總和;企業(yè)上稅金額等于企業(yè)利潤總額乘以所得稅稅率金額。驗證方計算并驗證π是否成立,驗證過程中不泄露企業(yè)數(shù)據(jù)。若零知識證明成立,說明企業(yè)的財務(wù)數(shù)據(jù)正確可信,而且驗證過程需保證只有數(shù)據(jù)持有企業(yè)能生成此零知識證明。
群簽名
群簽名技術(shù)是一種允許一個群體中的任意成員,以匿名方式代表整個群體對消息進行簽名,并可公開驗證的機制。在云環(huán)境中,用戶依賴CSP存儲數(shù)據(jù)且沒有本地數(shù)據(jù)副本,因此確保數(shù)據(jù)正確地存儲在云中顯得尤其重要。為了減少因周期性檢查而帶來的在線負擔并且節(jié)省計算資源,引入TPA代替用戶檢查外包數(shù)據(jù)的完整性,希望通過TPA來保護數(shù)據(jù)隱私,并確保用戶數(shù)據(jù)不會泄露給TPA。
系統(tǒng)模型如圖所示,包括四個主體:用戶(Client)、云存儲服務(wù)器(CS,Cloud Server)、云組合服務(wù)器(CCS,Cloud Combiner Server)和第三方審計者(TPA,Third Party Auditor)。此方案可實現(xiàn)以下功能:正確性、安全有效的用戶撤銷、大數(shù)據(jù)隱私保護、身份隱私保護、多用戶更新、認證、大群組的支持。
環(huán)簽名
通常環(huán)簽名方案由密鑰生成、簽名、簽名驗證部分構(gòu)成,一個環(huán)簽名方案必須滿足無條件匿名性、正確性、不可偽造性的性質(zhì)。
云服務(wù)提供商對用戶進行分組管理。環(huán)簽名中,簽名者參與一個用戶組,這些用戶組中的用戶構(gòu)成一個環(huán)。如果環(huán)簽名得到驗證,則可以說明簽名者來自一定范圍的群體。環(huán)中的用戶簽名時,用自己的私鑰和環(huán)中其他實體的公鑰簽名,但不需要其他實體的參與,更不需要得到其他實體的允許。
這比其它基于合作方式的簽名要靈活得多,如群簽名需要其它實體的共同協(xié)作,而且群中有管理者,如果管理者權(quán)限過大,則可能會暴露用戶的身份。
差分隱私
差分隱私的基本思想是對原始數(shù)據(jù)、對原始數(shù)據(jù)的轉(zhuǎn)換或是對統(tǒng)計結(jié)果添加噪音來達到隱私保護效果。相比于傳統(tǒng)的隱私保護模型,差分隱私具有以下兩個優(yōu)點:
- 不關(guān)心攻擊者所具有的背景知識;
- 具有嚴謹?shù)慕y(tǒng)計學(xué)模型,能夠提供可量化的隱私保證。
按照隱私保護技術(shù)所處數(shù)據(jù)流通環(huán)節(jié)的不同,差分隱私技術(shù)可分為以下兩類:
- 中心化差分隱私技術(shù);
- 本地化差分隱私技術(shù)。
數(shù)據(jù)采集差分保護
由于移動設(shè)備功能的不斷強大,數(shù)據(jù)收集者可以將數(shù)據(jù)采集的任務(wù)分配給不同用戶,然而這種數(shù)據(jù)采集一般與個人行為信息相關(guān),因此當用戶參與數(shù)據(jù)采集時,不可避免地存在泄露個人敏感信息的風(fēng)險。
如圖所示,每個用戶首先對數(shù)據(jù)進行隱私化處理,再將處理后的數(shù)據(jù)發(fā)送給數(shù)據(jù)收集者,數(shù)據(jù)收集者對采集到的數(shù)據(jù)進行統(tǒng)計,以得到有效的分析結(jié)果,在對數(shù)據(jù)進行統(tǒng)計分析的同時,保證個體的隱私信息不被泄露。
數(shù)據(jù)輸出差分隱私保護技術(shù)方案
面向公眾公開發(fā)布數(shù)據(jù)或數(shù)據(jù)本身非常敏感時,如果直接向使用者輸出數(shù)據(jù),可能帶來嚴重的隱私泄露問題,因此輸出數(shù)據(jù)時,應(yīng)集中利用差分隱私技術(shù)對數(shù)據(jù)進行保護。如圖所示,服務(wù)端在將數(shù)據(jù)提供給數(shù)據(jù)使用方之前,需用差分技術(shù)對數(shù)據(jù)集中進行擾動處理,添加拉普拉斯噪聲或指數(shù)噪聲,保證數(shù)據(jù)可用性的同時,確保個體的隱私信息不被泄露。
隱私保護數(shù)據(jù)共享
數(shù)據(jù)共享中存在一個重要的課題,就是如何在共享中避免用戶數(shù)據(jù)隱私的泄露。隱私保護的數(shù)據(jù)共享技術(shù)應(yīng)運而生,其目標就是在保護數(shù)據(jù)隱私的前提下,盡可能保留具有挖掘價值的信息。
在隱私保護的數(shù)據(jù)共享中,存在數(shù)據(jù)提供者和數(shù)據(jù)挖掘平臺兩種角色。多個數(shù)據(jù)提供者對數(shù)據(jù)進行隱私保護處理之后,把數(shù)據(jù)輸出至數(shù)據(jù)挖掘平臺,在該平臺上完成數(shù)據(jù)融合、分析、挖掘。
隱私保護的數(shù)據(jù)共享主要分為兩個方向:隱私保護的數(shù)據(jù)處理和基于安全環(huán)境的數(shù)據(jù)共享。
隱私保護的數(shù)據(jù)處理
目標是在保護數(shù)據(jù)隱私的前提下,盡可能的保留數(shù)據(jù)挖掘的信息。
基于安全環(huán)境的數(shù)據(jù)共享
在數(shù)據(jù)挖掘平臺方構(gòu)建一個各方都信任的安全計算環(huán)境,安全環(huán)境保證參與計算的敏感數(shù)據(jù)不會輸出并且無法被外部進程竊取。各個數(shù)據(jù)提供者把數(shù)據(jù)進行加密后,傳輸?shù)綌?shù)據(jù)挖掘平臺,然后在安全計算環(huán)境中,對數(shù)據(jù)進行解密,最后進行數(shù)據(jù)的分析與建模。
總結(jié)
法律法規(guī)均對大數(shù)據(jù)的安全提出了嚴格要求,在發(fā)展大數(shù)據(jù)業(yè)務(wù)之前,必須建立完善的大數(shù)據(jù)安全管控體系,實現(xiàn)大數(shù)據(jù)從采集、傳輸、存儲、分析、發(fā)布等全生命周期的安全風(fēng)險管控,避免因大數(shù)據(jù)被誤用、濫用或泄露帶來的風(fēng)險。
同態(tài)、零知識證明、群簽名、環(huán)簽名、差分隱私保護、隱私保護數(shù)據(jù)共享等,是目前數(shù)據(jù)安全領(lǐng)域、數(shù)據(jù)流通領(lǐng)域的研究熱點,隨著各項技術(shù)發(fā)展及在越來越多的場景中落地應(yīng)用,數(shù)據(jù)流通在實際應(yīng)用場景中將發(fā)揮更大的價值。
UCloud 基于安全管理、區(qū)塊鏈及多方安全計算的安全屋平臺,實現(xiàn)了在原始數(shù)據(jù)對除數(shù)據(jù)持有者外,其他方均不可見的情況下,經(jīng)過協(xié)同計算對數(shù)據(jù)進行聯(lián)合分析之后,輸出需求方所需的分析結(jié)果,確保數(shù)據(jù)在安全的前提下流通共享。
本文內(nèi)容部分來源于《數(shù)據(jù)流通關(guān)鍵技術(shù)白皮書》