數(shù)據(jù)流通關(guān)鍵技術(shù)探究
數(shù)據(jù)流通
數(shù)據(jù)流通是指在數(shù)據(jù)供方和需方之間按照一定流通規(guī)則進(jìn)行的以數(shù)據(jù)為對(duì)象的行為。數(shù)據(jù)流通在技術(shù)實(shí)現(xiàn)上有諸多需求,主要在數(shù)據(jù)安全、質(zhì)量保障、權(quán)益分配、追溯審計(jì)和透明度等方面。
數(shù)據(jù)流通區(qū)塊鏈在保證數(shù)據(jù)流通全環(huán)節(jié)安全高效的基礎(chǔ)上,具有以下優(yōu)勢(shì):不緩存數(shù)據(jù)、保護(hù)個(gè)人隱私、保護(hù)數(shù)據(jù)版權(quán)、可追溯數(shù)據(jù)來源且保證不會(huì)被篡改、有效遏制造假等。其去中心化的共識(shí)架構(gòu)有效解決了數(shù)據(jù)交換和流通環(huán)節(jié)中數(shù)據(jù)歸屬不明的痛點(diǎn)。作為一個(gè)有安全保障的數(shù)據(jù)流通平臺(tái),此平臺(tái)旨在支持在數(shù)據(jù)所有權(quán)不變的情況下實(shí)現(xiàn)數(shù)據(jù)使用權(quán)的可信流通共享。
安全屋實(shí)現(xiàn)數(shù)據(jù)流通
UCloud安全屋是一個(gè)數(shù)據(jù)流通平臺(tái),它真正意義上實(shí)現(xiàn)了數(shù)據(jù)所有權(quán)和數(shù)據(jù)使用權(quán)的分離,并且確保數(shù)據(jù)不泄露,讓所有者安心、使用者開心。安全屋實(shí)現(xiàn)數(shù)據(jù)所有權(quán)和使用權(quán)分離的一整套產(chǎn)品技術(shù),確保數(shù)據(jù)流通過程安全可控 ,打破數(shù)據(jù)壟斷,讓數(shù)據(jù)流通便捷安全,實(shí)現(xiàn)數(shù)據(jù)民主化 。
安全屋采用區(qū)塊鏈技術(shù)實(shí)現(xiàn)去中心化方案。安全屋精準(zhǔn)連接了數(shù)據(jù)提供方、數(shù)據(jù)源需求方、算法提供方等,安全屋平臺(tái)聚合不同類型的算法,并充當(dāng)數(shù)據(jù)坊、算法方角色,使用可信第三方(政府、第三方機(jī)構(gòu))保存所有區(qū)塊鏈記錄,起到信任背書作用。
數(shù)據(jù)流通關(guān)鍵技術(shù)
同態(tài)加密
同態(tài)加密是密碼學(xué)界廣泛研究的重要課題,Ron Rivest等在1978年以銀行為應(yīng)用背景提出這一概念。同態(tài)加密是指對(duì)其加密數(shù)據(jù)進(jìn)行處理得到一個(gè)輸出,將此輸出進(jìn)行解密,其結(jié)果與用同一方法處理未加密原始數(shù)據(jù)得到的輸出結(jié)果一致。
考慮數(shù)據(jù)流通過程中的委托計(jì)算場(chǎng)景。數(shù)據(jù)持有方本身算力有限,委托第三方進(jìn)行大規(guī)模數(shù)據(jù)統(tǒng)計(jì)分析計(jì)算。但數(shù)據(jù)其不能透露給第三方。因此必須對(duì)敏感數(shù)據(jù)進(jìn)行加密保護(hù)。使用同態(tài)加密技術(shù)的委托計(jì)算場(chǎng)景涉及兩類角色,數(shù)據(jù)持有方和數(shù)據(jù)處理方,其技術(shù)方案示意圖如下所示:
數(shù)據(jù)持有方擁有原始數(shù)據(jù),并選擇需要保護(hù)的敏感屬性。在本地生成公私鑰對(duì)后,使用生成的用戶公鑰,同態(tài)加密原始數(shù)據(jù)中的敏感屬性,得到密文文件。之后,數(shù)據(jù)持有方將密文文件發(fā)送給數(shù)據(jù)處理方,數(shù)據(jù)處理方對(duì)密文文件進(jìn)行同態(tài)操作,在明文數(shù)據(jù)信息不可知的情況下,生成密文統(tǒng)計(jì)結(jié)果,此結(jié)果和明文狀態(tài)直接加密得到的處理結(jié)果一致。數(shù)據(jù)處理方得到密文統(tǒng)計(jì)結(jié)果后,將其返回給數(shù)據(jù)持有方。數(shù)據(jù)持有方接收到處理后的密文統(tǒng)計(jì)結(jié)果,使用用戶私鑰解密,獲取明文統(tǒng)計(jì)結(jié)果。
零知識(shí)證明
在分布式賬本中,需滿足群體共識(shí)特性,即各方通過共識(shí)機(jī)制確認(rèn)數(shù)據(jù)的合法性,而其前提是包括個(gè)人或機(jī)構(gòu)的隱私數(shù)據(jù)在內(nèi)的所有數(shù)據(jù)對(duì)所有方透明可見,因此需要對(duì)共識(shí)數(shù)據(jù)進(jìn)行處理。零知識(shí)證明能提升數(shù)據(jù)合法性的隱性共識(shí),可以讓驗(yàn)證方既不知道數(shù)據(jù)具體內(nèi)容,又能確認(rèn)該內(nèi)容的是否有效或合法,其應(yīng)用包括交易有效性證明、供應(yīng)鏈金融、數(shù)據(jù)防偽溯源等。
考慮數(shù)據(jù)流通過程中的分布式財(cái)務(wù)數(shù)據(jù)共享場(chǎng)景。各企業(yè)的財(cái)政數(shù)據(jù)上鏈存儲(chǔ),允許跨組織間進(jìn)行標(biāo)準(zhǔn)財(cái)務(wù)記錄,改進(jìn)財(cái)務(wù)報(bào)告并降低審計(jì)成本?;诜植际降呢?cái)政數(shù)據(jù)記錄按照一定的標(biāo)準(zhǔn),與傳統(tǒng)系統(tǒng)有互操作性,能改進(jìn)從財(cái)務(wù)報(bào)告到審計(jì)之間的所有流程。
其技術(shù)方案示意圖如下:
在分布式賬本中,企業(yè)需將財(cái)政數(shù)據(jù)加密上鏈存儲(chǔ),包括其資產(chǎn)負(fù)債表、上稅金額等,同時(shí)生成零知識(shí)證明π,π能證明:資產(chǎn)負(fù)債表中資產(chǎn)合計(jì)及負(fù)債與所有者權(quán)益合計(jì)等于對(duì)應(yīng)各項(xiàng)相加總和;企業(yè)上稅金額等于企業(yè)利潤總額乘以所得稅稅率金額。其余方計(jì)算并驗(yàn)證π是否成立,驗(yàn)證過程中不泄露企業(yè)財(cái)政數(shù)據(jù)。若零知識(shí)證明成立,說明企業(yè)的財(cái)政數(shù)據(jù)正確可信。驗(yàn)證過程中,需保證只有數(shù)據(jù)持有企業(yè)能生成此零知識(shí)證明。
群簽名
群簽名技術(shù)是一種允許一個(gè)群體中的任意成員以匿名方式代表整個(gè)群體對(duì)消息進(jìn)行簽名,并可公開驗(yàn)證的機(jī)制。在云環(huán)境中,用戶依賴CSP存儲(chǔ)數(shù)據(jù),且沒有本地?cái)?shù)據(jù)副本,因此確保數(shù)據(jù)正確地存儲(chǔ)在云中顯得尤其重要.為了減少因周期性檢查而帶來的在線負(fù)擔(dān)以及節(jié)省計(jì)算資源,引入TPA代替用戶檢查外包數(shù)據(jù)的完整性,希望通過TPA來保護(hù)數(shù)據(jù)隱私,并確保用戶數(shù)據(jù)不會(huì)泄露給TPA。
系統(tǒng)模型如圖所示,包括四個(gè)主體:用戶(Client)、云存儲(chǔ)服務(wù)器(CS,Cloud Server)、云組合服務(wù)器(CCS,Cloud Combiner Server)和第三方審計(jì)者(TPA,Third Party Auditor)。此方案可實(shí)現(xiàn)以下功能:正確性、安全有效的用戶撤銷、大數(shù)據(jù)隱私保護(hù)、身份隱私保護(hù)、多用戶更新、認(rèn)證、大群組的支持。
環(huán)簽名
通常環(huán)簽名方案由密鑰生成、簽名、簽名驗(yàn)證部分構(gòu)成,一個(gè)環(huán)簽名方案必須滿足無條件匿名性、正確性、不可偽造性的性質(zhì)。
云服務(wù)提供商對(duì)用戶進(jìn)行分組管理,環(huán)簽名中,簽名者參與一個(gè)用戶組,這些用戶組中的用戶構(gòu)成一個(gè)環(huán)。如果環(huán)簽名得到驗(yàn)證,則可以說明簽名者來自一定范圍的群體。環(huán)中的用戶簽名時(shí),用自己的私鑰和環(huán)中其他實(shí)體的公鑰簽名,但是不需要其他實(shí)體的參與,更不需要得到其他實(shí)體的允許。
這比其他基于合作方式的簽名要靈活得多,如群簽名需要其他實(shí)體的共同協(xié)作,而且群中有管理者,管理者的權(quán)限過大,可以暴露用戶的身份。
差分隱私
差分隱私的基本思想是對(duì)原始數(shù)據(jù)、對(duì)原始數(shù)據(jù)的轉(zhuǎn)換或者是對(duì)統(tǒng)計(jì)結(jié)果添加噪音來達(dá)到隱私保護(hù)效果,相對(duì)于傳統(tǒng)的隱私保護(hù)模型,差分隱私具有以下兩個(gè)優(yōu)點(diǎn):
- 不關(guān)心攻擊者所具有的背景知識(shí);
- 具有嚴(yán)謹(jǐn)?shù)慕y(tǒng)計(jì)學(xué)模型,能夠提供可量化的隱私保證。
按照隱私保護(hù)技術(shù)所處的數(shù)據(jù)流通環(huán)節(jié)的不同,差分隱私技術(shù)可分為以下兩類:
- 中心化差分隱私技術(shù);
- 本地化差分隱私技術(shù)。
數(shù)據(jù)采集差分保護(hù)
由于移動(dòng)設(shè)備功能的不斷強(qiáng)大,數(shù)據(jù)收集者可以將數(shù)據(jù)采集的任務(wù)分配給不同用戶,然而這種數(shù)據(jù)采集一般與個(gè)人行為信息相關(guān),當(dāng)用戶參與數(shù)據(jù)采集時(shí),不可避免地存在泄露個(gè)人敏感信息的風(fēng)險(xiǎn)。
如圖所示,每個(gè)用戶首先對(duì)數(shù)據(jù)進(jìn)行隱私化處理,再將處理后的數(shù)據(jù)發(fā)送給數(shù)據(jù)收集者,數(shù)據(jù)收集者對(duì)采集到的數(shù)據(jù)進(jìn)行統(tǒng)計(jì),以得到有效的分析結(jié)果,在對(duì)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析的同時(shí),保證個(gè)體的隱私信息不被泄露。
數(shù)據(jù)輸出差分隱私保護(hù)技術(shù)方案
面向公眾公開發(fā)布數(shù)據(jù)或數(shù)據(jù)本身非常敏感時(shí),如果直接向使用者輸出數(shù)據(jù),可能帶來嚴(yán)重的隱私泄露問題,因此在輸出數(shù)據(jù)應(yīng)集中利用差分隱私技術(shù)對(duì)數(shù)據(jù)進(jìn)行保護(hù)。如圖所示,服務(wù)端在將數(shù)據(jù)提供給數(shù)據(jù)使用方之前,需用差分技術(shù)對(duì)數(shù)據(jù)集中進(jìn)行擾動(dòng)處理,添加拉普拉斯噪聲或指數(shù)噪聲,保證數(shù)據(jù)可用性的同時(shí),確保個(gè)體的隱私信息不被泄露。
隱私保護(hù)數(shù)據(jù)共享
數(shù)據(jù)共享中存在一個(gè)重要的課題,就是如何在共享中避免用戶數(shù)據(jù)隱私的泄露。隱私保護(hù)的數(shù)據(jù)共享技術(shù)應(yīng)運(yùn)而生,其目標(biāo)就是在保護(hù)數(shù)據(jù)隱私的前提下,盡可能的保留具有挖掘價(jià)值的信息。
在隱私保護(hù)的數(shù)據(jù)共享中,存在數(shù)據(jù)提供者和數(shù)據(jù)挖掘平臺(tái)兩者角色。多個(gè)數(shù)據(jù)提供者對(duì)數(shù)據(jù)進(jìn)行隱私保護(hù)處理之后,把數(shù)據(jù)輸出至數(shù)據(jù)挖掘平臺(tái),在該平臺(tái)上完成數(shù)據(jù)融合、分析、挖掘。
隱私保護(hù)的數(shù)據(jù)共享,主要分為兩個(gè)方向:隱私保護(hù)的數(shù)據(jù)處理和基于安全環(huán)境的數(shù)據(jù)共享。
- 隱私保護(hù)的數(shù)據(jù)處理
其目標(biāo)是在保護(hù)數(shù)據(jù)隱私的前提下,盡可能的保留數(shù)據(jù)挖掘的信息。
- 基于安全環(huán)境的數(shù)據(jù)共享
是指在數(shù)據(jù)挖掘平臺(tái)方,構(gòu)建一個(gè)各方都信任的安全計(jì)算環(huán)境,安全環(huán)境保證參與計(jì)算的敏感數(shù)據(jù)不會(huì)輸出并且無法被外部進(jìn)程竊取。各個(gè)數(shù)據(jù)提供者,把數(shù)據(jù)進(jìn)行加密后,傳輸?shù)綌?shù)據(jù)挖掘平臺(tái),然后在安全計(jì)算環(huán)境中,對(duì)數(shù)據(jù)進(jìn)行解密,然后進(jìn)行數(shù)據(jù)的分析與建模。
總結(jié)
法律法規(guī)均對(duì)大數(shù)據(jù)的安全提出了嚴(yán)格要求,在發(fā)展大數(shù)據(jù)業(yè)務(wù)之前,必須建立完善的大數(shù)據(jù)安全管控體系,實(shí)現(xiàn)大數(shù)據(jù)從采集、傳輸、存儲(chǔ)、分析、發(fā)布等全生命周期的安全風(fēng)險(xiǎn)管控,避免因?yàn)榇髷?shù)據(jù)被誤用濫用或泄露帶來的風(fēng)險(xiǎn)。
同態(tài)、零知識(shí)證明、群簽名、環(huán)簽名、差分隱私保護(hù)、隱私保護(hù)數(shù)據(jù)共享等是目前數(shù)據(jù)安全領(lǐng)域、數(shù)據(jù)流通領(lǐng)域的研究熱點(diǎn),隨著各項(xiàng)技術(shù)發(fā)展及在越來越多的場(chǎng)景中落地應(yīng)用,數(shù)據(jù)流通在實(shí)際應(yīng)用場(chǎng)景中將發(fā)揮更大的價(jià)值。
UCloud 基于安全管理、區(qū)塊鏈及多方安全計(jì)算的安全屋平臺(tái),實(shí)現(xiàn)了在原始數(shù)據(jù)對(duì)除數(shù)據(jù)持有者外其他方均不可見的情況下,經(jīng)過協(xié)同計(jì)算對(duì)數(shù)據(jù)進(jìn)行聯(lián)合分析之后,輸出需求方所需的分析結(jié)果,確保數(shù)據(jù)在安全地前提下流通共享。