自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

RSA創(chuàng)新沙盒盤(pán)點(diǎn) | Cape Privacy——基于加密機(jī)器學(xué)習(xí)的多方數(shù)據(jù)協(xié)作與隱私保護(hù)方案

安全
綠盟君將通過(guò)背景介紹、產(chǎn)品特點(diǎn)、點(diǎn)評(píng)分析等,帶大家了解入圍的十強(qiáng)廠(chǎng)商。今天,我們要介紹的是廠(chǎng)商是:Cape Privacy 。

RSAConference2021將于舊金山時(shí)間5月17日召開(kāi),這將是RSA大會(huì)有史以來(lái)第一次采用網(wǎng)絡(luò)虛擬會(huì)議的形式舉辦。大會(huì)的Innovation Sandbox(沙盒)大賽作為“安全圈的奧斯卡”,每年都備受矚目,成為全球網(wǎng)絡(luò)安全行業(yè)技術(shù)創(chuàng)新和投資的風(fēng)向標(biāo)。

前不久,RSA官方宣布了最終入選創(chuàng)新沙盒的十強(qiáng)初創(chuàng)公司:WABBI、Satori、Abnormal Security、Apiiro、Axis Security、Cape Privacy、Deduce、Open Raven、STARATA、WIZ。

綠盟君將通過(guò)背景介紹、產(chǎn)品特點(diǎn)、點(diǎn)評(píng)分析等,帶大家了解入圍的十強(qiáng)廠(chǎng)商。今天,我們要介紹的是廠(chǎng)商是:Cape Privacy 。

一、公司介紹

Cape Privacy成立于2018年1月,總部位于美國(guó)紐約。當(dāng)前融資總額達(dá)到2500萬(wàn)美元,包括最近一次2000萬(wàn)美元的A輪融資,由Evolution Equity Partners領(lǐng)投,Tiger Global Management、Ridgeline Partners、Version One ventures、Radical ventures等多家投資公司參與[1]。其創(chuàng)始人兼CEO是Ché Wijesinghe,他擁有豐富的網(wǎng)絡(luò)安全從事經(jīng)驗(yàn)和管理背景,曾先后擔(dān)任Datalogue(被Nike收購(gòu))、OmniSci、Composite Software(被Cisco收購(gòu))等公司的高管;團(tuán)隊(duì)其他一些成員,來(lái)自美國(guó)、英國(guó)和法國(guó)多個(gè)國(guó)家,包括David Besemer、Morten Dahl和Ben Decoste,具有密碼學(xué)、數(shù)據(jù)科學(xué)和計(jì)算機(jī)領(lǐng)域的技術(shù)背景[2]。公司通過(guò)將機(jī)器學(xué)習(xí)和密碼學(xué)技術(shù),致力構(gòu)建與實(shí)現(xiàn)一個(gè)多方數(shù)據(jù)協(xié)作與隱私保護(hù)的企業(yè)級(jí)SaaS平臺(tái),旨在解決隱私監(jiān)管下的敏感數(shù)據(jù)共享難題。

在今年2021年RSA創(chuàng)新沙盒十家入選公司,有三家數(shù)據(jù)安全公司。除了本文介紹的Cape Privacy,還有Open Raven和Satori,其中后兩者聚焦在敏感數(shù)據(jù)發(fā)現(xiàn)/分類(lèi),數(shù)據(jù)泄露監(jiān)控,與數(shù)據(jù)安全治理相關(guān)。在去年2020的創(chuàng)新沙盒角逐賽中,許多人說(shuō)Securiti.ai奪冠有很多的一部分歸屬于商業(yè)原因和運(yùn)氣成分。那么,回歸技術(shù)主導(dǎo)的創(chuàng)新,Cape Privacy作為掌握加密機(jī)器學(xué)習(xí)、密碼學(xué)等先進(jìn)技術(shù),實(shí)現(xiàn)了多方的數(shù)據(jù)協(xié)作與隱私保護(hù)方案。它這樣同時(shí)兼具創(chuàng)新技術(shù)和商業(yè)條件的公司,是否能一舉奪得今年的RSAC創(chuàng)新沙盒的冠軍?值得期待!

二、背景簡(jiǎn)介

歐盟2018 年 5 月 25 日正式頒布《通用數(shù)據(jù)保護(hù)條例》(General Data Protection Regulation,GDPR)。距離現(xiàn)今已經(jīng)實(shí)施接近三年,先后多張巨額的企業(yè)罰單相繼被開(kāi)出。根據(jù)GDPR的執(zhí)法跟蹤網(wǎng)站相關(guān)統(tǒng)計(jì),截至當(dāng)前,歐盟成員國(guó)從2018年共開(kāi)出616件罰單,共罰款約2.79億歐元[3]。其中具有代表性是谷歌罰款事件,其備受關(guān)注——作為一家大型國(guó)際互聯(lián)網(wǎng)公司,谷歌卻陸續(xù)被歐盟的兩個(gè)國(guó)家罰款:2019年1月被法國(guó)處罰5000萬(wàn)歐元,原因是執(zhí)法方認(rèn)為谷歌的隱私條款未充分體現(xiàn)GDPR公開(kāi)透明和清晰原則;2020年3月被瑞典處罰700萬(wàn)歐元,原因是谷歌未充分履行GDPR賦予用戶(hù)的數(shù)據(jù)“遺忘權(quán)”。

以GDPR為風(fēng)向標(biāo),全球各個(gè)國(guó)家紛紛進(jìn)行新的數(shù)據(jù)安全與隱私立法,并趨向更加嚴(yán)格趨勢(shì)。根據(jù)聯(lián)合國(guó)貿(mào)易發(fā)展組織(UNCTAD)截止當(dāng)前的統(tǒng)計(jì)[4],全球194個(gè)國(guó)家中,共有132個(gè)國(guó)家制定了數(shù)據(jù)隱私相關(guān)法律,包括歐盟、美國(guó)、中國(guó)、俄羅斯和印度和澳大利亞、加拿大和日本等國(guó)家,占所有國(guó)家總數(shù)的66%。其中具有代表性是美國(guó)加州,作為科技創(chuàng)新公司聚集地,2020年初實(shí)施《加利消費(fèi)者隱私法案》(California Consumer Privacy Act 簡(jiǎn)稱(chēng) CCPA),2020年底公開(kāi)《加利福尼亞隱私權(quán)法案》(California Privacy Rights Act 簡(jiǎn)稱(chēng) CPRA),被認(rèn)為是CCPA強(qiáng)化版,在CCPA基礎(chǔ)上增加了更多嚴(yán)格的條款。近日,我國(guó)《數(shù)據(jù)安全法》、《個(gè)人信息保護(hù)法》通過(guò)二次審議稿階段,這兩部重量級(jí)法規(guī)的距離落地腳步聲越來(lái)越近。無(wú)論是國(guó)外還是國(guó)內(nèi),這些法規(guī)無(wú)疑給企業(yè)(無(wú)論巨頭,還是中小型企業(yè))帶來(lái)了巨大的合規(guī)壓力與挑戰(zhàn)。

隨著數(shù)字化轉(zhuǎn)型和人工智能戰(zhàn)略,機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等先進(jìn)技術(shù)在各行各業(yè)的數(shù)字領(lǐng)域得到廣泛應(yīng)用與推廣。然而,隨著GDPR、CCPA等法規(guī)實(shí)施,人工智能的應(yīng)用,特別是跨多方企業(yè)的應(yīng)用中,其合規(guī)風(fēng)險(xiǎn)越來(lái)越高。例如GDPR對(duì)個(gè)人數(shù)據(jù)的處理以及共享作出較高限制,CCPA條款明確指出未經(jīng)消費(fèi)者同意不能與第三方共享用戶(hù)數(shù)據(jù)。然而,數(shù)據(jù)在流動(dòng)過(guò)程中將價(jià)值發(fā)揮最大化,企業(yè)間的數(shù)據(jù)共享、計(jì)算與交換場(chǎng)景與需求越來(lái)越多,這給企業(yè)的數(shù)字化轉(zhuǎn)型、AI戰(zhàn)略?xún)r(jià)值構(gòu)成了巨大的障礙。

如何保證在數(shù)據(jù)共享實(shí)現(xiàn)數(shù)據(jù)價(jià)值挖掘而保障數(shù)據(jù)安全、滿(mǎn)足合規(guī)性是一個(gè)關(guān)鍵性問(wèn)題。Cape Privacy聲稱(chēng)創(chuàng)建更強(qiáng)大的人工智能解決方案,企業(yè)可以在不泄露任何機(jī)密數(shù)據(jù)的情況下實(shí)現(xiàn)了協(xié)同機(jī)器學(xué)習(xí),從而對(duì)敏感數(shù)據(jù)的安全可信的訪(fǎng)問(wèn)中獲取數(shù)據(jù)的價(jià)值。這是否是數(shù)據(jù)共享中合規(guī)挑戰(zhàn)的解決之道呢?接下來(lái)我們對(duì)Cape Privacy的產(chǎn)品以及應(yīng)用進(jìn)行分析和解讀。

三、 公司產(chǎn)品與應(yīng)用

Cape Privacy公司的開(kāi)發(fā)團(tuán)隊(duì)從2018至2020花了兩年時(shí)間推出了公司產(chǎn)品的Alpha版本——Cape平臺(tái)測(cè)試版。據(jù)最近一次的采訪(fǎng),其公司CEO聲稱(chēng)產(chǎn)品在2021年已經(jīng)大量改進(jìn)和完善,在一些場(chǎng)景可進(jìn)行商業(yè)應(yīng)用[3]。值得一提的是,該初創(chuàng)公司通過(guò)項(xiàng)目開(kāi)源和社區(qū)的模式推動(dòng)產(chǎn)品孵化,不僅有Cape Privacy公司的員工搭建框架和貢獻(xiàn)代碼,同時(shí)也有一些外部開(kāi)發(fā)人員會(huì)加入貢獻(xiàn)代碼。

本章節(jié)首先解讀Cape Privacy公司的產(chǎn)品——Cape平臺(tái),然后介紹公司產(chǎn)品的應(yīng)用場(chǎng)景,最后簡(jiǎn)介Cape Privacy主導(dǎo)的幾個(gè)有代表性且與產(chǎn)品相關(guān)的Github開(kāi)源項(xiàng)目。

3.1 Cape平臺(tái)

Cape平臺(tái)是一個(gè)基于加密機(jī)器學(xué)習(xí)的多方數(shù)據(jù)協(xié)作平臺(tái),它通過(guò)先進(jìn)密碼學(xué)、隱私保護(hù),以及機(jī)器學(xué)習(xí)技術(shù)確保企業(yè)組織共享數(shù)據(jù)的安全狀態(tài)下改善數(shù)據(jù)模型從而提升業(yè)務(wù)價(jià)值。

如圖1所示,A、B和C三家公司希望通過(guò)數(shù)據(jù)共享實(shí)現(xiàn)聯(lián)合建模,例如三家不同銀行希望融合大量的數(shù)據(jù)樣本,聯(lián)合建立一個(gè)信用評(píng)分風(fēng)控模型。然而現(xiàn)實(shí)是,由于客戶(hù)隱私、以及法律合規(guī)的原因,三家銀行不能直接共享這些敏感數(shù)據(jù),這看似是矛盾的。但是,Cape平臺(tái)可以通過(guò)加密機(jī)器學(xué)習(xí)技術(shù),對(duì)原始的敏感數(shù)據(jù)進(jìn)行加密(例如同態(tài)加密、秘密共享、不經(jīng)意傳輸、混淆電路等密碼技術(shù)),在加密數(shù)據(jù)進(jìn)行計(jì)算與聯(lián)合建模。原始數(shù)據(jù)不出本地,即A、B和C三家公司流出是加密后的,不暴露敏感信息,在不解密的情況實(shí)現(xiàn)計(jì)算與學(xué)習(xí)(work with protected data without decrypting it),實(shí)現(xiàn)“可用不可見(jiàn)”的效果。

圖1  Cape平臺(tái)的多方敏感數(shù)據(jù)共享的框圖

具體來(lái)說(shuō),Cape平臺(tái)目前提供以下三個(gè)核心組件:

1) Cape云服務(wù)(也稱(chēng)為“Cape”),用戶(hù)可以在這里新建數(shù)據(jù)科學(xué)項(xiàng)目,以便與其他組織進(jìn)行協(xié)作。該服務(wù)還包括Cape代理,用戶(hù)可以輕松且安全地進(jìn)行連接云服務(wù)。

2) Cape Workers,由用戶(hù)來(lái)管理和運(yùn)行加密學(xué)習(xí)任務(wù),比如使用Cape Workers訪(fǎng)問(wèn)本地?cái)?shù)據(jù),對(duì)本地?cái)?shù)據(jù)使用安全多方計(jì)算等技術(shù)加密數(shù)據(jù),連接傳輸給Cape代理。

3) Python庫(kù)pycape,通過(guò)使用pycape,用戶(hù)可以與他的Cape項(xiàng)目進(jìn)行交互,查看和更新項(xiàng)目的詳細(xì)信息,且可以對(duì)數(shù)據(jù)集進(jìn)行操作或?qū)?shù)據(jù)集加密上傳到Cape。

從上面的三個(gè)核心組件可以看出,Cape平臺(tái)實(shí)際上是云-本地部署的計(jì)算架構(gòu)。由于對(duì)原始數(shù)據(jù)和中間計(jì)算狀態(tài)是加密的且計(jì)算任務(wù)在加密數(shù)據(jù)中進(jìn)行,因此云服務(wù)可以是第三方,即公有云。據(jù)官方介紹,目前支持部署在亞馬遜云S3。這與Cape Privacy公司的愿景是一致的——為客戶(hù)提供安全可用的支持加密機(jī)器學(xué)習(xí)的企業(yè)SaaS平臺(tái)。

由于Cape平臺(tái)是涉及多方的數(shù)據(jù)協(xié)作平臺(tái),Cape 云服務(wù)支持給不同的參與方分配不同的角色,以滿(mǎn)足不同的權(quán)限和制作需求。這些角色可分為組織級(jí)角色、項(xiàng)目級(jí)角色兩大類(lèi)[6],其具體的權(quán)責(zé)如下:

1) 組織級(jí)角色(Organizational-Level Roles),有3類(lèi):

組織級(jí)管理員(Organizational-Level Administrator):管理員具有Cape上所有功能的全部權(quán)限。它是由超級(jí)管理員擔(dān)任的角色,這些超級(jí)管理員需要與其他用戶(hù)配合使用,并在Cape上具有最高級(jí)別的權(quán)限。具有組織的完整權(quán)限,包括:可以在組織中添加或刪除人員、可以更改組織中任何成員的角色、可以刪除組織。此外,具有后文介紹的項(xiàng)目級(jí)管理員所有的權(quán)限。

操作員(Operator):操作員控制組織的令牌,并負(fù)責(zé)部署,運(yùn)行和監(jiān)控Cape Workers。他們能夠撤消令牌并查看組織的所有項(xiàng)目和項(xiàng)目活動(dòng)。具有的權(quán)限包括:可以查看所有組織項(xiàng)目和工作/項(xiàng)目活動(dòng)、可以發(fā)行/撤銷(xiāo)組織令牌、能夠安裝和下載Cape Workers。

用戶(hù)(User):Cape用戶(hù)可以查看他們所屬的項(xiàng)目,也可以加入和離開(kāi)被邀請(qǐng)參加的項(xiàng)目。他們只能查看和加入由Cape組織或項(xiàng)目管理員邀請(qǐng)的項(xiàng)目。具有的權(quán)限包括:組織或項(xiàng)目管理員邀請(qǐng)我加入和離開(kāi)項(xiàng)目、可以查看項(xiàng)目頁(yè)面和日志,但不能更改數(shù)據(jù)視圖/任務(wù)、批準(zhǔn)或拒絕任務(wù)。

2) 項(xiàng)目級(jí)角色(Project-Level Roles),有3類(lèi):

項(xiàng)目級(jí)管理員(Project-Level Administrator):項(xiàng)目管理員具有其在Cape上對(duì)其組織項(xiàng)目的全部權(quán)限,可以在其所屬的項(xiàng)目上添加和編輯參與者,并執(zhí)行必要的項(xiàng)目操作,例如添加和刪除數(shù)據(jù)視圖或批準(zhǔn)和運(yùn)行加密的學(xué)習(xí)任務(wù)。組織所屬的所有項(xiàng)目的完整權(quán)限,包括:可以在所有項(xiàng)目中添加或編輯貢獻(xiàn)者、可以添加,刪除所有項(xiàng)目的數(shù)據(jù)視圖、可以批準(zhǔn)和運(yùn)行所有項(xiàng)目的加密學(xué)習(xí)任務(wù),如圖2所示。

圖2  項(xiàng)目級(jí)管理員的任務(wù)管理(需同意、運(yùn)行、完成)

數(shù)據(jù)科學(xué)家(Data Scientist):數(shù)據(jù)科學(xué)家可以添加、刪除和編輯數(shù)據(jù)視圖,以及創(chuàng)建,運(yùn)行,拒絕和批準(zhǔn)項(xiàng)目的加密學(xué)習(xí)任務(wù)。他們只能查看和加入由Cape組織或項(xiàng)目管理員邀請(qǐng)的項(xiàng)目。數(shù)據(jù)科學(xué)家權(quán)限包括:組織或項(xiàng)目管理員邀請(qǐng)我加入和離開(kāi)項(xiàng)目、可以添加,刪除自己方參與的項(xiàng)目的數(shù)據(jù)視圖、可以為自己方參與的項(xiàng)目創(chuàng)建,批準(zhǔn),運(yùn)行加密的學(xué)習(xí)作業(yè)、如果自己方的組織是模型所有者,則可以訪(fǎng)問(wèn)作業(yè)的度量標(biāo)準(zhǔn)和模型權(quán)重。

用戶(hù)(User):項(xiàng)目級(jí)的用戶(hù)與組織級(jí)用戶(hù)具有相同的權(quán)限(同上文描述)。

Cape平臺(tái)除了在加密數(shù)據(jù)中學(xué)習(xí)與計(jì)算、多方參與多種角色的特點(diǎn),還具有以下的功能特點(diǎn):

1) 加密機(jī)器學(xué)習(xí)模型的訓(xùn)練速度更快

Cape Privacy優(yōu)化了加密機(jī)器學(xué)習(xí)的底層加密協(xié)議,使加密數(shù)據(jù)的使用沒(méi)有過(guò)多的計(jì)算開(kāi)銷(xiāo)和延遲,同時(shí)也提高了機(jī)器學(xué)習(xí)的成功率。

2) 多方數(shù)據(jù)協(xié)作訓(xùn)練過(guò)程中支持可視化

如圖3所示,多方數(shù)據(jù)協(xié)作訓(xùn)練過(guò)程是可視化的。

圖3  Cape平臺(tái)多方數(shù)據(jù)協(xié)作可視化

3) 技術(shù)的安全性通過(guò)同行評(píng)審進(jìn)行背書(shū)

Cape Privacy公司基本核心價(jià)值觀是尊重、合作和信任。如何確保隱私保護(hù)技術(shù)是可信任的,是安全的。Cape Privacy對(duì)新的隱私保護(hù)技術(shù)的研究采取公開(kāi)發(fā)布,同行評(píng)審機(jī)制,一些技術(shù)成果會(huì)發(fā)表會(huì)議會(huì)期刊論文中。同時(shí)通過(guò)開(kāi)源項(xiàng)目和社區(qū)的模式驅(qū)動(dòng)產(chǎn)品孵化,一些底層算法庫(kù)做到公開(kāi)透明。

3.2 應(yīng)用場(chǎng)景

Cape平臺(tái)產(chǎn)品可以在以下三種場(chǎng)景進(jìn)行應(yīng)用:

1) 金融服務(wù)

加密機(jī)器學(xué)習(xí)允許金融機(jī)構(gòu)與其他第三方進(jìn)行合作,以消除數(shù)據(jù)集的偏差,確定一些基本事實(shí)。

2) 生命科學(xué)

通過(guò)使用個(gè)人醫(yī)療信息(PHI)、健康和臨床試驗(yàn)數(shù)據(jù),通過(guò)使用跨組織的機(jī)器學(xué)習(xí),解決有偏見(jiàn)或不準(zhǔn)確的數(shù)據(jù)和模型。

3) 政府

對(duì)位置或其他個(gè)人信息進(jìn)行加密,以消除潛在的數(shù)據(jù)濫用同時(shí),推動(dòng)公共安全的進(jìn)步。

3.3 開(kāi)源項(xiàng)目

Cape Privacy在Github開(kāi)源多個(gè)加密機(jī)器學(xué)習(xí)相關(guān)項(xiàng)目,下面介紹3個(gè)具有代表性的項(xiàng)目。

1) pycape

Cape平臺(tái)核心的三個(gè)組件之一,是一個(gè)Python編寫(xiě)的模塊,可實(shí)現(xiàn)與Cape云服務(wù)組件進(jìn)行數(shù)據(jù)交互。該項(xiàng)目最近一年更新十分活躍。具體地,通過(guò)pycape模塊,可以實(shí)現(xiàn):

創(chuàng)建和查詢(xún)數(shù)據(jù)視圖,或指向Cape云服務(wù)中的加密機(jī)器學(xué)習(xí)模型訓(xùn)練過(guò)程中所需的數(shù)據(jù)位置。

提交和跟蹤任務(wù),這些任務(wù)可以看成計(jì)算會(huì)話(huà),包含如何訓(xùn)練模型的說(shuō)明。

網(wǎng)址:

https://github.com/capeprivacy/pycape

2) Cape Python

它是一個(gè)支持?jǐn)?shù)據(jù)轉(zhuǎn)換和隱私保護(hù)策略(比如不同的脫敏方法,包括哈希、置換、近似)的Python庫(kù),可用于Pandas和Apache Spark建立的數(shù)據(jù)科學(xué)項(xiàng)目。

網(wǎng)址:

https://github.com/capeprivacy/cape-python

3) TF Encrypted

它是一個(gè)構(gòu)建在TensorFlow之上的Python庫(kù),供研究人員和從業(yè)者實(shí)驗(yàn)保護(hù)隱私的機(jī)器學(xué)習(xí)。它封裝一些密碼底層協(xié)議與庫(kù),僅提供了一個(gè)類(lèi)似于TensorFlow的接口,目的是無(wú)需研究和開(kāi)發(fā)人員是密碼學(xué)、隱私保護(hù)的專(zhuān)家情況下,讓這項(xiàng)技術(shù)仍然隨時(shí)調(diào)用。TF Encrypted針對(duì)基于張量的應(yīng)用程序進(jìn)行大量的優(yōu)化,依賴(lài)于TensorFlow的后端意味著運(yùn)行時(shí)性能可與獨(dú)立的TensorFlow框架運(yùn)行相媲美。

網(wǎng)址:

https://github.com/tf-encrypted/tf-encrypted

四、技術(shù)解讀

從Cape privacy的官網(wǎng)介紹以及開(kāi)源項(xiàng)目可以看出,它提供的多方數(shù)據(jù)協(xié)作與隱私保護(hù)的企業(yè)級(jí)SaaS平臺(tái)的核心技術(shù)是安全多方計(jì)算、同態(tài)加密等核心技術(shù)。實(shí)際上,Cape平臺(tái)支持多方聯(lián)合的機(jī)器學(xué)習(xí)建模與訓(xùn)練,這與近年來(lái)數(shù)據(jù)安全領(lǐng)域的創(chuàng)新技術(shù)——“聯(lián)邦學(xué)習(xí)”實(shí)現(xiàn)的效果幾乎完全趨同,因此也可以看成一種聯(lián)邦學(xué)習(xí)方案。下面從一個(gè)簡(jiǎn)單例子對(duì)聯(lián)邦學(xué)習(xí)(加密機(jī)器學(xué)習(xí))做一個(gè)直觀的認(rèn)識(shí),然后對(duì)其原理、發(fā)展進(jìn)行一個(gè)全貌性的概述。

4.1 簡(jiǎn)單理解的例子

Cape平臺(tái)無(wú)需解密密文數(shù)據(jù),即在加密數(shù)據(jù)即可實(shí)現(xiàn)數(shù)據(jù)的處理與機(jī)器學(xué)習(xí)訓(xùn)練,其中使用同態(tài)加密、秘密分享、混淆電路、不經(jīng)意傳輸?shù)认冗M(jìn)的密碼技術(shù)。其中同態(tài)加密技術(shù)是如何構(gòu)建加密的機(jī)器學(xué)習(xí)(聯(lián)邦學(xué)習(xí))方案,官網(wǎng)給出一個(gè)簡(jiǎn)單的示例。

首先,考慮一個(gè)普通的算法,如a + b = c,如果你輸入2和3函數(shù)會(huì)產(chǎn)生5?,F(xiàn)在考慮一個(gè)特殊的加密函數(shù),如Enc(a) + Enc(b) = Enc(a+b) =Enc(c),這種性質(zhì)稱(chēng)為滿(mǎn)足“加法同態(tài)加密”性質(zhì),比如Paillier加密系統(tǒng)。如果輸入Enc(2)和Enc(3),將它們進(jìn)行運(yùn)算Enc (2) + Enc (3),那么將生成Enc(5)。那么,在此過(guò)程中,可以在不解密的情況下將兩個(gè)數(shù)字相加來(lái)產(chǎn)生輸出。結(jié)果輸出仍然是加密的,只能由使用密鑰的人解密,可顯示答案是5。

同樣的方法可以應(yīng)用于加密機(jī)器學(xué)習(xí)模型中,比如線(xiàn)性回歸是一個(gè)加法和一個(gè)矩陣乘法:aX + b = Y;加密的線(xiàn)性回歸為:Enc(aX) + Enc(b) = Enc(Y),對(duì)加密數(shù)據(jù)運(yùn)行加密的線(xiàn)性回歸模型將產(chǎn)生加密的Enc(Y)結(jié)果。這使得用戶(hù)可以在加密數(shù)據(jù)中機(jī)器學(xué)習(xí)模型訓(xùn)練與預(yù)測(cè),而不暴露或讀取數(shù)據(jù),如圖4所示。這意味著數(shù)據(jù)科學(xué)家可以通過(guò)這種技術(shù),實(shí)現(xiàn)多方數(shù)據(jù)的協(xié)作與共享,從而提高他們的模型的準(zhǔn)確性。

圖4  加密線(xiàn)性回歸模型的簡(jiǎn)單示例

4.2 聯(lián)邦學(xué)習(xí)概述

聯(lián)邦學(xué)習(xí)(Federated Learning, FL)概念最早由谷歌在2016年提出,原本用于解決大規(guī)模Android終端協(xié)同分布式機(jī)器學(xué)習(xí)的隱私保護(hù)問(wèn)題,它有機(jī)融合了機(jī)器學(xué)習(xí)、分布式通信、以及隱私保護(hù)技術(shù)與理論。隨著全球隱私法規(guī)的強(qiáng)化,以及數(shù)據(jù)利用需求旺盛,自從聯(lián)邦學(xué)習(xí)概念提出以來(lái),在學(xué)術(shù)界和工業(yè)界受到廣泛的關(guān)注,發(fā)展十分迅速。

聯(lián)邦學(xué)習(xí)可以使得多個(gè)參與方(如企業(yè)、用戶(hù)移動(dòng)設(shè)備)在不交換原始數(shù)據(jù)情況下(也表述為“敏感數(shù)據(jù)不出本地”),實(shí)現(xiàn)聯(lián)合機(jī)器學(xué)習(xí)建模、訓(xùn)練和模型部署。聯(lián)邦學(xué)習(xí)按照參與各方使用數(shù)據(jù)集的不同場(chǎng)景可分為三種類(lèi)別:橫向聯(lián)邦學(xué)習(xí)、縱向聯(lián)邦學(xué)習(xí)和聯(lián)邦遷移學(xué)習(xí)。按照聯(lián)邦學(xué)習(xí)算法類(lèi)型可分為聯(lián)邦線(xiàn)性回歸、聯(lián)邦提升樹(shù)、聯(lián)邦神經(jīng)網(wǎng)絡(luò)等。目前亟需解決的聯(lián)邦學(xué)習(xí)的是算法效率、精度、通信機(jī)制以及參與方的誠(chéng)信等問(wèn)題。

聯(lián)邦學(xué)習(xí)有兩大類(lèi)場(chǎng)景應(yīng)用:B2C場(chǎng)景——移動(dòng)設(shè)備的隱私數(shù)據(jù)采集與機(jī)器學(xué)習(xí),如谷歌、蘋(píng)果在Android、iOS設(shè)備的應(yīng)用;B2B場(chǎng)景——企業(yè)組織間的敏感數(shù)據(jù)共享與機(jī)器學(xué)習(xí),如多家銀行聯(lián)合建立風(fēng)控模型。在具體的行業(yè)應(yīng)用上,國(guó)內(nèi)外多家企業(yè)開(kāi)展了探索,并且實(shí)現(xiàn)了一些商業(yè)落地案例。如谷歌將聯(lián)邦學(xué)習(xí)應(yīng)用在Android手機(jī)的新聞推薦上,并開(kāi)源了TensorFlow Federated框架;Intel 將TEE(可信任執(zhí)行環(huán)境)技術(shù)與聯(lián)邦學(xué)習(xí)進(jìn)行結(jié)合;國(guó)內(nèi)的微眾銀行為代表將聯(lián)邦學(xué)習(xí)應(yīng)用在保險(xiǎn)定價(jià)、圖像檢測(cè)等領(lǐng)域,并開(kāi)源了FATE聯(lián)邦學(xué)習(xí)框架;此外,百度、騰訊和京東等廠(chǎng)商均推出了聯(lián)邦學(xué)習(xí)相關(guān)產(chǎn)品與應(yīng)用。

具體的聯(lián)邦學(xué)習(xí)技術(shù)介紹可參考文章《十種前沿?cái)?shù)據(jù)安全技術(shù),聚焦企業(yè)合規(guī)痛點(diǎn)》以及相關(guān)的研究報(bào)告。

五、總結(jié)與點(diǎn)評(píng)

無(wú)論是歐盟GDPR,美國(guó)CCPA,還是中國(guó)呼之欲出的《數(shù)據(jù)安全法》、《個(gè)人信息保護(hù)法》兩部法規(guī)的未來(lái)落地,國(guó)內(nèi)外公司繞不開(kāi)的迫切需亟需解決的安全問(wèn)題——遵循數(shù)據(jù)安全合規(guī)。為了應(yīng)對(duì)挑戰(zhàn),從目前的合規(guī)產(chǎn)品與應(yīng)用市場(chǎng)來(lái)看,筆者將其分為三類(lèi):

第一類(lèi)是滿(mǎn)足顯式合規(guī)需求的相關(guān)產(chǎn)品與工具,比如Securiti.ai和 OneTrust提供的合規(guī)性檢查協(xié)作平臺(tái)、用戶(hù)數(shù)據(jù)權(quán)利(訪(fǎng)問(wèn)權(quán)、修改權(quán)、限制處理權(quán)等)的請(qǐng)求-響應(yīng)自動(dòng)化工具(參考《RSA2020創(chuàng)新沙盒Securiti.ai—解決隱私合規(guī)痛點(diǎn)的一站式自動(dòng)化方案》);

第二類(lèi)是可以有效降低企業(yè)內(nèi)部合規(guī)風(fēng)險(xiǎn)的產(chǎn)品,一般是敏感數(shù)據(jù)的“識(shí)別-防護(hù)-評(píng)估”為基本體系的數(shù)據(jù)安全治理方案,比如BigID提供的敏感數(shù)據(jù)識(shí)別產(chǎn)品、以及Microsoft、IBM的數(shù)據(jù)脫敏產(chǎn)品,以及國(guó)內(nèi)分類(lèi)分級(jí)、數(shù)據(jù)脫敏產(chǎn)品,該方向技術(shù)和市場(chǎng)較為成熟;

第三類(lèi)是支持跨企業(yè)的敏感數(shù)據(jù)共享與傳輸?shù)暮弦?guī)技術(shù)與產(chǎn)品,這類(lèi)產(chǎn)品吸引人的地方在于滿(mǎn)足合規(guī)同時(shí)獲得巨大的業(yè)務(wù)價(jià)值。國(guó)內(nèi)外隱私法規(guī)均顯式、隱式指出一般不允許企業(yè)將隱私數(shù)據(jù)與第三方共享,但一般也會(huì)直接或間接給出兩條路徑:一條是征求所有用戶(hù)的同意,另一條路徑對(duì)原始的個(gè)人數(shù)據(jù)進(jìn)行處理,已達(dá)到“匿名化信息”的目標(biāo)效果。

顯然地,Cape Privacy公司提供的基于加密機(jī)器學(xué)習(xí)的多方數(shù)據(jù)協(xié)作與隱私保護(hù)方案屬于第三類(lèi)的范疇。公司的產(chǎn)品Cape平臺(tái),通過(guò)先進(jìn)的密碼學(xué)和隱私保護(hù)與機(jī)器學(xué)習(xí)相結(jié)合(聯(lián)邦學(xué)習(xí)類(lèi)技術(shù)),可確??缙髽I(yè)的多方數(shù)據(jù)共享的安全下改善數(shù)據(jù)模型同時(shí)提升業(yè)務(wù)價(jià)值。值得一提的是,2019年RSAC創(chuàng)新沙盒亞軍——Duality公司,也屬于第三類(lèi)范疇,它通過(guò)定制硬件、算法優(yōu)化將同態(tài)加密技術(shù)的進(jìn)行商業(yè)應(yīng)用(《RSA2019創(chuàng)新沙盒Duality:基于同態(tài)加密的數(shù)據(jù)分析和隱私保護(hù)方案》)。如果說(shuō)2019年是第三類(lèi)創(chuàng)新技術(shù)在商業(yè)應(yīng)用上的第一次亮相,那么該類(lèi)技術(shù)經(jīng)過(guò)兩年時(shí)間的快速發(fā)展,由于其可觀的商業(yè)價(jià)值逐步形成數(shù)據(jù)安全領(lǐng)域新的賽道,Cape Privacy在項(xiàng)目開(kāi)源驅(qū)動(dòng)、新技術(shù)經(jīng)過(guò)嚴(yán)格的評(píng)審、更多的場(chǎng)景應(yīng)用、云服務(wù)模式等,這些顯示該領(lǐng)域巨大進(jìn)步,技術(shù)研究開(kāi)始走向產(chǎn)業(yè)生態(tài)、商業(yè)模式逐漸形成。Gartner在2020年預(yù)測(cè)報(bào)告,將同態(tài)加密、安全多方計(jì)算、機(jī)密計(jì)算(TEE)等技術(shù)稱(chēng)為隱私增強(qiáng)計(jì)算(Privacy Enhanced Computation)類(lèi)技術(shù),并將其與隨處運(yùn)營(yíng)、人工智能工程化等作為2021年六大重要戰(zhàn)略科技趨勢(shì),其技術(shù)的價(jià)值未來(lái)仍有巨大的研究與發(fā)展空間。

自2018年至2021年連續(xù)四年來(lái),數(shù)據(jù)安全一直是RSAC創(chuàng)新沙盒比賽的焦點(diǎn),每年都至少有一家是數(shù)據(jù)安全的初創(chuàng)公司入選。今年更是一個(gè)爆點(diǎn),更是有三家相關(guān)公司——Cape Privacy、Open Raven、Satori,其中Open Raven專(zhuān)注云資產(chǎn)發(fā)現(xiàn)、敏感數(shù)據(jù)發(fā)現(xiàn)/分類(lèi)和數(shù)據(jù)泄露監(jiān)控,Satori專(zhuān)注敏感數(shù)據(jù)發(fā)現(xiàn)/分類(lèi)、訪(fǎng)問(wèn)控制策略和數(shù)據(jù)脫敏,根據(jù)前面的劃分原則,它們均屬于第二類(lèi)范疇,是降低合規(guī)風(fēng)險(xiǎn)的數(shù)據(jù)安全治理相關(guān)產(chǎn)品。

在前三年的創(chuàng)新沙盒比賽中,2018 年BigID獲得冠軍(第二類(lèi)范疇,數(shù)據(jù)安全治理),2019 Duality 亞軍(第三類(lèi)范疇,同態(tài)加密技術(shù)的商業(yè)應(yīng)用),2020 Securiti.ai冠軍(第一類(lèi)范疇,滿(mǎn)足GDPR/CCPA的顯式合規(guī))。Cape Privacy公司通過(guò)加密機(jī)器學(xué)習(xí)(聯(lián)邦學(xué)習(xí))技術(shù),致力構(gòu)建與實(shí)現(xiàn)一個(gè)多方數(shù)據(jù)協(xié)作與隱私保護(hù)的企業(yè)級(jí)SaaS平臺(tái),旨在解決隱私監(jiān)管下的敏感數(shù)據(jù)共享難題。從技術(shù)創(chuàng)新角度是講,技術(shù)是足夠創(chuàng)新與新穎的;從商業(yè)價(jià)值上看,由于數(shù)據(jù)共享與機(jī)器學(xué)習(xí)的業(yè)務(wù),尤其是金融、醫(yī)療等敏感領(lǐng)域,價(jià)值回報(bào)是可觀的;從技術(shù)團(tuán)隊(duì)上看,公司CEO具有多家成功創(chuàng)業(yè)公司的管理經(jīng)驗(yàn),團(tuán)隊(duì)其他一些成員具有密碼學(xué)、數(shù)據(jù)科學(xué)和計(jì)算機(jī)領(lǐng)域的技術(shù)背景。有趣是,它們這個(gè)技術(shù)團(tuán)隊(duì),來(lái)自美國(guó)、英國(guó)和法國(guó)多個(gè)國(guó)家,具有天然的“分布式”基因?;谝陨系姆治?,筆者繼續(xù)看好2021年RSAC創(chuàng)新沙盒三家的數(shù)據(jù)安全公司,并認(rèn)為Cape Privacy有較大的可能性?shī)Z得今年的冠軍。

 

責(zé)任編輯:Blue 來(lái)源: 綠盟科技
相關(guān)推薦

2019-03-03 14:49:53

2021-05-28 18:06:13

RSA 創(chuàng)新沙盒

2019-03-03 14:10:06

RSA2019WireWheel

2020-02-24 10:56:00

RSA大會(huì)網(wǎng)絡(luò)安全網(wǎng)絡(luò)攻擊

2021-05-28 17:06:05

RSA/創(chuàng)新沙盒

2021-05-28 17:22:19

RSA創(chuàng)新沙盒盤(pán)

2020-02-24 09:46:04

RSA大會(huì)網(wǎng)絡(luò)安全

2021-05-28 17:37:14

RSA創(chuàng)新沙盒盤(pán)

2021-05-28 17:50:40

RSA創(chuàng)新沙盒

2021-05-28 17:42:54

RSA創(chuàng)新沙盒

2021-05-28 18:17:45

RSA 創(chuàng)新沙盒

2021-05-28 18:00:51

RSA創(chuàng)新沙盒盤(pán)

2018-04-15 16:09:10

2018RSA創(chuàng)新沙盒數(shù)據(jù)泄露

2020-02-24 23:26:11

RSA大會(huì)網(wǎng)絡(luò)安全

2020-02-24 09:54:20

RSA大會(huì)網(wǎng)絡(luò)安全

2020-02-24 09:36:17

RSA大會(huì)網(wǎng)絡(luò)安全

2020-02-24 17:58:54

RSA大會(huì)網(wǎng)絡(luò)安全

2020-02-25 10:19:00

創(chuàng)新沙盒信息安全會(huì)議RSA大會(huì)

2020-02-24 17:37:37

RSA大會(huì)網(wǎng)絡(luò)安全

2020-02-24 23:40:11

RSA大會(huì)網(wǎng)絡(luò)安全
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)