重磅!谷歌發(fā)布用于保護數(shù)據(jù)隱私的開發(fā)工具
無論你是城市規(guī)劃師還是小型企業(yè)CEO或者是一名軟件開發(fā)者,利用好數(shù)據(jù)可以讓你更好地為客戶提供服務(wù),但是如果沒有強有力的隱私保護,你也可能因此失去用戶的信任。
差分隱私是數(shù)據(jù)分析的一種手段,旨在提供一種當從統(tǒng)計數(shù)據(jù)庫查詢時,最大化數(shù)據(jù)查詢的準確性,同時最大限度減少識別其記錄的機會。例如,如果您是一名健康研究人員,您可能想要比較不同醫(yī)院的患者住院的平均時間,以確定在護理方面是否存在差異。差別隱私是一種高度可靠的分析方法,可以在確保個人隱私的前提下做數(shù)據(jù)分析。
近日,谷歌開源了其差異隱私平臺,該技術(shù)已經(jīng)用于谷歌內(nèi)部的一些核心應(yīng)用,谷歌表示開源該技術(shù)是為了滿足開發(fā)人員的需求而設(shè)計的。除了可以自由訪問,它還希望它易于部署和使用。
以下是該庫的一些功能特性:
統(tǒng)計功能:這個版本支持大多數(shù)常見的數(shù)據(jù)科學操作。開發(fā)人員可以使用該庫計算計數(shù)、和、平均值、中位數(shù)和百分位數(shù)等運算。
嚴格的測試:正確區(qū)分隱私是一項挑戰(zhàn)。除了一個廣泛的測試組件,它還包括一個可擴展的“隨機差異隱私模型檢查器庫”,以此避免發(fā)生錯誤。
快速入門:開源發(fā)行版的真正用途在于回答“我可以使用這個嗎?”這也是為什么谷歌加入了一個PostgreSQL擴展和一些常用操作指南的原因。此外,谷歌特地在一篇技術(shù)論文中描述了該庫使用方法的細節(jié)
模塊化:谷歌設(shè)計的這個開源庫可以擴展到其他功能,比如附加機制、聚合功能或隱私預(yù)算管理。
自從我們在2014年發(fā)布RAPPOR以幫助改進Chrome 以來,谷歌一直致力于研究和開發(fā)實用的差異私有技術(shù),例如出行軟件 Project Fi 中可以了解一天中的業(yè)務(wù)繁忙程度、特定餐廳的菜肴在 Google 地圖中的受歡迎程度等。
今年,宣布了幾項開源隱私技術(shù)——Tensorflow Privacy, Tensorflow Federated, Private Join and Compute,涵蓋的領(lǐng)域從醫(yī)學到政府再到商業(yè)等。
如今differential-privacy已經(jīng)在Github上獲得 648 個Star,62 個Fork(Github地址:https://github.com/google/differential-privacy/)