阿里安全開源隱私計算新技術(shù):計算速度快20倍,通信成本低兩倍
本文經(jīng)AI新媒體量子位(公眾號ID:QbitAI)授權(quán)轉(zhuǎn)載,轉(zhuǎn)載請聯(lián)系出處。
如何在不查看圖片的前提下,幾秒之內(nèi)就識別一張圖片?
這個看似在找茬的問題,卻是隱私計算領(lǐng)域會真實碰到的問題。
著名的“百萬富翁問題”所描述的就是這樣的場景:兩位富翁如何在不知道對方財富的前提下,比較誰的財富更多?
近年來出現(xiàn)出現(xiàn)的一些方法,比如兩方計算網(wǎng)絡(luò)推理(2PC-NN)可以解決上述問題,但同時又會造成大量的計算成本和通信開銷。
但現(xiàn)在,只要2.5分鐘,2.3GB的通信費用,就能在ResNet50的基準上進行端到端的執(zhí)行。
比起現(xiàn)在最好的兩方計算網(wǎng)絡(luò)推理框架,微軟的CryptFlow2還要分別高出5.9倍和12.9倍。
目前,這項研究已經(jīng)被國際四大安全頂會之一的USENIX Security Symposium 2022接收,研究團隊來自阿里巴巴。
這也是我國團隊首次在USENIX Sec22上發(fā)表安全多方計算(MPC)方向的論文,相關(guān)代碼目前已開源。
如何減少開銷?
這是一個叫做獵豹(Cheetah)的新型框架,是一個用于深度神經(jīng)網(wǎng)絡(luò)的兩方計算網(wǎng)絡(luò)推理系統(tǒng)。
為了使系統(tǒng)盡量高效,現(xiàn)有的兩方計算網(wǎng)絡(luò)推理框架常常會使用多種類型的加密基元(Cryptographic Primitive)。
比如,DELPHI和CrypTFlow2就會利用同態(tài)加密(HE)來評估DNN的線性函數(shù),而獵豹就是這樣一種混合系統(tǒng)。
不同的是,在設(shè)計基礎(chǔ)協(xié)議、如何協(xié)調(diào)不同類型的加密基元上,獵豹進行了新的改進:
- 重新設(shè)計了基于同態(tài)加密的協(xié)議,可在不需要任何輪調(diào)操作(Rotation Operation)以的情況下評估線性層(即卷積、批量歸一化和完全連接)
- 設(shè)計了幾個用于非線性函數(shù)(如ReLU和Truncation)的更加精簡,通信效率更高的基元
開發(fā)者將新的線性協(xié)議與先進技術(shù)進行比較,所有的運行都是用單線程執(zhí)行,結(jié)果是計算速度最高快了20倍,通信成本最低低到2倍:
而在所有的協(xié)議和優(yōu)化都完成時,在大型DNN上運行加密推理,在3分鐘內(nèi),獵豹就可以評估SqueezeNet、ResNet50和DenseNet121:
放到實際應(yīng)用上:假如客戶甲有一張圖片,服務(wù)器乙需要對該圖片進行AI識別,判斷是否含有不合規(guī)的內(nèi)容,但出于隱私保護要求,又不能查看甲的圖片本身。
這時,使用微軟的ryptFlow2,需要數(shù)百秒才能完成一張圖片識別。
而獵豹在保證同等的可證明安全前提下,讓速度快了5倍,數(shù)十秒就能識別。
作者介紹
論文共有兩位一作,黃智聰(Zhicong Huang)和Wen-jie Lu。
其中,黃智聰本科畢業(yè)于北京大學(xué)的計算機科學(xué)系,2018年從瑞士洛桑聯(lián)邦理工學(xué)院(EPFL)獲得博士學(xué)位。
他現(xiàn)在就職于阿里巴巴安全部雙子座實驗室,負責(zé)研究數(shù)據(jù)保護與共享技術(shù),研究領(lǐng)域包括應(yīng)用密碼學(xué),數(shù)據(jù)安全與隱私,差分隱私,機器學(xué)習(xí),安全計算,同態(tài)加密,隔離計算。
論文:
??https://eprint.iacr.org/2022/207??
開源地址:
??https://github.com/Alibaba-Gemini-Lab/OpenCheetah??