如何基于 Dataphin 實(shí)現(xiàn)敏感數(shù)據(jù)保護(hù)
在《基于數(shù)據(jù)分類分級(jí)和敏感數(shù)據(jù)保護(hù),保障企業(yè)數(shù)據(jù)安全》一文中,我們講解了Dataphin中資產(chǎn)安全的主要應(yīng)用場(chǎng)景和基本概念,那么如何利用Dataphin的安全能力,來(lái)保障企業(yè)的數(shù)據(jù)安全呢?
我們來(lái)看一個(gè)最常見的案例:消費(fèi)者隱私數(shù)據(jù)保護(hù)。
場(chǎng)景介紹
近幾年,隨著消費(fèi)者個(gè)人意識(shí)的崛起和對(duì)隱私的重視,數(shù)據(jù)安全成為了一個(gè)越來(lái)越熱門的話題,國(guó)家也陸續(xù)發(fā)布了一些相關(guān)規(guī)定,來(lái)規(guī)范數(shù)據(jù)的采集和使用。在企業(yè)的發(fā)展過程中,如果不重視敏感數(shù)據(jù)的保護(hù),不重視數(shù)據(jù)安全體系的建設(shè),那么一旦發(fā)生了敏感數(shù)據(jù)泄漏事件,輕則企業(yè)口碑受損,業(yè)務(wù)受影響;重則會(huì)直接觸法律,受到主管部門的處罰和制裁。
而在企業(yè)領(lǐng)域的敏感信息中,個(gè)人敏感信息是絕對(duì)的大頭,包括個(gè)人的身份信息(姓名、身份證號(hào)碼)、聯(lián)系方式(手機(jī)、郵箱、地址)、個(gè)人財(cái)產(chǎn)信息、生物識(shí)別信息等等,都屬于個(gè)人敏感數(shù)據(jù)。這些數(shù)據(jù)一旦泄漏,對(duì)用戶的個(gè)人生活以及對(duì)企業(yè)的業(yè)務(wù)運(yùn)行,都會(huì)產(chǎn)生非常大的損害,所以在企業(yè)的業(yè)務(wù)運(yùn)轉(zhuǎn)中,要對(duì)消費(fèi)者的個(gè)人隱私數(shù)據(jù)進(jìn)行脫敏保護(hù)。
圖片:支付寶中,對(duì)用戶姓名與用戶賬號(hào)的脫敏保護(hù)
主要流程
首先,我們回顧一下在Dataphin上,實(shí)現(xiàn)敏感數(shù)據(jù)保護(hù)的主要流程:
在Dataphin中,實(shí)現(xiàn)敏感數(shù)據(jù)保護(hù),主要可以分為以下三個(gè)步驟:
1、識(shí)別敏感數(shù)據(jù):即設(shè)定數(shù)據(jù)分類、數(shù)據(jù)分級(jí)、識(shí)別規(guī)則等內(nèi)容
2、設(shè)置敏感數(shù)據(jù)保護(hù)方式:為識(shí)別的敏感數(shù)據(jù)選擇合適的脫敏算法、設(shè)定脫敏規(guī)則
3、數(shù)據(jù)消費(fèi):在即席查詢、開發(fā)數(shù)據(jù)寫生產(chǎn)等場(chǎng)景進(jìn)行數(shù)據(jù)消費(fèi)時(shí)脫敏
詳細(xì)步驟
接下來(lái),我們以用戶敏感信息中,最常見的用戶姓名為例,展示如何一步步的首先用戶姓名的識(shí)別和脫敏保護(hù)。
1、識(shí)別敏感數(shù)據(jù)
假設(shè)我們已經(jīng)建立好了數(shù)據(jù)分類和數(shù)據(jù)分級(jí)(Dataphin會(huì)內(nèi)置通用的分類和分級(jí)標(biāo)準(zhǔn),支持開箱即用),我們直接進(jìn)入新建識(shí)別規(guī)則的模擬步驟:
新建一個(gè)【用戶姓名】的識(shí)別規(guī)則;
掃描范圍選擇【全部】;
掃描方式選擇【內(nèi)置識(shí)別】-【名字】(如果用戶姓名的字段都叫【name】,也可以配置正則規(guī)則【^name$】);
數(shù)據(jù)分類選擇【個(gè)人數(shù)據(jù)(C)】;
數(shù)據(jù)分級(jí)選擇【機(jī)密數(shù)據(jù)(L3)】(根據(jù)自己企業(yè)的情況靈活調(diào)衡);
優(yōu)先級(jí)選擇【3】(中間優(yōu)先級(jí),根據(jù)自己企業(yè)的情況靈活調(diào)整);
配置完成識(shí)別規(guī)則后,我們可以觸發(fā)一次【手動(dòng)規(guī)則掃描】,或者等到第二天,系統(tǒng)會(huì)自動(dòng)執(zhí)行一次全局掃描。最終敏感數(shù)據(jù)識(shí)別的結(jié)果,都可以在【識(shí)別記錄】頁(yè)面看到:
2、設(shè)置敏感數(shù)據(jù)保護(hù)方式
識(shí)別到敏感數(shù)據(jù)之后,下一步就是給敏感數(shù)據(jù)設(shè)置合適的保護(hù)方式,從而保證數(shù)據(jù)不泄漏。
Dataphin當(dāng)前內(nèi)置了多種遮蓋脫敏規(guī)則(如【張三】,顯示成【*三】)、哈希脫敏規(guī)則(如【張三】,顯示為【615DB57AA314529AAA0FBE95B3E95BD3】),可以滿足大部分業(yè)務(wù)場(chǎng)景下的數(shù)據(jù)保護(hù)需求,并在未來(lái)支持加解密算法和用戶自定義脫敏算法。
這里建議大家根據(jù)業(yè)務(wù)需求,選擇合適的算法。比如對(duì)于用戶姓名,在大部分的業(yè)務(wù)場(chǎng)景中(如支付寶轉(zhuǎn)賬),都是不能顯示完整的名稱,但是可以顯示一部分,用于身份確認(rèn),這樣就可以選擇內(nèi)置的【中文姓名】的脫敏算法
選擇好合適的脫敏算法之后,我們就可以配置動(dòng)態(tài)脫敏規(guī)則了,還是以用戶姓名為例:
新建一個(gè)【用戶姓名脫敏】的脫敏規(guī)則;
綁定已經(jīng)建好的敏感數(shù)據(jù)識(shí)別規(guī)則【用戶姓名】;
應(yīng)用場(chǎng)景選擇【寫開發(fā)表】、【即席查詢】;
脫敏方式選擇【遮蓋掩碼-中文姓名】;
生效范圍選擇【全部】
至此,我們的敏感數(shù)據(jù)識(shí)別和保護(hù)就已經(jīng)完全配置完成了,接下來(lái)在數(shù)據(jù)消費(fèi)的過程中,就可以對(duì)數(shù)據(jù)進(jìn)行保護(hù)了。
3、數(shù)據(jù)消費(fèi)
下面已即席查詢?yōu)槔?,展示敏感?shù)據(jù)識(shí)別和脫敏的效果:
可以看到,我們開始往表格里寫入的數(shù)據(jù)是【張三】,因?yàn)閷懭肓嗣舾袛?shù)據(jù)【name】字段,也就是【用戶姓名】,所以在數(shù)據(jù)讀取的時(shí)候,系統(tǒng)自動(dòng)的進(jìn)行了脫敏,操作的同學(xué)只能夠看到【*三】,從而防止敏感數(shù)據(jù)泄漏,保護(hù)了數(shù)據(jù)安全。
結(jié)語(yǔ)
上面通過用戶姓名這樣一個(gè)非常很簡(jiǎn)單的案例,串講了整個(gè)敏感數(shù)據(jù)識(shí)別和脫敏的主流程,相信能幫助您理解整個(gè)數(shù)據(jù)安全保護(hù)的機(jī)制;而在主流程之外,還有數(shù)據(jù)分類分級(jí)的制定、審核識(shí)別記錄并手動(dòng)修改、脫敏白名單等流程。同時(shí),在企業(yè)實(shí)際的數(shù)據(jù)安全保護(hù)中,還有更多的系統(tǒng)工作要做,比如制定符合企業(yè)的數(shù)據(jù)分類分級(jí)體系、建立完整的數(shù)據(jù)識(shí)別體系等等。