分類分級是數(shù)據(jù)安全的必由之路!
如何基于數(shù)據(jù)安全五大原則(數(shù)據(jù)隔離、風險識別、數(shù)據(jù)生命周期保護、維持合規(guī)、事件響應(yīng)),構(gòu)建安全領(lǐng)域“三道防線”(技術(shù)防線、管理防線、法律防線),是國家、政府機構(gòu)、企業(yè)的關(guān)注重點。而數(shù)據(jù)分類分級是數(shù)據(jù)安全的必由之路,也是讓數(shù)據(jù)真正用起來的首要前提。
一、數(shù)據(jù)分類分級管理概述
大數(shù)據(jù)時代,數(shù)據(jù)呈現(xiàn)多源異構(gòu)的特點,價值各不相同,企業(yè)應(yīng)根據(jù)數(shù)據(jù)的重要性、價值指數(shù)等方面予以區(qū)分,便于采取不同的數(shù)據(jù)保護措施,防止數(shù)據(jù)泄露。因此,數(shù)據(jù)分類分級管理是數(shù)據(jù)安全保護中的重要環(huán)節(jié)之一。
1.數(shù)據(jù)分類
數(shù)據(jù)分類是指根據(jù)組織數(shù)據(jù)的屬性或特征,將其按照一定的原則和方法進行區(qū)分和歸類,并建立起一定的分類體系和排列順序,以便更好地管理和使用組織數(shù)據(jù)的過程。
數(shù)據(jù)分類是數(shù)據(jù)保護工作中的關(guān)鍵部分之一,是建立統(tǒng)一、準確、完善的數(shù)據(jù)架構(gòu)的基礎(chǔ),是實現(xiàn)集中化、專業(yè)化、標準化數(shù)據(jù)管理的基礎(chǔ)。
2.數(shù)據(jù)分級
數(shù)據(jù)分級是指按照公共數(shù)據(jù)遭到破壞(包括攻擊、泄露、篡改、非法使用等)后對受侵害各體合法權(quán)益(國家安全、社會秩序、公共利益以及公民、法人和其他組織)的危害程度,對公共數(shù)據(jù)進行定級,為數(shù)據(jù)全生命周期管理進行的安全策略制定。
二、數(shù)據(jù)分類分級方法及細則
數(shù)據(jù)分類的常用方法:按關(guān)系分類,基于業(yè)務(wù)(來源)、基于內(nèi)容、基于監(jiān)管等。
數(shù)據(jù)分級的常用方法:按特性分級,基于價值(公開、內(nèi)部、重要核心等)、基于敏感程度(公開、秘密、機密、絕密等)、基于司法影響范圍(大陸境內(nèi)、跨區(qū)、跨境等)。
公用數(shù)據(jù)分類的常用方法:重要數(shù)據(jù)、個人及企業(yè)信息、業(yè)務(wù)數(shù)據(jù)。下面就來具體說明這三類公用數(shù)據(jù)。
重要數(shù)據(jù):指一旦泄露則可導致危害國家安全,或危害公共利益、生命、財產(chǎn)安全,或危害國家關(guān)鍵基礎(chǔ)設(shè)施,或擾亂市場秩序,或可推論出國家秘密等的數(shù)據(jù)。
個人及企業(yè)信息:包含直接個人信息,以電子或其他方式記錄的、能夠單獨或與其他信息結(jié)合識別的自然人個人身份或企業(yè)的各種信息。
業(yè)務(wù)數(shù)據(jù):包含企業(yè)或公共組織從事經(jīng)營活動或例行社會管理功能、事務(wù)處理等一系列活動所產(chǎn)生的可存儲的數(shù)據(jù)。
根據(jù)上述公用數(shù)據(jù)的分類,重要數(shù)據(jù)分級、個人及企業(yè)信息分級和業(yè)務(wù)數(shù)據(jù)分級的方法分別如圖1、圖2和圖3所示。
圖1 重要數(shù)據(jù)分級方法示意圖
圖2 個人及企業(yè)信息分級方法示意圖
圖3 業(yè)務(wù)數(shù)據(jù)分級方法示意圖
企業(yè)可基于上述公用數(shù)據(jù)分類分級策略,結(jié)合自身業(yè)務(wù)和合規(guī)需求實際情況,規(guī)劃出適合企業(yè)自身的數(shù)據(jù)分類分級方法,建立適合組織自身的數(shù)據(jù)分類分級原則和方法,將數(shù)據(jù)按照重要程度進行分類。
然后在數(shù)據(jù)分類的基礎(chǔ)上,根據(jù)數(shù)據(jù)安全在受到破壞后對組織造成的影響和損失進行分級,如果組織層面已經(jīng)具有相關(guān)的分類分級標準,則可酌情進行參考。在實際執(zhí)行時,如果一次性做不到完全細粒度區(qū)分,則可以多步實現(xiàn),循序漸進,不要設(shè)計過度復雜的方案。
企業(yè)自主分類分級可參考如圖4所示的思路,基于非敏感、敏感、涉密三個等級,對應(yīng)上述重要數(shù)據(jù)的五個等級進行分級。
圖4 企業(yè)自主分類分級參考示意圖
三、常見數(shù)據(jù)分類分級標準
1.數(shù)據(jù)分類分級框架
來源:全國信息安全標準化技術(shù)委員會秘書處
2.分類標準
數(shù)據(jù)分類具有多種視角和維度,其主要目的是便于數(shù)據(jù)管理和使用。數(shù)據(jù)處理者進行數(shù)據(jù)分類時,應(yīng)優(yōu)先遵循國家、行業(yè)的數(shù)據(jù)分類要求,如果所在行業(yè)沒有行業(yè)數(shù)據(jù)分類規(guī)則,也可從組織經(jīng)營維度進行數(shù)據(jù)分類。常見的數(shù)據(jù)分類維度,包括但不限于:
- 公民個人維度:將數(shù)據(jù)分為個人信息、非個人信息。
- 公共管理維度:將數(shù)據(jù)分為公共數(shù)據(jù)、社會數(shù)據(jù)。
- 信息傳播維度:將數(shù)據(jù)分為公共傳播信息、非公共傳播信息。
- 行業(yè)領(lǐng)域維度:將數(shù)據(jù)分為工業(yè)數(shù)據(jù)、電信數(shù)據(jù)、金融數(shù)據(jù)、交通數(shù)據(jù)、自然資源數(shù)據(jù)、衛(wèi)生健康數(shù)據(jù)、教育數(shù)據(jù)、科技數(shù)據(jù)等。
- 組織經(jīng)營維度:將數(shù)據(jù)分為用戶數(shù)據(jù)、業(yè)務(wù)數(shù)據(jù)、經(jīng)營管理數(shù)據(jù)、系統(tǒng)運行和安全數(shù)據(jù)。
3.分級標準
從國家數(shù)據(jù)安全角度出發(fā),數(shù)據(jù)分級基本框架分為一般數(shù)據(jù)、重要數(shù)據(jù)、核心數(shù)據(jù)三個級別。數(shù)據(jù)處理者可在基本框架定級的基礎(chǔ)上,結(jié)合行業(yè)數(shù)據(jù)分類分級規(guī)則或組織生產(chǎn)經(jīng)營需求,考慮影響對象、影響程度兩個要素進行分級。各級別與影響對象、影響程度對應(yīng)關(guān)系如下表所示:
基本級別 | 影響對象 | |||
國家安全 | 公共利益 | 個人合法權(quán)益 | 組織合法權(quán)益 | |
核心數(shù)據(jù) | 一般危害、嚴重危害 | 嚴重危害 | - | - |
重要數(shù)據(jù) | 輕微危害 | 一般危害、輕微危害 | - | - |
一般數(shù)據(jù) | 無危害 | 無危害 | 無危害、輕微危害、一般危害、嚴重危害 | 無危害、輕微危害、一般危害、嚴重危害 |
來源:全國信息安全標準化技術(shù)委員會秘書處
下面列舉了幾種行業(yè)分級標準,影響程度從低到高:
- 政府數(shù)據(jù):公開、內(nèi)部、涉密。
- 金融數(shù)據(jù):1級、2級、3級、4級、5級。
- 證券期貨數(shù)據(jù):低、中、高、超高。
分類分級標準詳見:6000字,詳細解析數(shù)據(jù)的分類與分級
四、基于實際應(yīng)用場景的分類技術(shù)
基于實際應(yīng)用場景的數(shù)據(jù)分類主要包含以下幾種手段,其中,實際運用的技術(shù)手段可能涵蓋內(nèi)容感知分類方法和情景感知分類方法中的多種方法。
標簽庫:根據(jù)分類分級規(guī)則建立標簽庫;既可以單獨成一個靜態(tài)庫,也可以直接在打標工具或系統(tǒng)后臺進行自定義配置。我們可以根據(jù)不同的文件格式類型建立標簽庫。比如,對于數(shù)據(jù)庫文件(.mdf),我們可以根據(jù)業(yè)務(wù)類型由大類到小類定義多個標簽。再比如,對于旅游業(yè),我們可以建立(商業(yè)、旅游、用戶信息)的標簽庫。除了文件后綴名之外,我們還可以通過關(guān)鍵字、正則表達式等方式設(shè)定標簽規(guī)則。
結(jié)構(gòu)化數(shù)據(jù)打標:用戶在建表時可以對字段標簽直接進行設(shè)置,基于數(shù)據(jù)庫的權(quán)限模型,對底層數(shù)據(jù)表的列權(quán)限進行控制。遍歷讀取數(shù)據(jù)庫的表名、列名,甚至是列的內(nèi)容,結(jié)合標簽庫中設(shè)定的規(guī)則,或者自定義規(guī)則,對發(fā)現(xiàn)的表名、列名以更細的粒度對數(shù)據(jù)進行分類劃分。
非結(jié)構(gòu)化數(shù)據(jù)打標:引入自然語言處理、數(shù)據(jù)挖掘和機器學習等技術(shù),對內(nèi)容進行識別,并與標簽庫相關(guān)的特征進行匹配,從而對非結(jié)構(gòu)化的數(shù)據(jù)進行分類。
標注:首先,對一批文檔進行人工分類,以作為訓練集,然后利用機器學習算法,經(jīng)過一段時間的學習之后,依據(jù)學習結(jié)果,對其他數(shù)據(jù)進行大批量打標。
訓練:計算機從這些文檔中挖掘出一些能夠有效分類的規(guī)則,生成分類器(即總結(jié)出來的規(guī)則集合)。
分類:將生成的分類器應(yīng)用在有待分類的文檔集合中,獲取文檔的分類結(jié)果。由于機器學習方法在文本分類領(lǐng)域有著良好的實際表現(xiàn),因此該方法已經(jīng)成為該領(lǐng)域的主流。
數(shù)據(jù)分類與訪問控制
分級指的是在分類的基礎(chǔ)上,依據(jù)數(shù)據(jù)的敏感程度、影響范圍及自身的價值等對數(shù)據(jù)進行等級劃分,如上表所示,依據(jù)分類產(chǎn)生的標簽結(jié)果,可根據(jù)標簽定義數(shù)據(jù)的敏感程度,對數(shù)據(jù)進行進一步分級。
五、數(shù)據(jù)分類分級應(yīng)用實踐舉例
數(shù)據(jù)平臺對數(shù)據(jù)分類分級的規(guī)劃實現(xiàn)架構(gòu):
平臺以“高密低訪”為基本原則,即高密的數(shù)據(jù)不能被低密的用戶訪問,高密的用戶可以訪問低密的數(shù)據(jù)。通過權(quán)限控制與數(shù)據(jù)脫敏相結(jié)合,可以完成更加精細化的數(shù)據(jù)安全管控場景。
類別管理:對于數(shù)據(jù)分類下的數(shù)據(jù),可以針對不同的人設(shè)置不同的數(shù)據(jù)脫敏方式,達到相同數(shù)據(jù)展現(xiàn)給每個人不同的結(jié)果。在數(shù)據(jù)沒有設(shè)置級別時,也可以通過分類達到訪問控制的效果。
級別管理:通過對數(shù)據(jù)、用戶設(shè)置不同的級別,可以完成對用戶訪問權(quán)限的控制。當用戶級別大于等于數(shù)據(jù)級別時,用戶才可訪問。
展示層:用于驗證數(shù)據(jù)分類分級的安全管控效果。例如數(shù)據(jù)是否可訪問、是否脫敏。
應(yīng)用舉例:
1.數(shù)據(jù)說明:
a) 級別定義
本案例采用三級模型:公開、秘密、機密。
b) 設(shè)置級別
為數(shù)據(jù)設(shè)置級別:
為用戶設(shè)置級別:
c) 新建脫敏規(guī)則
d) 員工保密數(shù)據(jù)類別設(shè)置脫敏策略
- 關(guān)聯(lián)數(shù)據(jù):id_number
- 脫敏對象:小B
- 脫敏規(guī)則:身份證號碼脫敏
數(shù)據(jù)總結(jié)如下:
2.場景分析:
在數(shù)棲平臺安全管控下:
- 小A只能訪問id、name數(shù)據(jù),當其訪問id_number、salary時,會被拒絕訪問;
- 小B可以訪問id、name、id_number、salary全部數(shù)據(jù);但是當訪問id_number時看到的是被脫敏后的數(shù)據(jù),例如41111119961127xxxx。
總結(jié):
只有當用戶級別大于等于數(shù)據(jù)級別時,才被允許訪問。允許訪問之后,如果有脫敏策略,會進行脫敏處理。