人工智能在數(shù)據(jù)安全中的應用場景
場景一:數(shù)據(jù)資產(chǎn)梳理
數(shù)據(jù)資產(chǎn)梳理是數(shù)據(jù)安全的基礎(chǔ)。知道企業(yè)究竟有多少數(shù)據(jù),這些數(shù)據(jù)在哪里?有哪些類型的數(shù)據(jù)?其中哪些是敏感數(shù)據(jù)?這些數(shù)據(jù)的敏感等級分別是什么?只有明確了保護的目標,才能有針對性的對安全風險進行防護。
對于大數(shù)據(jù)來說,首先要做的一項工作就是進行數(shù)據(jù)發(fā)現(xiàn),通過對數(shù)據(jù)資產(chǎn)的全面盤點,形成相應的數(shù)據(jù)資產(chǎn)地圖,知道自己手里有什么之后,才能有針對性的保護數(shù)據(jù)資產(chǎn)安全。
全息數(shù)據(jù)資產(chǎn)測繪系統(tǒng)是基于多年數(shù)據(jù)安全技術(shù)研發(fā)實踐,推出的一款數(shù)據(jù)資產(chǎn)梳理的安全技術(shù)工具。該產(chǎn)品采用B/S結(jié)構(gòu)和大數(shù)據(jù)底層技術(shù)框架,搭載數(shù)據(jù)資產(chǎn)自動發(fā)現(xiàn)、數(shù)據(jù)架構(gòu)智能掃描、敏感資產(chǎn)自動識別等先進技術(shù)引擎,能夠幫助企業(yè)快速定位其內(nèi)部網(wǎng)絡(luò)中的數(shù)據(jù)服務,實現(xiàn)對目標環(huán)境中的數(shù)據(jù)資產(chǎn)梳理,即完成數(shù)據(jù)資產(chǎn)全面摸排清查,清晰了解數(shù)據(jù)資產(chǎn)類型、數(shù)據(jù)資產(chǎn)分布、數(shù)據(jù)資產(chǎn)權(quán)限、敏感數(shù)據(jù)分布、流轉(zhuǎn)和使用情況,對數(shù)據(jù)資產(chǎn)進行不同類別和密級的劃分并構(gòu)建數(shù)據(jù)資產(chǎn)目錄,以便實現(xiàn)對敏感數(shù)據(jù)進行針對性防護,更幫助企業(yè)奠定數(shù)據(jù)價值挖掘和數(shù)據(jù)安全防護的堅實基礎(chǔ)。
場景二:敏感數(shù)據(jù)智能識別及分級分類
在大數(shù)據(jù)應用日益廣泛的今天,數(shù)據(jù)資源的共享和開放已成為促進大數(shù)據(jù)產(chǎn)業(yè)發(fā)展的關(guān)鍵,但由于數(shù)據(jù)的敏感性,加之各行業(yè)數(shù)據(jù)分類分級標準的滯后性和缺失,使數(shù)據(jù)開放共享面臨諸多困難:
- 海量的數(shù)據(jù)背景下,人工手動進行分類效率低下。在企業(yè)數(shù)據(jù)分類工作中,通過人工分類往往需要幾個月甚至更長的時間才能完成,而且在分類過程中,又會有數(shù)據(jù)新增或者舊的數(shù)據(jù)發(fā)生變更,造成數(shù)據(jù)分類工作無法準確、及時的交付。
- 人員業(yè)務知識有限,無法專業(yè)的對不同業(yè)務數(shù)據(jù)進行歸類。數(shù)據(jù)分類人員一般需要具有專業(yè)的業(yè)務知識,分類過程需要企業(yè)調(diào)配相應的業(yè)務資源進行持續(xù)的配合,需要大量的時間和溝通成本。
- 通過文件名、文件格式進行分類,很難保證分類與內(nèi)容的準確匹配。
- 數(shù)據(jù)分類后,對于不同種類的數(shù)據(jù)需要形成對應的安全檢測策略。隨著數(shù)據(jù)量和數(shù)據(jù)內(nèi)容的不斷變更,還需要企業(yè)花大量的人力物力進行安全策略的更新,同樣給企業(yè)帶來更多的資源消耗。
通過AI算法進行自動化和智能化數(shù)據(jù)分類分級,有利于穩(wěn)步推進數(shù)據(jù)開放和共享,為大數(shù)據(jù)發(fā)展應用奠定基礎(chǔ),實現(xiàn)數(shù)據(jù)價值的最大挖掘和利用。
使用智能學習組件,對不同類別、級別的數(shù)據(jù)分別進行機器學習,生成學習結(jié)果共安全策略使用。同時,智能學習和可以按照要求進行定時、定量的持續(xù)循環(huán)工作。保證安全策略的檢測內(nèi)容隨時保持最新狀態(tài),和企業(yè)的數(shù)據(jù)資產(chǎn)內(nèi)容保持匹配。
數(shù)據(jù)實施分級管理,能夠進一步明確數(shù)據(jù)保護對象,有助于企業(yè)組織合理分配數(shù)據(jù)保護資源,是建立健全數(shù)據(jù)生命周期保護框架的基礎(chǔ),也是有的放矢實施數(shù)據(jù)安全管理的前提條件。
同時,統(tǒng)一的數(shù)據(jù)分級管理制度,能夠促進數(shù)據(jù)在機構(gòu)間、行業(yè)間的安全流動,有利于數(shù)據(jù)價值的充分釋放。
場景三:基于用戶行為的數(shù)據(jù)安全異常檢測
目前多數(shù)企業(yè)已經(jīng)開始規(guī)劃或開展信息安全管控策略及實施,但在數(shù)據(jù)安全保護層面的措施僅限于傳統(tǒng)網(wǎng)絡(luò)安全、存儲冗余/備份、集中化管理以及桌面安全管理等層面,對于數(shù)據(jù)安全領(lǐng)域關(guān)注度不夠,在核心數(shù)據(jù)資產(chǎn)的使用、傳輸、保管、銷毀的過程中存在較多安全風險,同時也加劇了信息安全治理工作的難度,所面臨的關(guān)鍵問題及風險統(tǒng)計如下:
- 數(shù)據(jù)資產(chǎn)不清,梳理難度大;
- 數(shù)據(jù)共享缺乏統(tǒng)一管理,泄露風險大;
- 數(shù)據(jù)合規(guī)性風險;
- 數(shù)據(jù)安全管理風險。
針對上述關(guān)鍵問題,全息數(shù)據(jù)資產(chǎn)追溯系統(tǒng)提出基于用戶行為的數(shù)據(jù)安全異常檢測技術(shù),把注意力放在特定用戶的數(shù)據(jù)活動上,通過多種統(tǒng)計及機器學習算法建立用戶行為模式,當“黑客”行為與合法用戶身份權(quán)限出現(xiàn)不同時則進行行為判定并預警,從而提早發(fā)現(xiàn)數(shù)據(jù)泄露風險。
長期以來,企業(yè)都在試圖用各種技術(shù)和機制檢測安全威脅,從早期的SOC到SIEM,再到現(xiàn)在大數(shù)據(jù)驅(qū)動的用戶實體行為分析(UEBA),將用戶行為活動與相關(guān)實體信息關(guān)聯(lián)分析,引入機器學習建立各種行為活動基線來檢測異常行為。UEBA是典型的數(shù)據(jù)驅(qū)動型,基于廣泛收集的各種數(shù)據(jù)集,應用機器學習的行為分析和異常檢測。
涉及用戶行為分析需求的典型場景:提供用戶行為的可視化,用戶行為與敏感數(shù)據(jù)風險關(guān)聯(lián)的可見性,以用戶為核心同時關(guān)聯(lián)文件、設(shè)備和應用3個維度進行持續(xù)跟蹤,對異常行為進行持續(xù)檢測,及時發(fā)現(xiàn)潛在內(nèi)部威脅;看清安全狀況,查漏補缺。一旦發(fā)生安全事件,能夠快速定位問題,提供在線分析,提供證據(jù)鏈抓取。