【RSA2018】創(chuàng)新沙盒 | BigID數(shù)據(jù)沙盒產(chǎn)品及技術(shù)解讀
2018RSA大 即將召開,毫無疑問創(chuàng)新沙盒是大會(huì)的熱點(diǎn)。讓我們隨著專家的眼睛,一起來看看RSA 2018創(chuàng)新沙盒TOP10的這些公司。今天是第一篇,《探秘BigID公司Sandbox產(chǎn)品》,分析了數(shù)據(jù)沙盒產(chǎn)品的特性及產(chǎn)品技術(shù)。
一、BigID公司情況
1. 公司情況
BigID公司是一家位于以色列特拉維夫和美國紐約的一家初創(chuàng)高科技公司,成立于2016年。在2016年的融資中該公司原計(jì)劃融資210萬美元,結(jié)果獲得了高達(dá)1610萬美元的首輪融資。在2018年,考慮到公司的解決方案可以幫助企業(yè)應(yīng)對(duì)GDPR法規(guī)的需求,BigID公司開展了1400萬美元的A輪融資。截止2018年3月份,該公司擁有16名員工。
2. 產(chǎn)品情況
BigID公司從官網(wǎng)上看到目前就只有一款平臺(tái)分析類產(chǎn)品。產(chǎn)品宣傳認(rèn)為其可以很好的應(yīng)對(duì)GDPR,PI,PII等歐美合規(guī)要求,幫助企業(yè)更好的確保他們所擁有敏感數(shù)據(jù)的私密性,減少數(shù)據(jù)泄露,強(qiáng)化數(shù)據(jù)的合規(guī)保護(hù)。就滿足GDPR合規(guī)性的方面,產(chǎn)品宣稱具備以下特點(diǎn):
- 數(shù)據(jù)最小化:通過重復(fù)發(fā)現(xiàn)和相關(guān)性確保數(shù)據(jù)最小化
- 許可管理:證明個(gè)人數(shù)據(jù)收集得到了用戶的許可
- 泄露提醒:遵守違反通告窗口
- 數(shù)據(jù)主體權(quán)利:滿足客戶數(shù)據(jù)可攜性支持以及支持遺忘數(shù)據(jù)的權(quán)利
- 數(shù)據(jù)駐留:提供數(shù)據(jù)駐留風(fēng)險(xiǎn)的分析
3. 產(chǎn)品的一些分析界面
圖:信息溯源
圖:數(shù)據(jù)流工具
圖:風(fēng)險(xiǎn)配置
圖:信息掃描結(jié)果
圖:輸出報(bào)告
二、BigID產(chǎn)品沙盒技術(shù)分析
BigID公司的CEO Dimitri Sirota對(duì)外提到“想象我們是數(shù)據(jù)的谷歌,我們對(duì)數(shù)據(jù)進(jìn)行檢索歸類,指出信息是屬于哪個(gè)實(shí)體,數(shù)據(jù)的主體,但是它是虛擬的。我們不拷貝數(shù)據(jù)。它們?nèi)员A粼谒鼈冊(cè)械牡胤健?。筆者和BigID公司的Greg Pavlik進(jìn)行了簡(jiǎn)單的交流,Greg Pavlik也展示和介紹了該公司產(chǎn)品的功能和界面,但對(duì)其技術(shù)細(xì)節(jié)沒有更多的描述。此外,BigID公司官網(wǎng)產(chǎn)品資料披露信息極少,因此結(jié)合該公司高管的發(fā)言和員工的交流介紹與demo展示,筆者初步分析猜測(cè)認(rèn)為該公司產(chǎn)品是采用了一種稱為數(shù)據(jù)沙盒(Data Sandbox)的技術(shù),這個(gè)技術(shù)在大數(shù)據(jù)分析領(lǐng)域也有稱為分析沙盒(Analytic Sandbox)。該沙盒技術(shù)不同于以往我們傳統(tǒng)認(rèn)知在防御入侵領(lǐng)域的沙盒技術(shù)。在防御入侵檢測(cè)領(lǐng)域,Sandbox多為以虛擬方式模擬一個(gè)終端或一個(gè)運(yùn)行環(huán)境,檢測(cè)未知代碼在該虛擬環(huán)境中的運(yùn)行狀況,并根據(jù)運(yùn)行狀況來判斷其是否是懷有惡意。在大數(shù)據(jù)領(lǐng)域,數(shù)據(jù)沙盒技術(shù)(Data Sandbox)是一種大數(shù)據(jù)分析應(yīng)用手段。其原理是基于針對(duì)大數(shù)據(jù)分析的需要,不對(duì)原始數(shù)據(jù)進(jìn)行拷貝和分析,僅搜索原始的結(jié)構(gòu)化或非架構(gòu)化的數(shù)據(jù),形成新的數(shù)據(jù)信息倉庫(data shadow warehouse)。然后根據(jù)事先定義的分析引擎去對(duì)提取的信息進(jìn)行關(guān)聯(lián)分析。數(shù)據(jù)沙盒技術(shù)并不算很新,多年前就已經(jīng)出現(xiàn),并在一些超大型跨國企業(yè)中得到了應(yīng)用。
下面將對(duì)數(shù)據(jù)沙盒的特點(diǎn)和架構(gòu)做一個(gè)簡(jiǎn)要的特點(diǎn)介紹和架構(gòu)分析
1. 數(shù)據(jù)沙盒的特點(diǎn)
- 數(shù)據(jù)沙盒會(huì)采用先進(jìn)的BI(Machine Learning)和AI(Artificial Intelligence)技術(shù)幫助其對(duì)數(shù)據(jù)信息進(jìn)行驗(yàn)證和分析
- 數(shù)據(jù)沙盒本身可以是一個(gè)獨(dú)立的分析引擎憑條,也可以運(yùn)行在Hadoop之上
- 實(shí)踐中,數(shù)據(jù)沙盒多支持各種數(shù)據(jù)庫以及多種數(shù)據(jù)結(jié)構(gòu),包括SQL數(shù)據(jù)庫(如MSSQL,Oracle等)和NoSQL數(shù)據(jù)庫(如MongoDB,Cassandra等)
- 數(shù)據(jù)沙盒允許分析引擎從多種大數(shù)據(jù)倉庫中搜索各類數(shù)據(jù)。這些數(shù)據(jù)倉庫可以是本地的,也可以是云端的。數(shù)據(jù)沙盒將搜索到的數(shù)據(jù)進(jìn)行信息提取并以某種固定格式進(jìn)行存儲(chǔ),最終形成一個(gè)虛擬的數(shù)據(jù)集市(data mart )
- 數(shù)據(jù)沙盒本身內(nèi)置多種分析模型,這些模型多根據(jù)數(shù)據(jù)分析專家的需要(如商業(yè)情報(bào)或隱私保護(hù))來進(jìn)行編制。數(shù)據(jù)沙盒將根據(jù)這些分析模型對(duì)虛擬的data mart進(jìn)行分析和結(jié)果呈現(xiàn)
- 數(shù)據(jù)沙盒的硬件設(shè)施包括大量的并行集中處理單元,高速內(nèi)存,高性能存儲(chǔ)和I/O接口能力。
2. 數(shù)據(jù)沙盒架構(gòu)展示
圖:數(shù)據(jù)沙盒的原理架構(gòu)設(shè)計(jì)
三、結(jié)束語
數(shù)據(jù)沙盒(Data Sandbox)是一種大數(shù)據(jù)分析技術(shù)。根據(jù)得到信息,筆者初步分析判斷BigID公司其Sandbox的技術(shù)核心應(yīng)該是采用了數(shù)據(jù)沙盒的概念和技術(shù)。通過Greg Pavlik的介紹和展示我個(gè)人認(rèn)為該公司產(chǎn)品將數(shù)據(jù)沙盒技術(shù)與GDPR這類合規(guī)要求進(jìn)行結(jié)合,創(chuàng)造出一種新的合規(guī)安全管控產(chǎn)品,從目前情況看該平臺(tái)產(chǎn)品屬于為數(shù)不多的專門針對(duì)數(shù)據(jù)合規(guī)隱私保護(hù)的平臺(tái)產(chǎn)品。而且該平臺(tái)確實(shí)能夠幫助受監(jiān)管的機(jī)構(gòu)在一定程度上有效的管控和保護(hù)隱私數(shù)據(jù)。相信這也是RSA大會(huì)將其列為2018年度RSA大會(huì)的10大Sandbox創(chuàng)新廠商之一的原因。我個(gè)人覺得這類產(chǎn)品的出現(xiàn)可為國內(nèi)安全廠家在產(chǎn)品研發(fā)上提供一種新的思路,相信通過本次RSA大會(huì)的宣傳,國內(nèi)國外的合規(guī)管控產(chǎn)品將出現(xiàn)一些新的氣象。
【本文是51CTO專欄作者“綠盟科技博客”的原創(chuàng)稿件,轉(zhuǎn)載請(qǐng)通過51CTO聯(lián)系原作者獲取授權(quán)】