探索云上數(shù)據(jù)安全邊界,亞馬遜云科技助力企業(yè)釋放數(shù)據(jù)價值
原創(chuàng)或許你總是可以聽到別人說“我們已經(jīng)進入了數(shù)字時代”。誠然,各行各業(yè)都在持續(xù)不斷地進行數(shù)字化轉(zhuǎn)型和演進,國家也在推進數(shù)字化的建設(shè)發(fā)展,我們的工作和生活已經(jīng)越來越離不開數(shù)字世界。而在數(shù)字世界中,數(shù)據(jù)是最關(guān)鍵的第一要素。
我們每天產(chǎn)生和使用的數(shù)據(jù)量龐大到難以計算。但是這也意味著數(shù)據(jù)的產(chǎn)生、傳輸和存儲變得異常頻繁,安全風(fēng)險也隨之增加。不論是政府還是企業(yè)都面臨著巨大的數(shù)據(jù)安全風(fēng)險,一旦數(shù)據(jù)泄露都會造成無法挽回的局面。據(jù)報道,2022 年全球數(shù)據(jù)泄露事件總計超過兩萬件,與 2021 年同期相比,2022 年的數(shù)據(jù)泄露事件增長了 14%。在數(shù)字經(jīng)濟時代,如何在確保數(shù)據(jù)安全的前提下有效發(fā)揮數(shù)據(jù)資產(chǎn)的商業(yè)價值,成為企業(yè)亟需解決的問題。
近日,亞馬遜云科技召開了以“安全無憂 釋放數(shù)據(jù)價值”為主題的數(shù)據(jù)分析與安全媒體溝通會。在會上,亞馬遜云科技大中華區(qū)產(chǎn)品部總經(jīng)理陳曉建介紹了圍繞業(yè)務(wù)數(shù)據(jù)的可識別、可見、可協(xié)作和安全數(shù)據(jù)的可操作四大場景,亞馬遜云科技提供創(chuàng)新服務(wù)和解決方案,助力企業(yè)進一步釋放數(shù)據(jù)要素價值,實現(xiàn)創(chuàng)新增長。
識別敏感數(shù)據(jù),輕松應(yīng)對數(shù)據(jù)合規(guī)挑戰(zhàn)
為了保護用戶的個人隱私,全球各個國家針對數(shù)據(jù)隱私和安全方面的法律法規(guī)越來越多,例如歐盟發(fā)布了《通用數(shù)據(jù)保護條例》(GDPR),美國發(fā)布了《美國數(shù)據(jù)隱私和保護法案》(ADPPA),中國發(fā)布了《個人信息保護法》《數(shù)據(jù)安全法》《數(shù)據(jù)出境安全評估辦法》等等。這些法律法規(guī)無一例外都對個人數(shù)據(jù)和敏感數(shù)據(jù)的使用提出了具體的要求。
面對這些新規(guī),企業(yè)該如何評估什么是個人數(shù)據(jù)和個人敏感數(shù)據(jù)?如何在保證數(shù)據(jù)安全的前提下打破數(shù)據(jù)孤島?如何實現(xiàn)統(tǒng)一的數(shù)據(jù)合規(guī)應(yīng)用?想要解決這些挑戰(zhàn),則需要人、流程和工具相互配合。
為用戶的業(yè)務(wù)和計算負載提供最合適的工具一直是亞馬遜云科技的方向和目標,因此亞馬遜云科技推出了“敏感數(shù)據(jù)保護”解決方案(Sensitive Data Protection)。這是一個開源的數(shù)據(jù)安全及數(shù)據(jù)隱私云原生解決方案,企業(yè)可以在自己賬號部署使用。“敏感數(shù)據(jù)保護”解決方案具備如下的能力:
- 中心化及可視化管理能力。“敏感數(shù)據(jù)保護”解決方案可以發(fā)現(xiàn)多個賬號下的數(shù)據(jù)資產(chǎn)并生成數(shù)據(jù)目錄,進而發(fā)現(xiàn)不同業(yè)務(wù)系統(tǒng)云賬號之間的邏輯關(guān)聯(lián),打破數(shù)據(jù)孤島,實現(xiàn)中心化管理。企業(yè)還可通過網(wǎng)頁應(yīng)用程序?qū)γ舾袛?shù)據(jù)資產(chǎn)進行可視化管理。
- 跨產(chǎn)品自動識別能力。當使用亞馬遜云科技多個產(chǎn)品時,“敏感數(shù)據(jù)保護”解決方案可以跨產(chǎn)品識別不同產(chǎn)品所沉淀的業(yè)務(wù)數(shù)據(jù),自動掃描結(jié)構(gòu)化存儲Amazon RDS、對象存儲Amazon S3,以及其他數(shù)據(jù)存儲產(chǎn)品。
- 多種方式識別敏感數(shù)據(jù)。在解決方案中,企業(yè)可以通過創(chuàng)建數(shù)據(jù)目錄、使用內(nèi)置或定制數(shù)據(jù)識別規(guī)則判斷敏感數(shù)據(jù)類型。除此之外,還可以通過機器學(xué)習(xí)和模式匹配的方式自動識別業(yè)務(wù)所產(chǎn)生的敏感數(shù)據(jù)。
“敏感數(shù)據(jù)保護”解決方案主要幫助企業(yè)發(fā)現(xiàn)分散的數(shù)據(jù)以及自動根據(jù)法律法規(guī)判斷數(shù)據(jù)是否敏感。通過這一解決方案,企業(yè)可以加速實現(xiàn)業(yè)務(wù)數(shù)據(jù)合規(guī),為下一步釋放數(shù)據(jù)價值鋪平道路。
數(shù)據(jù)解鎖可見,打破內(nèi)部孤島共治理
雖然數(shù)據(jù)的安全和合規(guī)非常重要,但是如果為了安全和合規(guī)而將數(shù)據(jù)完全封閉,那么對于企業(yè)的不同部門來說,則會浪費時間獲取其他部門已有的數(shù)據(jù),從而導(dǎo)致效率低下,也會造成數(shù)據(jù)孤島。因此實現(xiàn)企業(yè)內(nèi)部的數(shù)據(jù)可見并共享是提高效率的關(guān)鍵,但是在實現(xiàn)的過程中存在諸多挑戰(zhàn)。
首當其沖的問題是命名數(shù)據(jù)方式不同。同一個數(shù)據(jù)在不同的業(yè)務(wù)部門和流程環(huán)節(jié)可能有不同的名稱,因此在溝通時就會出現(xiàn)問題。第二個問題是無法獲取原始數(shù)據(jù)。持有數(shù)據(jù)的部門可能會基于各種原因的考慮,不愿意把原始數(shù)據(jù)分享給其他部門使用。第三個問題是當數(shù)據(jù)開放后,數(shù)據(jù)的使用和傳播難于管理。
為了讓企業(yè)各個部門看見和解鎖數(shù)據(jù),亞馬遜云科技基于以上痛點問題,在去年推出了一項全新的數(shù)據(jù)管理服務(wù)——Amazon DataZone。
Amazon DataZone 可以讓企業(yè)更快、更輕松地對存儲在亞馬遜云科技、客戶本地和第三方來源的數(shù)據(jù)進行編目、發(fā)現(xiàn)、共享和治理。借助Amazon DataZone,企業(yè)可以使用精細的控制工具管理和治理數(shù)據(jù)訪問權(quán)限。更重要的是,Amazon DataZone 使數(shù)據(jù)開發(fā)者、數(shù)據(jù)科學(xué)家、分析師和業(yè)務(wù)用戶輕松訪問整個組織的數(shù)據(jù),從而更好地發(fā)現(xiàn)和使用數(shù)據(jù)。
與外部共協(xié)作,為數(shù)據(jù)注入創(chuàng)新活力
數(shù)據(jù)在企業(yè)的內(nèi)部流通打破了內(nèi)部的數(shù)據(jù)孤島。不過有些企業(yè)還需要和第三方伙伴一起共享數(shù)據(jù)或需要獲取公共的數(shù)據(jù)集。多方的數(shù)據(jù)協(xié)作將為行業(yè)創(chuàng)新注入活力,企業(yè)之間需要產(chǎn)業(yè)上下游數(shù)據(jù)協(xié)作來快速創(chuàng)新。
但是企業(yè)不可能在犧牲數(shù)據(jù)安全的情況下讓數(shù)據(jù)流通,數(shù)據(jù)的協(xié)作與隱私安全一直是持久的矛盾。不過,如果企業(yè)僅僅提供數(shù)據(jù)的使用權(quán),但不提供原始數(shù)據(jù),讓數(shù)據(jù)“可用不可見”,便能保證數(shù)據(jù)的安全。
針對多方協(xié)作的場景,亞馬遜云科技推出了Amazon Clean Rooms ,幫助企業(yè)在不需要移動或者暴露原始數(shù)據(jù)的情況下實現(xiàn)雙方數(shù)據(jù)的匹配、分析和協(xié)作,安全地進行數(shù)據(jù)分析協(xié)作。
Amazon Clean Rooms 簡單易用,僅僅幾分鐘便能創(chuàng)建一個Amazon Clean Room。對于數(shù)據(jù)提供方而言,不僅可以預(yù)加密數(shù)據(jù)對數(shù)據(jù)進行保護,還可以直接從個人的Amazon S3 提供數(shù)據(jù);而數(shù)據(jù)消費方可以通過設(shè)定不同的代碼對整個開放的數(shù)據(jù)進行計算,最后獲得一個結(jié)果,而非詳細的數(shù)據(jù)。整個過程真正實現(xiàn)了只對數(shù)據(jù)進行查詢和分析,沒有移動數(shù)據(jù)。
更值得一提的是,Amazon Clean Rooms提供密態(tài)計算的環(huán)境,能夠以加密的形態(tài)完成數(shù)據(jù)分析操作,并將分析結(jié)果解密后返回,從而在最大程度保障數(shù)據(jù)安全的同時充分開發(fā)數(shù)據(jù)價值。
除了多方協(xié)作,企業(yè)有時也需要使用公開數(shù)據(jù)集,尤其是在生成式AI的時代,企業(yè)更需要第三方的數(shù)據(jù)來協(xié)作創(chuàng)新或訓(xùn)練模型。然而獲取第三方數(shù)據(jù)并非易事,無論是尋找合適的數(shù)據(jù)集還是物理拷貝,這對企業(yè)來說都是工作量巨大。
為了讓企業(yè)更加容易獲得市場上公開的數(shù)據(jù)集,亞馬遜云科技推出了Amazon Data Exchange ,能夠讓企業(yè)輕松地在云上尋找、訂閱和使用超過 3500 種的第三方數(shù)據(jù),并且這些數(shù)據(jù)覆蓋金融、天氣、地理、健康醫(yī)療等多個行業(yè)和領(lǐng)域。
Amazon Data Exchange 支持Amazon S3 注入、查詢表接口(query tables)以及API 調(diào)用等多種訪問方式,讓獲取公開數(shù)據(jù)集變得簡便容易。例如,在模型訓(xùn)練時,只需將數(shù)據(jù)集注入到Amazon S3 數(shù)據(jù)湖,便可以使用數(shù)據(jù)分析工具進行數(shù)據(jù)處理,進而開始模型訓(xùn)練。
在安全方面同樣有所保障,所有數(shù)據(jù)在存儲和傳輸時都會被加密。Amazon Data Exchange 也整合了亞馬遜云科技的身份和訪問控制管理系統(tǒng)(IAM),保證企業(yè)能夠設(shè)定權(quán)限并監(jiān)控實際的訪問過程。
操作安全數(shù)據(jù),統(tǒng)一管理分析安全日志
在Gartner 發(fā)布的2022 年網(wǎng)絡(luò)安全重點趨勢中,整合安全供應(yīng)商排到了第4 位,說明企業(yè)非常重視安全問題,并會使用多個安全供應(yīng)商全方位保障網(wǎng)絡(luò)安全。但是,企業(yè)擁有不同供應(yīng)商的安全系統(tǒng),安全日志格式也不同,對其安全管理帶來了不小挑戰(zhàn),所以企業(yè)希望整合不同供應(yīng)商。然而在短時間內(nèi)整合安全供應(yīng)商是有挑戰(zhàn)和難度的,企業(yè)需要高效的工具來解決這一問題。
Amazon Security Lake 是亞馬遜云科技構(gòu)建的安全數(shù)據(jù)湖,可以自動搜集多云、本地和第三方的安全數(shù)據(jù)到數(shù)據(jù)湖中,并存儲亞馬遜云科技的安全產(chǎn)品(如 Amazon GuardDuty,Amazon SecurityHub)以及第三方乃至線下安全設(shè)備的安全日志,統(tǒng)一管理,并用這些日志分析安全事件。
Amazon Security Lake 第一個解決的就是不同供應(yīng)商的安全日志格式不統(tǒng)一的問題。亞馬遜云科技在 2022 年聯(lián)合 15 家安全行業(yè)的頭部企業(yè),推出 OCSF 開源協(xié)議框架,統(tǒng)一了安全日志格式。有了統(tǒng)一的安全日志格式后,企業(yè)就可以有效地管理并使用安全日志,并在出現(xiàn)安全風(fēng)險后第一時間追溯問題的源頭。
除此之外,Amazon Security Lake 使用 Amazon S3 集中存儲,充分利用 Amazon S3的存儲性能將日志分層管理,提高性價比。
在安全方面,Amazon Security Lake 集成亞馬遜云科技的加密服務(wù)Amazon KMS,實現(xiàn)自動加密管理。
如今我們已經(jīng)邁入了數(shù)據(jù)爆炸的時代。雖然數(shù)據(jù)的價值被越來越多的企業(yè)認可,但仍然面臨很多安全方面的挑戰(zhàn)。只有真正地確保數(shù)據(jù)安全,才能最大程度地釋放數(shù)據(jù)背后的價值。亞馬遜云科技借助云原生的安全特性和強大的數(shù)據(jù)分析工具助力企業(yè)上云,保障數(shù)據(jù)的安全和合規(guī),實現(xiàn)數(shù)據(jù)協(xié)同從而為企業(yè)保駕護航。亞馬遜云科技秉承不斷進取、開拓創(chuàng)新的思路與大家共創(chuàng)未來!