企業(yè)如何提高數(shù)據(jù)庫(kù)安全?盤點(diǎn)這11種工具和技術(shù)
數(shù)據(jù)庫(kù)承載著海量個(gè)人信息,甚至包含一些敏感信息。如何管理這些數(shù)據(jù),對(duì)于不少企業(yè)來說,是一件棘手的事情。
現(xiàn)在,數(shù)據(jù)庫(kù)開發(fā)人員可以使用成熟的工具和技術(shù)保護(hù)數(shù)據(jù)信息。如何保護(hù)?這個(gè)還要涉及對(duì)數(shù)學(xué)的巧妙應(yīng)用。比如,一些最簡(jiǎn)單的系統(tǒng)看起來只是現(xiàn)代版本的密碼,本質(zhì)上是經(jīng)典解碼輪的數(shù)字版本。隨著數(shù)學(xué)的發(fā)展,數(shù)字的應(yīng)用變得更加靈活,密碼開始復(fù)雜起來。實(shí)驗(yàn)室里試驗(yàn)了幾十年的那些技術(shù)想法最終得到了研發(fā)和應(yīng)用,成為了現(xiàn)實(shí)。
這些算法正在成為鞏固業(yè)務(wù)關(guān)系和確保準(zhǔn)確真實(shí)工作流程的基礎(chǔ)。這些方法使公司可以更輕松地向客戶提供個(gè)性化服務(wù),同時(shí)保護(hù)他們的隱私。與此同時(shí),這些方法能夠在不妨礙服務(wù)交付的情況下更好地遵守管理數(shù)據(jù)流的法規(guī)。
以下是讓數(shù)據(jù)庫(kù)變得更安全的11 種工具和技術(shù)。
一、基本加密
有時(shí)候,最簡(jiǎn)單的方法往往也足夠?qū)嵱谩,F(xiàn)代加密算法用一把鑰匙加密數(shù)據(jù),因此只有擁有鑰匙的人才能讀取數(shù)據(jù)。許多數(shù)據(jù)庫(kù)可以使用AES等標(biāo)準(zhǔn)加密數(shù)據(jù)。如果這些硬件丟失,這能起到很好的數(shù)據(jù)保護(hù)作用。因?yàn)槿绻麤]有正確的加密密鑰,數(shù)據(jù)仍然安全。
然而,這仍然存在局限性。如果攻擊者能夠入侵計(jì)算機(jī),對(duì)稱加密算法對(duì)運(yùn)行中的計(jì)算機(jī)的保護(hù)程度是有限的。攻擊者可以找到允許數(shù)據(jù)庫(kù)處理合法操作的相同密鑰。許多數(shù)據(jù)庫(kù)提供了對(duì)“靜止”信息進(jìn)行加密的選項(xiàng)。例如,Oracle將其選項(xiàng)稱為“透明數(shù)據(jù)加密”,這強(qiáng)調(diào)了開發(fā)人員則無需采取的其他必要的安全措施。
二、差分隱私
這種技術(shù)以不同的方式部署數(shù)學(xué)。它沒有以加密形式鎖定信息,而是增加了特定的噪聲,因此很難找到具體的特定的數(shù)據(jù)個(gè)體。如果噪聲數(shù)值正常,那么便不會(huì)影響整體統(tǒng)計(jì)數(shù)據(jù),如平均值。這意味著,以年齡為例,從數(shù)據(jù)集中的年齡隨機(jī)增加或減少幾年,那么平均年齡將保持不變,因此難以找到年齡變動(dòng)的具體個(gè)人,從而保護(hù)了用戶隱私。
當(dāng)然,差分隱私的使用依場(chǎng)景而定。如果合作伙伴不受信任,則可以使用差分隱私背后的數(shù)據(jù)集,通常僅為數(shù)據(jù)平均值和數(shù)據(jù)集的大小。在某種程度上來說,許多算法添加噪聲做得很好,因?yàn)樗麄儾粫?huì)扭曲許多聚合的統(tǒng)計(jì)數(shù)據(jù)。目前,專家仍熱衷于研究機(jī)器學(xué)習(xí)算法處理失真位,這是一個(gè)活躍的研究領(lǐng)域。
微軟和谷歌提供將算法與數(shù)據(jù)存儲(chǔ)的機(jī)器學(xué)習(xí)算法集成工具。例如,谷歌的Privacy-On-Beam將噪聲添加機(jī)制與Apache Beam管道處理相結(jié)合。
三、哈希函數(shù)
將大文件歸結(jié)為較小的數(shù)字,從而使其幾乎無法逆轉(zhuǎn),這些計(jì)算有時(shí)被稱為“消息驗(yàn)證代碼”或“單向函數(shù)”。給定一個(gè)特定的結(jié)果或代碼,找到將生成該特定代碼的文件將花費(fèi)太長(zhǎng)時(shí)間。
哈希函數(shù)是區(qū)塊鏈的重要組成部分,以一種可跟蹤和識(shí)別篡改的方式將它們應(yīng)用于數(shù)據(jù)的更新中。這可以防止加密貨幣交易中的欺詐行為,并且許多人正在將這些技術(shù)應(yīng)用于需要確保數(shù)據(jù)一致的其他數(shù)據(jù)庫(kù)。哈希函數(shù)可以幫助企業(yè)的數(shù)據(jù)合規(guī)。
美國(guó)國(guó)家標(biāo)準(zhǔn)與技術(shù)研究院 (NIST)的安全散列算法 (SHA)是廣泛使用的標(biāo)準(zhǔn)集合。一些早期版本(如 SHA-0 和 SHA-1)具有明顯的弱點(diǎn),但較新的版本(如 SHA-2 和 SHA-3)則被認(rèn)為比較安全。
四、數(shù)字簽名
像RSA或DSA這樣的數(shù)字簽名算法是更為復(fù)雜的計(jì)算,它將散列函數(shù)的篡改檢測(cè)特性與帶有認(rèn)證信息的特定個(gè)人或機(jī)構(gòu)相結(jié)合。他們依賴一個(gè)只有責(zé)任方知道的秘密密鑰。例如,加密貨幣將財(cái)富的所有權(quán)與知道正確密鑰的人聯(lián)系起來,跟蹤個(gè)人責(zé)任的數(shù)據(jù)庫(kù)可以包括驗(yàn)證特定交易的數(shù)字簽名。
五、SNARK
簡(jiǎn)明的非交互式知識(shí)論證 (SNARK) 是數(shù)字簽名更為復(fù)雜的一個(gè)版本,可以為復(fù)雜的個(gè)人信息證明,而不會(huì)泄露信息本身。這種技巧依賴于更復(fù)雜的數(shù)學(xué),有時(shí)被稱為“零知識(shí)證明”(ZKP)。
使用如SNARK和其他類似證明的數(shù)據(jù)庫(kù)可以保護(hù)用戶的隱私,同時(shí)確保他們合規(guī)。例如,一個(gè)非常簡(jiǎn)單的例子可能是數(shù)字駕駛執(zhí)照,它可以證明一個(gè)人的年齡能夠喝酒,但是不會(huì)透露他們的出生日期。一些人正在研究將該技術(shù)應(yīng)用于疫苗護(hù)照。
SNARK和其他非交互式證明是一種熱門的研究領(lǐng)域,這也基于各種編程語言的數(shù)十種算法。
六、同態(tài)加密
處理使用傳統(tǒng)加密算法鎖定的數(shù)據(jù)的唯一方法是對(duì)其進(jìn)行解密,這個(gè)過程可以將其暴露給任何有權(quán)訪問計(jì)算機(jī)進(jìn)行工作的人。同態(tài)加密算法使對(duì)加密信息進(jìn)行計(jì)算而無需對(duì)其進(jìn)行解密成為可能。最簡(jiǎn)單的算法允許進(jìn)行一次算術(shù)運(yùn)算,例如將兩個(gè)加密數(shù)字相加。更復(fù)雜的算法可以進(jìn)行任意計(jì)算,但速度通常要慢得多。為特定問題尋找最有效的方法也是一個(gè)熱門的研究領(lǐng)域。
作為該領(lǐng)域研究的先驅(qū)之一,IBM發(fā)布了一個(gè)工具包,用于將其同態(tài)加密與適用于iOS和MacOS 的應(yīng)用程序集成。
七、聯(lián)邦處理
一些開發(fā)人員將他們的數(shù)據(jù)集拆分成很小的部分,然后將它們分發(fā)到許多獨(dú)立的計(jì)算機(jī)中。有時(shí)這些位置會(huì)被打亂,因此無法預(yù)測(cè)哪臺(tái)計(jì)算機(jī)將保存哪條記錄。該解決方案主要用于軟件包,這些軟件包可以通過并行運(yùn)行搜索或分析算法來加速所謂的大數(shù)據(jù)工作。最初的目的是速度,即快速保護(hù)數(shù)據(jù)的一種方式,但這也可能導(dǎo)致攻擊彈性的擴(kuò)大。
八、全分布式數(shù)據(jù)庫(kù)
如果將一個(gè)數(shù)據(jù)集拆分成幾塊可以保護(hù)隱私,為什么不是無數(shù)塊呢?比如常見的一種方式就是將數(shù)據(jù)直接存儲(chǔ)在創(chuàng)建和使用的位置。用戶的智能手機(jī)通常具有大量額外的計(jì)算力和存儲(chǔ)空間。如果不需要集中分析和處理,那么避免將其傳送到云服務(wù)器處理速度會(huì)更快、更具成本效益。
例如,許多瀏覽器支持復(fù)雜數(shù)據(jù)結(jié)構(gòu)的本地存儲(chǔ)。W3C標(biāo)準(zhǔn)包括用于具有鍵和值的文檔樣式模型的本地存儲(chǔ)以及用于更多關(guān)系模型的索引版本。
九、合成數(shù)據(jù)
一些研究人員正在通過隨機(jī)生成新值來創(chuàng)建純合成的數(shù)據(jù)集,但其方式遵循相同的模式并且在統(tǒng)計(jì)上基本相同。例如,一個(gè)名為RTI的研究智囊團(tuán)創(chuàng)建了2010年美國(guó)人口普查數(shù)據(jù)的一個(gè)副本,包含隨機(jī)住址的隨機(jī)人群。這些人完全是虛構(gòu)的,但他們的家庭住址和個(gè)人信息被選擇為具有與真實(shí)值相同的基本統(tǒng)計(jì)資料。在許多情況下,研究人員可以測(cè)試算法生成與處理真實(shí)數(shù)據(jù)一樣準(zhǔn)確的數(shù)據(jù)保護(hù)方案。
十、中介和代理人
一些研究人員正在開發(fā)工具來限制數(shù)據(jù)收集,并在存儲(chǔ)數(shù)據(jù)之前對(duì)數(shù)據(jù)進(jìn)行預(yù)處理。例如,Mozilla的Rally會(huì)跟蹤想要研究互聯(lián)網(wǎng)信息流的研究人員的瀏覽習(xí)慣,它會(huì)在調(diào)查期間安裝一個(gè)特殊的插件,然后在最后將其刪除。該工具將人群的關(guān)系形式化并強(qiáng)制執(zhí)行收集和聚合的規(guī)則。
十一、無數(shù)據(jù)
無狀態(tài)計(jì)算是大部分網(wǎng)絡(luò)的基礎(chǔ),許多高效驅(qū)動(dòng)器能夠以盡可能少的記錄保存方式重新構(gòu)建工作。在某些極端情況下,企業(yè)遵循了數(shù)據(jù)合規(guī),且用戶不太接受個(gè)性化服務(wù)時(shí),刪除數(shù)據(jù)庫(kù)可以最大程度地保護(hù)用戶隱私。