大數(shù)據(jù)方向的安全技術(shù)研究
近年來,隨著大數(shù)據(jù)應(yīng)用的爆發(fā)性增長(zhǎng),大數(shù)據(jù)衍生出獨(dú)特架構(gòu),并推動(dòng)存儲(chǔ)、網(wǎng)絡(luò)及計(jì)算機(jī)技術(shù)的發(fā)展,同時(shí)也引發(fā)了新的安全問題。國(guó)際社會(huì)已經(jīng)將大數(shù)據(jù)安全列入國(guó)家信息網(wǎng)絡(luò)安全戰(zhàn)略,國(guó)內(nèi)學(xué)術(shù)界、信息安全界、產(chǎn)業(yè)界也正逐步關(guān)注大數(shù)據(jù)的發(fā)展。
一、大數(shù)據(jù)相關(guān)概念
1.1 研究背景及意義
大數(shù)據(jù)是繼云計(jì)算、物聯(lián)網(wǎng)之后信息產(chǎn)業(yè)當(dāng)前科技創(chuàng)新、產(chǎn)業(yè)政策及國(guó)家安全領(lǐng)域的又次知識(shí)新增長(zhǎng)點(diǎn)。在大數(shù)據(jù)的背景下信息安全面臨著很多的挑戰(zhàn),特別是現(xiàn)階段已有的信息安全手段已經(jīng)不能滿足大數(shù)據(jù)時(shí)代的信息安全的實(shí)際要求,因此研究大數(shù)據(jù)時(shí)代所面臨的信息安全問題具有重要意義大數(shù)據(jù)的研究與應(yīng)用也引起了各國(guó)政府部門的重視,成為重要的戰(zhàn)略布局方向??v觀國(guó)際形勢(shì),各國(guó)陸續(xù)出臺(tái)大數(shù)據(jù)相關(guān)的政策及戰(zhàn)略方案。2012年,美國(guó)奧巴馬政府宣布將投資2億美元用于啟動(dòng)“大數(shù)據(jù)研發(fā)倡議( Big Data Research and Development Initiative),旨在從海量繁雜的數(shù)據(jù)中萃取有用的信息。大數(shù)據(jù)下信息安全的事件所涉及的內(nèi)容日益增多,受到的危險(xiǎn)越來越嚴(yán)重的。信息安全問題需要經(jīng)過多方面、多部門共同努力進(jìn)行解決。
1.2 大數(shù)據(jù)概念
所謂大數(shù)據(jù),即海量數(shù)據(jù),具有信息量大、信息主體多元、更新速度快和價(jià)值密度低等特點(diǎn),通常是指大量非結(jié)構(gòu)化或半結(jié)構(gòu)化的數(shù)據(jù)集。其實(shí)早在幾年前,數(shù)據(jù)的海量增長(zhǎng)就引起了人們的關(guān)注,海量數(shù)據(jù)的發(fā)生、使用、儲(chǔ)存伴隨著云計(jì)算的發(fā)展等都成為了現(xiàn)實(shí),“大數(shù)據(jù)”已經(jīng)走入了我們的生活。最早將大數(shù)據(jù)用于IT環(huán)境的是知名咨詢公司麥肯錫,麥肯錫在研究報(bào)告中指出:如果云計(jì)算為數(shù)據(jù)資產(chǎn)提供了保管、訪問的場(chǎng)所和渠道,那么如何盤活數(shù)據(jù)資產(chǎn)使其為國(guó)家治理、企業(yè)決策乃至個(gè)人生活服務(wù),則是大數(shù)據(jù)的核心議題,也是云計(jì)算內(nèi)在的靈魂和必然的升級(jí)方向。
從信息安全角看,大數(shù)據(jù)是指規(guī)模和格式前所未有而又相互關(guān)聯(lián)的大量數(shù)據(jù),搜集自企業(yè)的各個(gè)部分,技術(shù)人員可以對(duì)它們進(jìn)行高速分析。
就像電影《黑客帝國(guó)》中的感知機(jī)器人或者《終結(jié)者》電影中的天網(wǎng)一樣,現(xiàn)在的大數(shù)據(jù)環(huán)境由大規(guī)模并行處理數(shù)據(jù)庫(kù)產(chǎn)品(不過所幸的是,它們沒有自我感知能力)組成,這些產(chǎn)品通過處理PB級(jí)(1015)到ZB級(jí)(1021)看似不同的數(shù)據(jù)來創(chuàng)建趨勢(shì)和數(shù)據(jù)映射。通過建立這種宏觀層面的信息,大數(shù)據(jù)可以讓企業(yè)了解到他們的產(chǎn)品是如何以前所未有的經(jīng)濟(jì)理解水平在運(yùn)行。也就是說,通過以新方式來結(jié)合和分析海量數(shù)據(jù),我們可以實(shí)現(xiàn)新的業(yè)務(wù)洞察力.
1.3 大數(shù)據(jù)特征
大數(shù)據(jù)的4V+1C特征:
- 1).Volume,數(shù)據(jù)量大,據(jù)國(guó)際知名數(shù)據(jù)公司IDC提供的數(shù)據(jù),全球數(shù)據(jù)量大約每?jī)赡攴?,人類近兩年產(chǎn)生的數(shù)據(jù)量相當(dāng)于之前產(chǎn)生的全部。
- 2).Variety,數(shù)據(jù)類型多,數(shù)據(jù)可分為結(jié)構(gòu)化數(shù)據(jù),半結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù),相較便于存儲(chǔ)的文本為主的結(jié)構(gòu)化數(shù)據(jù),日志,音頻,視頻,圖片等非結(jié)構(gòu)化數(shù)據(jù),對(duì)數(shù)據(jù)處理能力提出了更高要求。
- 3).Value,價(jià)值密度低,價(jià)值密度的高低與數(shù)據(jù)數(shù)量成反比。例如在連續(xù)的一小時(shí)監(jiān)控過程中,可能有用的數(shù)據(jù)只有一秒。如何通過強(qiáng)大的計(jì)算機(jī)算法更迅速的完成對(duì)有用數(shù)據(jù)的提取,是大數(shù)據(jù)背景下亟待解決的問題。
- 4)Velocuty,處理速度快,這是大數(shù)據(jù)相較于傳統(tǒng)數(shù)據(jù)挖倔最顯著的特征,IDC的“數(shù)字宇宙”報(bào)告預(yù)計(jì)到2020年,全球以電子形式存儲(chǔ)的數(shù)據(jù)數(shù)量將達(dá)到35.2ZB,在如此海量的數(shù)處理效率將成為衡量技術(shù)水平的關(guān)鍵。
- 5)Complexity,復(fù)雜性加大,更提升了處理分析大數(shù)據(jù)的難度。
二、大數(shù)據(jù)安全問題
2.1 大數(shù)據(jù)時(shí)代面臨的挑戰(zhàn)
當(dāng)前互聯(lián)網(wǎng)改變著世界,信息滲透到社會(huì)生活的各個(gè)角落,與各個(gè)領(lǐng)域密切結(jié)合。同時(shí)也給國(guó)家信息安全和個(gè)人信息安全帶來了嚴(yán)峻的挑戰(zhàn)。隨著數(shù)據(jù)量的增大和數(shù)據(jù)的集中,對(duì)海量數(shù)據(jù)進(jìn)行安全防護(hù)變得愈加困難,網(wǎng)絡(luò)空間中大數(shù)據(jù)大信息的泄露風(fēng)險(xiǎn)來源涵蓋范圍非常廣,數(shù)據(jù)的大量匯集、數(shù)據(jù)的集中存儲(chǔ)不可避免的增加了用戶數(shù)據(jù)泄露風(fēng)險(xiǎn)。這些數(shù)據(jù)成為維護(hù)公共安全的重要工作。另外,對(duì)敏感數(shù)據(jù)的所有權(quán)和使用權(quán)沒有明確的界定,大數(shù)據(jù)的分析對(duì)涉及的個(gè)體隱私問題很多都未考慮。再有,對(duì)國(guó)外大數(shù)據(jù)分析技術(shù)與平臺(tái)的過分依賴,使得別國(guó)通過獲取的情報(bào)而摸清國(guó)家經(jīng)濟(jì)和社會(huì)脈搏,威脅到了國(guó)家安全,加大了信息泄露的風(fēng)險(xiǎn)。
大數(shù)據(jù)安全面臨的種種威脅如下:
(一)從基礎(chǔ)技術(shù)角度看,大數(shù)據(jù)依托的基礎(chǔ)技術(shù)—NoSQL(非關(guān)系型數(shù)據(jù)庫(kù))與當(dāng)前廣泛應(yīng)用的SQL(關(guān)系型數(shù)據(jù)庫(kù))技術(shù)不同,沒有經(jīng)過長(zhǎng)期改進(jìn)和完善,在維護(hù)數(shù)據(jù)安全方面也未設(shè)置嚴(yán)格的訪問控制和隱私管理。NoSQL技術(shù)還因大數(shù)據(jù)中數(shù)據(jù)來源和承載方式的多樣性使得企業(yè)將很難定位和保護(hù)其中的機(jī)密信息。這是NoSQL內(nèi)在安全機(jī)制的不完善,即缺乏保密性和完善性特質(zhì)。另一方面, NoSQL對(duì)來自不同系統(tǒng),不同應(yīng)用程序及不同活動(dòng)的數(shù)據(jù)進(jìn)行關(guān)聯(lián),也加大了隱私泄露的風(fēng)險(xiǎn)。此外, NoSQL允許不斷對(duì)數(shù)據(jù)記錄添加屬性,這也對(duì)數(shù)據(jù)庫(kù)管理員的安全性預(yù)見能力提出了更高的要求。數(shù)據(jù)的大量匯集,無(wú)形中增加了黑客的“收益率”降低了進(jìn)攻成本,使得一次成功的攻擊能獲取更多的有價(jià)值的數(shù)據(jù)。從近年互聯(lián)網(wǎng)公司發(fā)生的某些用戶信息泄露案不難發(fā)現(xiàn),被泄露的數(shù)據(jù)量都非常的龐大。
(二)大數(shù)據(jù)時(shí)代,智能終端的數(shù)據(jù)安全問題顯得越發(fā)關(guān)鍵。中國(guó)已經(jīng)成為全球最大智能終端市場(chǎng)。隨身攜帶的終端在占用人們大部分時(shí)間的同時(shí),也存儲(chǔ)了大量的個(gè)人信息。人們對(duì)于“大數(shù)據(jù)并不安全”的擔(dān)憂也不無(wú)道理。因此智能終端數(shù)據(jù)的安全就提上了議事日程。智能家居的產(chǎn)品化,假如人們所使用的智能終端如手機(jī)可以控制家里的所有智能終端,一旦被病毒侵犯,那么全家的智能終端都成為了被攻擊的目標(biāo),那后果就不堪設(shè)想。
(三)與任何虛擬化技術(shù)一樣,數(shù)據(jù)虛擬化是允許用戶訪問、管理和優(yōu)化異構(gòu)基礎(chǔ)架構(gòu)的良方。數(shù)據(jù)被人們視為財(cái)富的同時(shí),大數(shù)據(jù)就成為了寶藏,數(shù)據(jù)虛擬化技術(shù)就是挖掘數(shù)據(jù)和利用寶藏的最好武器。最有代表性的應(yīng)用就是數(shù)據(jù)的虛擬化存儲(chǔ)技術(shù)。于用戶而言,虛擬化的存儲(chǔ)資源就像是一個(gè)巨大的磁石,用戶不用關(guān)心具體的存儲(chǔ)設(shè)備,也不必考慮數(shù)據(jù)經(jīng)過的路徑在應(yīng)用虛擬化存儲(chǔ)時(shí),面對(duì)異構(gòu)存儲(chǔ)設(shè)備的特點(diǎn),如何統(tǒng)一監(jiān)管、虛擬化后不同密級(jí)信息混合存儲(chǔ)的位置,造成的越權(quán)訪問、數(shù)據(jù)泄密等成為大的難題。
三、大數(shù)據(jù)安全的對(duì)策
3.1 大數(shù)據(jù)信息安全對(duì)策
隨著在線交易、在線對(duì)話、在線互動(dòng),在線數(shù)據(jù)越來越多,黑客們的犯罪動(dòng)機(jī)也比以往任時(shí)候都來得強(qiáng)烈。如今的黑客們組織性更強(qiáng),更加專業(yè),作案工具也是更加強(qiáng)大,作案手段更是層出不窮。相比于以往一次性數(shù)據(jù)泄露或者黑客攻擊事件的小打小鬧,現(xiàn)在數(shù)據(jù)一旦泄露,對(duì)整個(gè)企業(yè)可以說是一著不慎滿盤皆輸,不僅會(huì)導(dǎo)致聲譽(yù)受損、造成巨大的經(jīng)濟(jì)損失,嚴(yán)重的還要承擔(dān)法律責(zé)任,所以在大數(shù)據(jù)時(shí)代,網(wǎng)絡(luò)的恢復(fù)能力以及防范策略可以說是至關(guān)重要的。針對(duì)不同類型的大數(shù)據(jù)采取不同的決策,方法如下:
1)結(jié)構(gòu)化數(shù)據(jù)
大數(shù)據(jù)時(shí)代下數(shù)據(jù)非常復(fù)雜,數(shù)據(jù)量驚人,對(duì)于許多企業(yè)而言,保證這些信息數(shù)據(jù)的安全有效利用是非常嚴(yán)肅的問題。數(shù)據(jù)結(jié)構(gòu)化對(duì)于數(shù)據(jù)的安全及開發(fā)有著及其重要的作用。結(jié)構(gòu)化的數(shù)據(jù)便于加密管理和處理分類,能高效的分辨非法入侵的數(shù)據(jù),從而保證數(shù)據(jù)的安全未來社會(huì),數(shù)據(jù)標(biāo)準(zhǔn)化、結(jié)構(gòu)化是大趨勢(shì).
2)安全加固網(wǎng)絡(luò)層端點(diǎn)的數(shù)據(jù)
通常分層構(gòu)建是常規(guī)的數(shù)據(jù)安全模式。端點(diǎn)安全方式對(duì)于網(wǎng)絡(luò)層的安全防護(hù)并不完美。數(shù)據(jù)時(shí)代的信息爆炸,非法入侵服務(wù)端的次數(shù)急劇增長(zhǎng);云計(jì)算的大趨勢(shì),導(dǎo)致現(xiàn)在的網(wǎng)絡(luò)數(shù)據(jù)威脅方式和方法難以預(yù)測(cè)辨識(shí),給目前的端點(diǎn)數(shù)據(jù)安全模式造成了巨大壓力。今后網(wǎng)絡(luò)層安全應(yīng)當(dāng)作為重點(diǎn)發(fā)展。加強(qiáng)網(wǎng)絡(luò)層數(shù)據(jù)辨識(shí)結(jié)構(gòu)化、智能化基礎(chǔ)上加強(qiáng)與本地系統(tǒng)監(jiān)控協(xié)調(diào),杜絕非常態(tài)數(shù)據(jù)的運(yùn)行,形成網(wǎng)絡(luò)層構(gòu)筑屬于大數(shù)據(jù)時(shí)代的全面安全堡壘,避免自身的缺陷。
3) 對(duì)本地?cái)?shù)據(jù)加強(qiáng)安全策略
大數(shù)據(jù)時(shí)代數(shù)據(jù)的財(cái)富化導(dǎo)致大量的信息泄露,泄露事件中內(nèi)部的威勒更大。在本地策略的構(gòu)建上需要加入內(nèi)部管理的監(jiān)控,用純數(shù)據(jù)的模式來避免人為原因造成的數(shù)據(jù)流失和信息泄露。在今后的數(shù)據(jù)安全監(jiān)管手段中,逐漸分化管理者的角色權(quán)重,用數(shù)據(jù)本身的自我監(jiān)控和智能管理來代替一大部分人為的操作,在本地安全策略的構(gòu)建過程中還要注重與各個(gè)環(huán)節(jié)的協(xié)調(diào),依托于網(wǎng)絡(luò)這種數(shù)據(jù)處理方式,在數(shù)據(jù)的處理過程中往往出現(xiàn)大量的數(shù)據(jù)調(diào)用,調(diào)用過程中容易出現(xiàn)大的安全威脅。必須降本地和網(wǎng)絡(luò)的鏈接,從根本上做到杜絕數(shù)據(jù)的安全威脅,就必須完善緩存機(jī)制和儲(chǔ)存規(guī)則,保證數(shù)據(jù)源的純潔。
4)建立異構(gòu)數(shù)據(jù)中心安全系統(tǒng)
傳統(tǒng)數(shù)據(jù)存儲(chǔ)都建立了全面完善的防護(hù)措施,但基于云計(jì)算架構(gòu)的大數(shù)據(jù),需要進(jìn)一步完善數(shù)據(jù)存儲(chǔ)隔離與調(diào)用間的數(shù)據(jù)邏輯關(guān)系設(shè)定,當(dāng)前,用虛擬化海量存儲(chǔ)技術(shù)來存儲(chǔ)數(shù)據(jù)資源是大數(shù)據(jù)的安全存儲(chǔ)方式,以服務(wù)的形式提供數(shù)據(jù)的存儲(chǔ)和操作。在云共享環(huán)境中云計(jì)算的大數(shù)據(jù)存儲(chǔ),可以通過建立一個(gè)基于異構(gòu)數(shù)據(jù)為中心的安全系統(tǒng),使大數(shù)據(jù)的所有者可以對(duì)大數(shù)據(jù)進(jìn)行控制,從系統(tǒng)管理上保證大數(shù)據(jù)的安全。
當(dāng)企業(yè)轉(zhuǎn)變?yōu)閿?shù)據(jù)驅(qū)動(dòng)的機(jī)器時(shí),其潛力是巨大的:企業(yè)所擁有的數(shù)據(jù)可能成為獲得競(jìng)爭(zhēng)優(yōu)勢(shì)的關(guān)鍵。因此,企業(yè)的數(shù)據(jù)和基礎(chǔ)設(shè)施的安全也變得比以往任何時(shí)候都重要。在許多情況下,企業(yè)或組織都可能得到 Forrester所說的“有毒的數(shù)據(jù)”。
四、總結(jié)
大數(shù)據(jù)時(shí)代的到來,信息成為了國(guó)家和社會(huì)發(fā)展的重要戰(zhàn)略資源,帶來了更多的安全風(fēng)險(xiǎn),直接影響國(guó)家安全和社會(huì)穩(wěn)定,同時(shí)也帶來了新機(jī)遇。對(duì)于海量數(shù)據(jù)的分析提供了新的可能性,網(wǎng)絡(luò)的異常行為有助于信息安全服務(wù)提供商更好地找出數(shù)據(jù)中的風(fēng)險(xiǎn)點(diǎn)。與此同時(shí),大數(shù)據(jù)時(shí)代也對(duì)信息安全行業(yè)的發(fā)展有著積極的促進(jìn)作用,大數(shù)據(jù)分析與安全軟件相結(jié)合后信息安全問題將變的容易、快捷,大數(shù)據(jù)給信息安全帶來了機(jī)遇和挑戰(zhàn),信息安全戰(zhàn)略的制定需重視大數(shù)據(jù)的開發(fā)利用,多方位、多層次、多維度地維護(hù)國(guó)家信息安全。
繼實(shí)驗(yàn)科學(xué)、理論科學(xué)、計(jì)算機(jī)科學(xué)之后,以大數(shù)據(jù)為代表的數(shù)據(jù)密集型科學(xué)或?qū)⒊蔀樾乱淮渭夹g(shù)變革的基石,成為人類科學(xué)研究的第四大范式。面對(duì)挑戰(zhàn)與機(jī)遇并存的大數(shù)據(jù)安全問題,在規(guī)劃大數(shù)據(jù)發(fā)展的同時(shí),要明確信息安全在大數(shù)據(jù)發(fā)展中的重要地位,加強(qiáng)對(duì)大數(shù)據(jù)安全形勢(shì)的宣傳力度,明確大數(shù)據(jù)的重點(diǎn)保障對(duì)象,加大對(duì)敏感,要害數(shù)據(jù)的監(jiān)管,加快面向大數(shù)據(jù)的信息安全技術(shù)的研究,培養(yǎng)大數(shù)據(jù)安全的專業(yè)人才,建立并完善大數(shù)據(jù)信息安全體系。