大數(shù)據(jù)與云計(jì)算:并非完美一對(duì)
大數(shù)據(jù)與云計(jì)算的確有著千絲萬(wàn)縷的關(guān)系,不過(guò)從技術(shù)層面考慮,不應(yīng)將二者混為一談。
最近一段時(shí)間,大數(shù)據(jù)成為熱議的話題。大數(shù)據(jù)通常依托Hadoop構(gòu)架,并與公共云相聯(lián)系。相關(guān)的云服務(wù)和云產(chǎn)品不斷推出,并且都保證能幫你解決數(shù)據(jù)問(wèn)題。事實(shí)上它們都在推行著同一個(gè)理念:利用公共云的高靈活性以及“幾乎無(wú)限的可擴(kuò)展性”,將數(shù)據(jù)移植到拍字節(jié)的大型數(shù)據(jù)庫(kù)。
但現(xiàn)實(shí)情況和媒體的渲染相去甚遠(yuǎn)。企業(yè)希望將商業(yè)數(shù)據(jù)移植到公共云中的大型數(shù)據(jù)庫(kù)中,但同時(shí)往往忽略了一些技術(shù)問(wèn)題。
首先,大數(shù)據(jù)意味著大型整合的挑戰(zhàn)。因此,事實(shí)上,企業(yè)將數(shù)據(jù)移植到公共云的過(guò)程并不簡(jiǎn)單。當(dāng)然,每天在網(wǎng)絡(luò)上傳輸幾百甚至幾千份數(shù)據(jù)記錄對(duì)你而言是家常便飯,但不要忘記,許多情況下,我們談?wù)摰臄?shù)據(jù)記錄是以百萬(wàn)計(jì)的,你需要對(duì)它們逐一進(jìn)行轉(zhuǎn)換、傳輸以及同步處理。
很快你就會(huì)為帶寬的問(wèn)題頭疼。事實(shí)上,美國(guó)的許多企業(yè)是利用聯(lián)邦快遞將存儲(chǔ)數(shù)據(jù)的USB硬盤送到云服務(wù)商那里的。
其次,安全問(wèn)題在云計(jì)算中至關(guān)重要,而在企業(yè)本地的數(shù)據(jù)架構(gòu)或在私有云中,安全支出要比公共云中低很多。在許多情況下,安全模型和安全技術(shù)的費(fèi)用會(huì)便宜很多。舉例來(lái)說(shuō),在公共云中,你必須對(duì)所有數(shù)據(jù)預(yù)先加密——而在本地?cái)?shù)據(jù)庫(kù)在則不必這樣做。
你可能對(duì)我的觀點(diǎn)有所質(zhì)疑,我想聲明一下,我并不是說(shuō)大數(shù)據(jù)與公共云永遠(yuǎn)不能相容,但對(duì)于所有技術(shù)層面的問(wèn)題,你必須仔細(xì)考慮。而對(duì)于架構(gòu)方面的問(wèn)題,則需要根據(jù)具體情況逐一分析。