自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<sub id="uvqno"></sub>

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考華為認證廠商認證 IT技術(shù)PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設置退出

Hadoop就是大數(shù)據(jù)應用又何妨

作者：佚名 2013-09-23 09:27:43

云計算 Hadoop

有關(guān)大數(shù)據(jù)，“奧巴馬連任總統(tǒng)和大數(shù)據(jù)、2009年谷歌在甲型H1N1流感爆發(fā)前幾周成功預測，公共衛(wèi)生部門震驚、美國折扣店零售商塔吉特與懷孕預測、UPS快遞最佳行車路線和汽車修理預測、亞馬遜大數(shù)據(jù)書評推薦下調(diào)戰(zhàn)勝專家團……”

有人說“大數(shù)據(jù)不是Hadoop;Hadoop也不代表大數(shù)據(jù)”，不知說的人什么目的，但在我看來，如今業(yè)內(nèi)對大數(shù)據(jù)認知尚不深刻的情況下，過多糾纏于概念無助于大數(shù)據(jù)應用。在我看來，如果強調(diào)“Hadoop就是大數(shù)據(jù)”利多弊少。

有關(guān)大數(shù)據(jù)，“奧巴馬連任總統(tǒng)和大數(shù)據(jù)、2009年谷歌在甲型H1N1流感爆發(fā)前幾周成功預測，公共衛(wèi)生部門震驚、美國折扣店零售商塔吉特與懷孕預測、UPS快遞最佳行車路線和汽車修理預測、亞馬遜大數(shù)據(jù)書評推薦下調(diào)戰(zhàn)勝專家團……”這樣幾個案例耳熟能詳，管中窺豹，我們可以大數(shù)據(jù)應用的價值，但我們的盲點在于不知道它們是如何做的，大數(shù)據(jù)應用是如何實現(xiàn)的。

從這個意義上說，了解Hadoop就非常有意義。它可以幫助我們了解什么是大數(shù)據(jù)，以及如何進行大數(shù)據(jù)的應用。Hadoop，分布式數(shù)據(jù)庫，僅從字面上還是很難了解其作用和價值。對此不妨看一個簡單的實例，看看搜索引擎是如何進行大數(shù)據(jù)應用的。首先，搜索引擎通過網(wǎng)絡爬蟲自動獲取網(wǎng)頁內(nèi)容，按照一定算法對內(nèi)容建立索引，這些索引和原始的數(shù)據(jù)用Hadoop存儲起來，并根據(jù)規(guī)則制作副本(通常是3副本)。當用戶發(fā)起檢索需求，搜索引擎就將Map為多個并行操作，對Hadoop數(shù)據(jù)庫中的索引進行檢索，其結(jié)果經(jīng)過Reduce，聚合為一個結(jié)果，提交給發(fā)起請求的終端。這就是搜索引擎大致一個工作過程。

我們很少把搜索引擎稱為大數(shù)據(jù)應用，但它確實是一個典型的大數(shù)據(jù)應用。其中的關(guān)鍵在于應用Hadoop，用相對廉價的X86服務器，對海量低價值密度的非結(jié)構(gòu)化數(shù)據(jù)進行存儲和處理。從橫向擴展性來看，其存儲和處理能力接近無限，只需要不斷添加服務器就可以了。至于存儲，可以依賴服務器自帶的磁盤，也可以理解用磁盤陣列。從Hadoop的角度，采用多副本的策略，數(shù)據(jù)可靠性已經(jīng)有所保證，如此也大大降低了對RAID、快照、復制/備份技術(shù)的依賴和要求，進一步降低了成本。

所以，把大數(shù)據(jù)理解Hadoop沒有什么不好，至少我們知道了分布式組織和存儲數(shù)據(jù)、多副本、NFS、Map/Reduce，這很好，至少我們不會為BI、ETL與大數(shù)據(jù)應用的關(guān)系而糾結(jié)，兩者各有適合應用的場景，雖有交叉，但更多是相互補充。

應該承認，沒有Hadoop+X86服務器這種廉價的手段，就不會有大數(shù)據(jù)應用。正是因為有了這種廉價的手段，我們才能夠?qū)Ａ康姆墙Y(jié)構(gòu)化數(shù)據(jù)的全局進行分析。而在著名的《大數(shù)據(jù)時代》一書中，特別強到“不是隨機抽樣，而是全體數(shù)據(jù)”，這是大數(shù)據(jù)應用的核心特征，對全體數(shù)據(jù)進行分析的結(jié)果，會讓我們迅速了解事情的結(jié)果。至于所采用的手段，叫不叫Hadoop、NFS、Map/Reduce，這并不知道，但核心思路和思想一定會延續(xù)，從這個意義上，將Hadoop稱為大數(shù)據(jù)應用又有什么不可以呢?!至少我是這么看的。

責任編輯：王程程來源：比特網(wǎng)

Hadoop 大數(shù)據(jù)

51CTO技術(shù)棧公眾號

業(yè)務
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學堂精培企業(yè)培訓 CTO訓練營