自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

Hadoop大數(shù)據(jù)分析平臺的介紹性討論

大數(shù)據(jù) Hadoop
Hadoop是迄今為止MapReduce最主流的執(zhí)行,是一個完全開源的平臺,用于處理大數(shù)據(jù)。它具有足夠的適應(yīng)性,能夠同時處理各種數(shù)據(jù)源,或者匯集不同的信息源(記住進(jìn)行大規(guī)模處理的最終目標(biāo))或者從數(shù)據(jù)庫中讀取數(shù)據(jù)以便運行處理器 - 學(xué)習(xí)機器學(xué)習(xí)的工作。

Hadoop大數(shù)據(jù)分析平臺的介紹性討論,以及可與Hadoop集成的其他工具,以實現(xiàn)更好的數(shù)據(jù)提取和分析。

Hadoop是迄今為止MapReduce最主流的執(zhí)行,是一個完全開源的平臺,用于處理大數(shù)據(jù)。它具有足夠的適應(yīng)性,能夠同時處理各種數(shù)據(jù)源,或者匯集不同的信息源(記住進(jìn)行大規(guī)模處理的最終目標(biāo))或者從數(shù)據(jù)庫中讀取數(shù)據(jù)以便運行處理器 - 學(xué)習(xí)機器學(xué)習(xí)的工作。它有一些獨特的應(yīng)用; 然而,***的用例之一是大量不斷發(fā)展的數(shù)據(jù),例如,來自氣候或運動傳感器的基于區(qū)域的信息,基于在線或基于網(wǎng)絡(luò)的社交網(wǎng)絡(luò)信息,或基于機器對機器價值的數(shù)據(jù)。

Hadoop大數(shù)據(jù)分析平臺的介紹性討論

我們將討論Hadoop特有的一些優(yōu)點,使其成為數(shù)據(jù)處理目的的***和***技術(shù),其次是著名的工具及其用途。

Hadoop的優(yōu)點 

Hadoop大數(shù)據(jù)分析平臺的介紹性討論

可擴展

Hadoop是一個特別通用的存儲平臺,因為它可以在幾個并行工作的廉價服務(wù)器上存儲和適當(dāng)?shù)膹V泛信息索引。與習(xí)慣性關(guān)系數(shù)據(jù)庫系統(tǒng)(RDBMS)不同,Hadoop無法擴展以同時處理大量信息,它使組織能夠在大量節(jié)點上運行應(yīng)用程序,包括大量的TB級信息處理。

便宜

Hadoop是一個提供廉價存儲解決方案的平臺。習(xí)慣性關(guān)系數(shù)據(jù)庫管理系統(tǒng)的問題在于,它在很大程度上具有成本限制,可以擴展到您處理巨大數(shù)據(jù)量的程度。為了降低成本,公司使用下采樣數(shù)據(jù)并根據(jù)某些假設(shè)對其進(jìn)行分類,并刪除剩余的原始數(shù)據(jù)。因此,當(dāng)業(yè)務(wù)優(yōu)先級發(fā)生變化時,整個原始數(shù)據(jù)模型都不可用。

適應(yīng)性強

Hadoop使組織能夠毫不費力地查找數(shù)據(jù)源并利用各種數(shù)據(jù)(有組織的和非組織的)。這意味著組織可以利用Hadoop從信息源獲取重要的面向業(yè)務(wù)的知識,例如,在線網(wǎng)絡(luò),電子郵件討論或點擊流信息。此外,Hadoop可用于各種用途,例如,日志準(zhǔn)備,提案框架,信息倉庫,營銷活動分析以及檢測欺詐和虛假陳述等等。

快速

Hadoop的***的存儲策略取決于傳播的文檔框架,該框架基本上將數(shù)據(jù)“映射”在集群中的任何位置。用于數(shù)據(jù)準(zhǔn)備的工具經(jīng)常在數(shù)據(jù)實際所在的類似服務(wù)器上找到,從而實現(xiàn)更快速的數(shù)據(jù)處理。如果您正在管理大量非結(jié)構(gòu)化數(shù)據(jù),Hadoop可以在幾分鐘內(nèi)有效地處理數(shù)TB的數(shù)據(jù),并且可以在數(shù)小時內(nèi)處理數(shù)PB。

加速容錯

利用Hadoop進(jìn)行數(shù)據(jù)處理的一個主要優(yōu)點是它適應(yīng)了非關(guān)鍵性故障。在將信息發(fā)送到單個節(jié)點時,該信息另外被再現(xiàn)到集群中的各個不同節(jié)點,這意味著在出現(xiàn)故障或錯誤的情況下,存在可供使用的另一個副本。

Hadoop工具可實現(xiàn) 更好的數(shù)據(jù)處理

MongoDB 

Hadoop大數(shù)據(jù)分析平臺的介紹性討論

MongoDB是處理數(shù)據(jù)庫管理的高級方法,是傳統(tǒng)數(shù)據(jù)庫的另一種選擇。該Hadoop分析工具監(jiān)控非結(jié)構(gòu)化或半組織信息以及經(jīng)常持續(xù)變化的信息。

OpenRefine 

Hadoop大數(shù)據(jù)分析平臺的介紹性討論

一旦被稱為GoogleRefine,OpenRefine就是一個數(shù)據(jù)檢查工具和一個開源Hadoop工具,它可以捕獲原始數(shù)據(jù)??蛻艨梢院敛毁M力地分析大量非結(jié)構(gòu)化數(shù)據(jù)。

Cloudera

Hadoop大數(shù)據(jù)分析平臺的介紹性討論

這個出色的Hadoop工具為數(shù)據(jù)庫管理,管理和處理提供了額外的好處。它建立了一個重點組織數(shù)據(jù)中心,其最終目標(biāo)是讓您的團隊更好地訪問存儲的數(shù)據(jù),并謹(jǐn)慎地查看它以報告重要的業(yè)務(wù)洞察。

RapidMiner

Hadoop大數(shù)據(jù)分析平臺的介紹性討論

這種有先見之明的數(shù)據(jù)檢查工具得到了德勤,思科和eBay等眾多組織的支持。開源信息調(diào)查工具促進(jìn)了令人敬畏的團隊支持,并且使用起來既簡單又可行。這個BI設(shè)備***的事情是客戶可以通過選擇API合并他們的特定計算。圖形用戶界面的構(gòu)建方式使得即使是非技術(shù)客戶也可以輕松使用此工具。

Qubole

Hadoop大數(shù)據(jù)分析平臺的介紹性討論

這種易于使用的Hadoop工具允許團隊擴展其大數(shù)據(jù)分析,從而可以提取存儲在Google,Azure和AWSmist中的數(shù)據(jù)。它易于學(xué)習(xí),不需要任何廣泛的基礎(chǔ)設(shè)施基礎(chǔ)。如果您已經(jīng)設(shè)置了IT安排,您可以在您的組中合并任意數(shù)量的大數(shù)據(jù)分析師,他們將在不同的數(shù)據(jù)處理引擎中協(xié)作創(chuàng)建由各種調(diào)查工具生成的解決方案。

 

責(zé)任編輯:未麗燕 來源: 今日頭條
相關(guān)推薦

2017-07-22 00:41:27

大數(shù)據(jù)數(shù)據(jù)存儲

2018-06-15 20:44:40

Hadoop數(shù)據(jù)分析數(shù)據(jù)

2016-12-22 09:52:13

Hadoop大數(shù)據(jù)分析

2011-09-02 10:59:02

大數(shù)據(jù)數(shù)據(jù)分析Hadoop

2013-01-18 10:04:33

大數(shù)據(jù)分析

2011-08-12 11:14:42

大數(shù)據(jù)數(shù)據(jù)分析平臺架構(gòu)

2013-04-28 10:01:28

HDInsightWindows AzuHadoop

2012-08-08 09:53:23

HadoopMapReduce

2012-05-30 11:29:14

Hadoop大數(shù)據(jù)

2018-06-05 12:06:20

Hadoop開源工具

2013-10-30 09:13:35

微軟Hadoop AzurWindows Azu

2015-07-01 13:51:12

HadoopMapReduce數(shù)據(jù)分析

2013-12-18 11:26:08

Hadoop大數(shù)據(jù)

2020-05-26 16:25:33

Hadoop下載安裝

2020-10-21 10:51:43

數(shù)據(jù)分析

2015-05-26 10:27:17

大數(shù)據(jù)分析電商平臺應(yīng)用

2015-08-14 10:28:09

大數(shù)據(jù)

2015-08-24 13:56:10

數(shù)據(jù)分析

2014-03-12 10:17:22

R語言Hadoop

2021-08-06 11:01:23

大數(shù)據(jù)數(shù)據(jù)分析技術(shù)
點贊
收藏

51CTO技術(shù)棧公眾號