自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

Hadoop掀起大數(shù)據(jù)革命:三巨頭齊發(fā)力

系統(tǒng) Hadoop
大數(shù)據(jù)革命正以Apache Hadoop為中心如火如荼的進(jìn)行著。自從開源分布式數(shù)據(jù)處理平臺在5年前發(fā)布時討論之聲就不絕于耳。但在過去的18個月中,Hadoop贏得了客戶的認(rèn)可,并得到眾多商業(yè)化的支持以及眾多數(shù)據(jù)庫和數(shù)據(jù)集成軟件商的整合。在眾多廠商之中最著名的三個商業(yè)數(shù)據(jù)供應(yīng)商當(dāng)屬Oracle、IBM和Microsoft。

大數(shù)據(jù)革命正以Apache Hadoop為中心如火如荼的進(jìn)行著。自從開源分布式數(shù)據(jù)處理平臺在5年前發(fā)布時討論之聲就不絕于耳。但在過去的18個月中,Hadoop贏得了客戶的認(rèn)可,并得到眾多商業(yè)化的支持以及眾多數(shù)據(jù)庫和數(shù)據(jù)集成軟件商的整合。在眾多廠商之中***的三個商業(yè)數(shù)據(jù)供應(yīng)商當(dāng)屬Oracle、IBM和Microsoft。

 

[[49913]]

 

Hadoop會在未來成為大數(shù)據(jù)的重大技術(shù)嗎?

Hadoop是一個基于Java的分布式密集數(shù)據(jù)處理和數(shù)據(jù)分析的軟件框架。Hadoop在很大程度上是受Google在2004年白皮書中闡述的MapReduce的技術(shù)啟發(fā)。MapReduce工作原理是將任務(wù)分解為成百上千塊的小任務(wù),然后發(fā)送到計算機集群中。每臺計算機再傳送會自己那部分信息,MapReduce則迅速整合這些反饋并形成答案。

Hadoop的擴展性非常優(yōu)秀,Hadoop可處理分布在數(shù)以千計的低成本X86服務(wù)器計算節(jié)點中的大型數(shù)據(jù)。同時由于眾所周知的摩爾定律,內(nèi)存和磁盤的容量也在不斷增長。Hadoop對硬件的支持也在加強,現(xiàn)在每個節(jié)點可部署16核的處理器,12TB甚至24TB磁盤。Cloudera透露其推出的產(chǎn)品每個節(jié)點的成本大約4000美元。這個價格對于關(guān)系數(shù)據(jù)庫部署每TB 10000至12000美元來說***競爭優(yōu)勢。

這種高容量低成本的組合引人注目,但Hadoop最吸引人的是其處理混合數(shù)據(jù)類型的能力。

Hadoop可以管理結(jié)構(gòu)化數(shù)據(jù),以及諸如服務(wù)器日志文件和Web點擊流的數(shù)據(jù)。同時還可以管理以非結(jié)構(gòu)化文本為中心的數(shù)據(jù),如Facebook和Twitter。這種處理多類型數(shù)據(jù)的能力非常重要。它催生了NoSQL平臺和產(chǎn)品。如Cassandra, CouchDB, MongoDB以及Oracle***的NoSQL數(shù)據(jù)庫。而傳統(tǒng)關(guān)系型數(shù)據(jù)庫如Oracle,IBM DB2,Microsoft SQL Server和MySQL則都不能處理混合數(shù)據(jù)類型和非結(jié)構(gòu)化數(shù)據(jù)。 由于事務(wù)處理靈活性的需求,Hadoop獲得大多數(shù)數(shù)據(jù)分析廠商的關(guān)注和支持。

Hadoop已被廣泛應(yīng)用

 

[[49914]]

 

現(xiàn)今,Hadoop已被認(rèn)為是非結(jié)構(gòu)化數(shù)據(jù)的專用技術(shù)。低成本、高擴展性和靈活性等優(yōu)勢已成為處理大規(guī)模點擊流量分析和廣告定位等網(wǎng)絡(luò)巨頭(如AOL和comScore)的***。

AOL三年多時間一直使用Hadoop。AOL的研發(fā)團(tuán)隊在加利福尼亞州的Mountain View部署了300節(jié)點的系統(tǒng),該系統(tǒng)可以存儲每天數(shù)十億事件和超過500TB的點擊流數(shù)據(jù)。點擊所帶來流數(shù)據(jù)是高度結(jié)構(gòu)化的,但數(shù)據(jù)量是非常龐大和多樣的。所以幾乎不可能處理所有的提取、轉(zhuǎn)換和負(fù)載工作。AOL為了解決以上問題決定使用Hadoop MapReduce處理分布在數(shù)百個計算節(jié)點的數(shù)據(jù)過濾和關(guān)聯(lián)任務(wù)。由于Hadoop為業(yè)務(wù)帶來的優(yōu)勢,AOL的Hadoop研發(fā)團(tuán)隊在今年四月在其總部部署了700節(jié)點的系統(tǒng)。

Hadoop適用于所有類型數(shù)據(jù)的特性注定將使Hadoop在更廣泛的領(lǐng)域使用。例如提供托管服務(wù)和中小型企業(yè)應(yīng)用服務(wù)提供商SunGrad。他們將計劃推出基于云的托管服務(wù),旨在幫助金融服務(wù)公司處理他們基于Hadoop MapReduce的數(shù)據(jù)處理。

商用軟件廠商Tidemark最近也推出一款SaaS軟件,這種基于云的性能管理應(yīng)用使用MapReduce將混合數(shù)據(jù)源轉(zhuǎn)化為產(chǎn)品或金融規(guī)劃方案。#p#

三巨頭大數(shù)據(jù)領(lǐng)域齊發(fā)力

 

[[49915]]

 

在上月美國拉斯維加斯舉行IOD年度大會上IBM院士、DB2總架構(gòu)師Curt Cotner宣布IBM將在明年推出內(nèi)置NoSQL技術(shù)的DB2旗艦級數(shù)據(jù)庫管理系統(tǒng)。他還表示未來的數(shù)據(jù)庫發(fā)展方向是非關(guān)系數(shù)據(jù)庫NoSQL。目前Google的BigTable和Amazon的Dynamo都用NoSQL型數(shù)據(jù)庫,而傳統(tǒng)的關(guān)系數(shù)據(jù)庫在應(yīng)付超大規(guī)模、高并發(fā)的SNS、web2.0網(wǎng)站已經(jīng)力不從心。同時IBM發(fā)布了一系列數(shù)據(jù)分析軟件,包括云計算版本的InfoSphere BigInsights。BigInsights是一套建立在Hadoop上的數(shù)據(jù)分析軟件,能夠處理企業(yè)用戶收集大量非結(jié)構(gòu)化資料。

微軟也在10月12日在西雅圖舉行的SQL PASS 2011峰會宣布將與從雅虎分拆出來的Hortonworks合作開發(fā)Hadoop,并將在Apache Hadoop上實現(xiàn)搭建Windows Azure以及Windows Server平臺。同時基于Hadoop的Windows Server還會與微軟現(xiàn)有的BI工具聯(lián)合處理任務(wù)。

Oracle作為全球***的關(guān)系型數(shù)據(jù)庫提供商也有所行動。其在2011 Oracle全球大會上推出了Big Data Appliance。Big Data Appliance是一個集成了Hadoop、NoSQL Database、Oracle數(shù)據(jù)庫Hadoop適配器、Oracle數(shù)據(jù)庫Hadoop裝載器及R語言的系統(tǒng)。

Hadoop的未來

根據(jù)目前的狀況來看,Hadoop作為企業(yè)級數(shù)據(jù)倉庫體系結(jié)構(gòu)核心技術(shù),在未來的數(shù)年中將會保持持續(xù)增長的勢頭。包括MapR、Zettaset、Cloudera、HStreaming、Hadapt、DataStax、Datameer這些與Hadoop相關(guān)的新公司已經(jīng)獲得投資,為人們所熟知,為各種市場帶來***技術(shù)。

與此同時下一代的MapReduce會完善很多之前不盡人如意的地方。首先節(jié)點數(shù)將從目前的4000增加到6000-10000,其次并發(fā)的任務(wù)數(shù)從目前的40000增加到100000。另外將繼續(xù)加大對硬件支持,同時架構(gòu)也會有所改變,包括更多編程模式的支持。

【編輯推薦】

  1. 大數(shù)據(jù)競爭加劇 IBM新增Hadoop服務(wù)強化影響力
  2. 新Ubuntu 11.10加速企業(yè)安裝Hadoop
  3. Ubuntu 11.10加速企業(yè)安裝Hadoop
責(zé)任編輯:Yeva 來源: CSDN
相關(guān)推薦

2013-07-19 09:07:28

2012-07-31 17:00:49

大數(shù)據(jù)

2013-04-23 09:33:49

ZARA亞馬遜沃爾瑪

2017-09-22 12:14:30

互聯(lián)網(wǎng)

2014-09-11 10:18:48

WDS

2019-08-07 09:30:58

人工智能AI教育革命

2013-03-26 09:40:47

大數(shù)據(jù)大數(shù)據(jù)挖掘

2014-04-14 09:55:32

2012-05-14 09:16:44

大數(shù)據(jù)呼叫中心

2016-11-25 15:22:35

物流大數(shù)據(jù)巨頭

2013-02-27 13:07:45

蘋果

2013-01-13 13:28:10

Firefox OS

2016-12-20 18:21:29

Hadoop大數(shù)據(jù)面試

2017-03-15 10:30:16

麥肯錫大數(shù)據(jù)醫(yī)療

2011-10-26 11:07:23

大數(shù)據(jù)服務(wù)器Hadoop

2016-08-03 15:01:20

醫(yī)療行業(yè)大數(shù)據(jù)

2016-10-26 08:36:16

2021-06-21 17:04:55

大數(shù)據(jù)Hadoop

2013-01-22 09:57:41

2013-12-12 13:35:05

4G大數(shù)據(jù)革命大數(shù)據(jù)
點贊
收藏

51CTO技術(shù)棧公眾號