自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

Hadoop 2.0將發(fā)布 大數(shù)據(jù)的新突破在即

云計(jì)算 Hadoop
不過這并不一定就是壞事。把Hadoop當(dāng)作廉價(jià)有效的存儲(chǔ)正好是Hadoop下一階段演進(jìn)的的完美起點(diǎn)。今年夏天就要亮相的Hadoop 2.0將會(huì)令數(shù)據(jù)倉庫中的信息以及非結(jié)構(gòu)化數(shù)據(jù)池前所未有地容易訪問。

以往Hadoop似乎就是大數(shù)據(jù)的代名詞。不過最近隨著大數(shù)據(jù)應(yīng)用的深入,大家已經(jīng)越來越傾向于僅僅把它看成是大數(shù)據(jù)的一個(gè)存儲(chǔ)工具了。

不過這并不一定就是壞事。把Hadoop當(dāng)作廉價(jià)有效的存儲(chǔ)正好是Hadoop下一階段演進(jìn)的的***起點(diǎn)。今年夏天就要亮相的Hadoop 2.0將會(huì)令數(shù)據(jù)倉庫中的信息以及非結(jié)構(gòu)化數(shù)據(jù)池***地容易訪問。

Hadoop大桶

自成為大數(shù)據(jù)工具以來,Hadoop就是一個(gè)非常棒的數(shù)據(jù)存儲(chǔ)系統(tǒng),但是需要開發(fā)Java應(yīng)用來訪問數(shù)據(jù)的MapReduce學(xué)習(xí)起來卻比較困難。

當(dāng)然,還有別的辦法可以從Hadoop中獲取信息。Hbase數(shù)據(jù)是Hadoop的一部分,它可以讓用戶按照數(shù)據(jù)庫范式來處理數(shù)據(jù)。Hive數(shù)據(jù)倉庫則可以讓你用類SQL的HiveSQL查詢語言來創(chuàng)建查詢并轉(zhuǎn)化為MapReduce任務(wù)。不過Hadoop仍受限于單線程性。MapReduce任務(wù)、Hive查詢、Hbase操作,等等,這些都要輪流進(jìn)行。

這就是許多大數(shù)據(jù)供應(yīng)商傾向于僅將Hadoop當(dāng)作數(shù)據(jù)容器的原因,為了提高效率,他們?cè)诖嘶A(chǔ)上再開發(fā)自己的工具來獲取或分析其中的數(shù)據(jù)。盡管把Hadoop形容為一個(gè)大桶很形象,但是Hadoop用戶當(dāng)中已經(jīng)有人把它看作是數(shù)據(jù)大湖甚至數(shù)據(jù)海洋了。不過光是規(guī)模大還是不行的,那些限制影響到了Hadoop的賣點(diǎn)。

Hadoop的開發(fā)社區(qū)也意識(shí)到這個(gè)問題,隨著Hadoop即將迭代到新的版本,上述限制即將在很大程度上被解除。

YARN解決方案

在Hadoop 2.0發(fā)布經(jīng)理Arun Murthy看來,其最重要的變化是MapReduce框架升級(jí)為Apache YARN,這將擴(kuò)展Hadoop中可以應(yīng)用的軟件種類和應(yīng)用程度。Arun Murthy本人就是YARN項(xiàng)目主管,他指出,Hadoop 1.0和2.0的區(qū)別在于,前者所有的事情都是面向批處理的,而后者則允許多個(gè)應(yīng)用同時(shí)在內(nèi)部訪問數(shù)據(jù)。

相對(duì)于當(dāng)前MapReduce系統(tǒng)能處理的事情,把這些功能分開使得Hadoop集群資源的管理更加強(qiáng)大。其主要管理方式類似于操作系統(tǒng)對(duì)任務(wù)的處理,也就是說不再有一次一項(xiàng)操作的限制了。

有了YARN,開發(fā)者就能夠直接在Hadoop內(nèi)部來開發(fā)應(yīng)用,而不是像許多第三方工具所做的那樣,在外面把數(shù)據(jù)篩選出來。

Murthy稱,現(xiàn)在已經(jīng)有供應(yīng)商對(duì)在YARN框架內(nèi)開發(fā)應(yīng)用表現(xiàn)出興趣。Murthy估計(jì),Hadoop 2.0的強(qiáng)力beta版有可能會(huì)在今年6月或7月推出,正式版則可能在8月發(fā)布。

如果YARN的確能履行其承諾的話,開發(fā)者將可以在原生的Hadoop平臺(tái)里方便地接觸到許多的數(shù)據(jù)大湖大海,令搜尋有用信息的任務(wù)更加流暢和便捷。屆時(shí),大數(shù)據(jù)會(huì)變得更加有用、更加大眾化。

責(zé)任編輯:王程程 來源: 微刊
相關(guān)推薦

2013-05-27 15:12:49

Hadoop 2.0

2013-05-28 09:49:04

Hadoop 2.0大數(shù)據(jù)數(shù)據(jù)存儲(chǔ)

2014-12-29 09:14:19

惠普Haven 2.0大數(shù)據(jù)

2013-10-30 09:13:35

微軟Hadoop AzurWindows Azu

2012-05-28 09:23:40

JavaHadoopApache

2013-07-02 13:38:59

WibiDataHadoopCloudera

2020-02-22 13:47:47

iPhone手機(jī)市場(chǎng)蘋果

2015-08-24 14:37:01

ALEIYE 2.0實(shí)時(shí)大數(shù)據(jù)RET功能

2011-07-12 09:13:26

EMC云計(jì)算云存儲(chǔ)

2016-12-20 18:21:29

Hadoop大數(shù)據(jù)面試

2018-06-14 21:21:33

2014-06-17 09:44:30

Hadoop

2015-04-01 15:09:30

Hadoop大數(shù)據(jù)

2021-07-13 10:04:07

大數(shù)據(jù)

2019-05-07 11:49:24

大數(shù)據(jù)

2013-02-26 09:36:57

RubyRuby 2.0

2020-06-30 15:23:22

戴爾

2013-04-26 13:05:10

大數(shù)據(jù)全球技術(shù)峰會(huì)

2017-03-23 12:51:56

互聯(lián)網(wǎng)

2013-05-06 10:22:28

大數(shù)據(jù)Hadoop
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)