自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

^{<sub id="mgnru"></sub>}

<blockquote id="mgnru"><p id="mgnru"><th id="mgnru"></th></p></blockquote>

^{<blockquote id="mgnru"></blockquote>}

<s id="mgnru"></s>

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開(kāi)發(fā)者社區(qū)

WOT技術(shù)大會(huì)

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線學(xué)習(xí)

文章資源問(wèn)答課堂專欄直播

51CTO

鴻蒙開(kāi)發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開(kāi)發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開(kāi)發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

賬號(hào)設(shè)置退出

Hadoop 2.0：大數(shù)據(jù)的新突破在即

作者：boxi 2013-05-27 15:12:49

大數(shù)據(jù) Hadoop

以往 Hadoop 似乎就是大數(shù)據(jù)的代名詞。不過(guò)最近隨著大數(shù)據(jù)應(yīng)用的深入，大家已經(jīng)越來(lái)越傾向于僅僅把它看成是大數(shù)據(jù)的一個(gè)存儲(chǔ)工具了。接下來(lái)的Hadoop 2.0就為了解決之前所出現(xiàn)的問(wèn)題。

不過(guò)這并不一定就是壞事。把 Hadoop 當(dāng)作廉價(jià)有效的存儲(chǔ)正好是 Hadoop 下一階段演進(jìn)的的完美起點(diǎn)。今年夏天就要亮相的 Hadoop 2.0 將會(huì)令數(shù)據(jù)倉(cāng)庫(kù)中的信息以及非結(jié)構(gòu)化數(shù)據(jù)池前所未有地容易訪問(wèn)。

Hadoop大桶

自成為大數(shù)據(jù)工具以來(lái)，Hadoop 就是一個(gè)非常棒的數(shù)據(jù)存儲(chǔ)系統(tǒng)，但是需要開(kāi)發(fā) Java 應(yīng)用來(lái)訪問(wèn)數(shù)據(jù)的 MapReduce 學(xué)習(xí)起來(lái)卻比較困難。

當(dāng)然，還有別的辦法可以從 Hadoop 中獲取信息。Hbase數(shù)據(jù)是 Hadoop 的一部分，它可以讓用戶按照數(shù)據(jù)庫(kù)范式來(lái)處理數(shù)據(jù)。Hive數(shù)據(jù)倉(cāng)庫(kù)則可以讓你用類 SQL 的 HiveSQL 查詢語(yǔ)言來(lái)創(chuàng)建查詢并轉(zhuǎn)化為 MapReduce 任務(wù)。不過(guò) Hadoop 仍受限于單線程性。MapReduce 任務(wù)、Hive 查詢、Hbase 操作，等等，這些都要輪流進(jìn)行。

這就是許多大數(shù)據(jù)供應(yīng)商傾向于僅將 Hadoop 當(dāng)作數(shù)據(jù)容器的原因，為了提高效率，他們?cè)诖嘶A(chǔ)上再開(kāi)發(fā)自己的工具來(lái)獲取或分析其中的數(shù)據(jù)。盡管把 Hadoop 形容為一個(gè)大桶很形象，但是 Hadoop 用戶當(dāng)中已經(jīng)有人把它看作是數(shù)據(jù)大湖甚至數(shù)據(jù)海洋了。不過(guò)光是規(guī)模大還是不行的，那些限制影響到了 Hadoop 的賣點(diǎn)。

Hadoop 的開(kāi)發(fā)社區(qū)也意識(shí)到這個(gè)問(wèn)題，隨著 Hadoop 即將迭代到新的版本，上述限制即將在很大程度上被解除。

YARN解決方案

在 Hadoop 2.0 發(fā)布經(jīng)理 Arun Murthy 看來(lái)，其最重要的變化是 MapReduce 框架升級(jí)為Apache YARN，這將擴(kuò)展 Hadoop 中可以應(yīng)用的軟件種類和應(yīng)用程度。Arun Murthy 本人就是 YARN 項(xiàng)目主管，他指出，Hadoop 1.0 和 2.0 的區(qū)別在于，前者所有的事情都是面向批處理的，而后者則允許多個(gè)應(yīng)用同時(shí)在內(nèi)部訪問(wèn)數(shù)據(jù)。

相對(duì)于當(dāng)前 MapReduce 系統(tǒng)能處理的事情，把這些功能分開(kāi)使得 Hadoop 集群資源的管理更加強(qiáng)大。其主要管理方式類似于操作系統(tǒng)對(duì)任務(wù)的處理，也就是說(shuō)不再有一次一項(xiàng)操作的限制了。

有了 YARN，開(kāi)發(fā)者就能夠直接在 Hadoop 內(nèi)部來(lái)開(kāi)發(fā)應(yīng)用，而不是像許多第三方工具所做的那樣，在外面把數(shù)據(jù)篩選出來(lái)。

Murthy 稱，現(xiàn)在已經(jīng)有供應(yīng)商對(duì)在 YARN 框架內(nèi)開(kāi)發(fā)應(yīng)用表現(xiàn)出興趣。Murthy 估計(jì)，Hadoop 2.0 的強(qiáng)力 beta 版有可能會(huì)在今年 6 月或 7 月推出，正式版則可能在 8 月發(fā)布。

如果 YARN 的確能履行其承諾的話，開(kāi)發(fā)者將可以在原生的 Hadoop 平臺(tái)里方便地接觸到許多的數(shù)據(jù)大湖大海，令搜尋有用信息的任務(wù)更加流暢和便捷。屆時(shí)，大數(shù)據(jù)會(huì)變得更加有用、更加大眾化。

原文鏈接：http://www.36kr.com/p/203559.html

責(zé)任編輯：彭凡來(lái)源： 36氪

點(diǎn)贊

51CTO技術(shù)棧公眾號(hào)

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開(kāi)發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營(yíng)

<s id="keu0k"></s>

<sub id="keu0k"><i id="keu0k"></i></sub>