自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

Cloudera將Spark劃入Hadoop

數(shù)據(jù)庫 Hadoop Spark
Spark作為一個通用的并行計算框架,已經(jīng)成為繼Hadoop之后又一大熱門開元項目,逐漸獲得很多企業(yè)的支持。近日,Cloudera正式宣布開始商業(yè)支持Apache Spark 機(jī)器學(xué)習(xí)和數(shù)據(jù)流處理環(huán)境。

Spark內(nèi)存計算框架適合各種迭代算法和交互式數(shù)據(jù)分析,能夠提升大數(shù)據(jù)處理的實時性和準(zhǔn)確性。而MapReduce處理框架則擅長復(fù)雜的批處理操作、登陸過濾、ETL(數(shù)據(jù)抽取、轉(zhuǎn)換、加載)、網(wǎng)頁索引等應(yīng)用,MapReduce在低延遲業(yè)務(wù)上一直被人所詬病。

圖一:Spark內(nèi)存計算框架

“Spark記錄著數(shù)據(jù)產(chǎn)生的每一個操作,能夠可靠地將這些數(shù)據(jù)存儲在內(nèi)存之中,這使得它非常適用于第掩飾的計算和有效的迭代算法。”Cloudera表示。

據(jù)悉,Cloudera Enterprise Data Hub版本提供多種先進(jìn)的組件的無限支持,如交互式SQL分析的Impala、交互式搜索、導(dǎo)航數(shù)據(jù)管理以及Hbase NoSQL。Enterprise Flex版本則提供可選擇組件版本,Enterprise Basic版本則是僅僅提供Hadoop基礎(chǔ)核心組件。

根據(jù)Cloudera介紹,Cloudera將會在兩個版本中安裝支持Spark組件。用戶可以利用它作為Enterprise Flex版本中一個可選組件,或者作為Enterprise Data Hub版本中包含的組件。

 

圖二:Spark On YARN 

據(jù)悉,該產(chǎn)品采用了Spark 0.9.0,Spark獨立模式已經(jīng)在Cloudera Enterprise Data Hub4.4.0中測試過。在不久的將來,Cloudera表示Enterprise 5.0和YARN中也將支持Spark。

【編輯推薦】

責(zé)任編輯:彭凡 來源: 存儲在線
相關(guān)推薦

2011-10-19 09:35:36

Hadoop數(shù)據(jù)集群

2012-11-01 10:01:56

HadoopClouderaImpala

2021-06-02 00:22:04

ClouderaHadoop私有化

2010-06-04 16:47:49

實現(xiàn)Hadoop

2016-01-15 15:55:56

ClouderaSparkHadoop

2010-06-04 17:03:17

實現(xiàn)Hadoop

2014-01-07 11:24:45

SparkHadoop

2010-06-04 16:31:14

實現(xiàn)Hadoop

2018-04-08 15:32:47

Hadoop大數(shù)據(jù)Gartner

2013-07-19 09:43:16

2016-06-16 09:56:17

Cloudera

2016-02-01 15:32:03

HadoopCloudera

2012-10-29 09:55:52

HadoopImpalaDremel

2015-02-05 10:01:11

ClouderaHadoop

2014-10-28 09:56:56

Hadoop

2017-04-19 11:17:48

SparkHadoopMapReduce

2014-02-14 16:06:05

ImpalaCloudera

2013-05-27 14:19:39

Hadoop

2013-11-01 09:25:19

大數(shù)據(jù)HadoopSpark

2018-10-12 14:01:14

點贊
收藏

51CTO技術(shù)棧公眾號