自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

大數(shù)據(jù)相關(guān)開源系統(tǒng)簡(jiǎn)介匯總

大數(shù)據(jù)
本片博客介紹大數(shù)據(jù)相關(guān)的開源系統(tǒng)以及他們對(duì)應(yīng)的一句話簡(jiǎn)介, 對(duì)于各位想大概了解大數(shù)據(jù)都有哪些開源系統(tǒng)的同學(xué)有幫助。

如下是Apache基金支持的開源軟件

  1. hdfs
     
    跟GFS類似, 一個(gè)分布式文件系統(tǒng)。
     
  2. mapreduce
     
    跟Google的MapReduce類似, 一個(gè)典型的簡(jiǎn)單的分布式計(jì)算框架。
     
  3. yarn
     
    資源管理系統(tǒng), 跟Mesos類比。
     
  4. Avro
     
    跟PB類似, 用于將數(shù)據(jù)結(jié)構(gòu)序列化成字節(jié)碼, 在不同的語言之間切換。
     
    官方舉例是將C轉(zhuǎn)換給Pig。
     
  5. BigTop
     
    一個(gè)給Hadoop打包和測(cè)試的軟件。其本來是cloudera公司自己給自己寫的一個(gè)方便OP部署和搭建環(huán)境的工具, 不過因?yàn)閷懙貌诲e(cuò), 已經(jīng)成為了Apache***項(xiàng)目。目前支持系列Hadoop生態(tài)鏈中的軟件: Zookeeper, Flume, HBase, Pig, Hive, Sqoop, Oozie, Whirr, Mahout, SolrCloud, Crunch, DataFu and Hue
     
  6. Chukwa
     
    收集各種實(shí)時(shí)監(jiān)控?cái)?shù)據(jù)(比如日志)并固化到HDFS上的事情。
     
  7. Drill
     
    Google的Dremel的開源版本。PB以上數(shù)據(jù)實(shí)時(shí)秒級(jí)查詢。
     
  8. Flume
     
    用來做數(shù)據(jù)遷移的工具。支持?jǐn)?shù)據(jù)包括Avro, files, 系統(tǒng)日志, 落地的系統(tǒng)包括HDFS, HBase。
     
  9. HBase
     
    Google的BigTable的開源版本。寬列存儲(chǔ), 底層基于HDFS。
     
  10. HCatalog
     
    為HDFS做的一個(gè)管理metadata的系統(tǒng)。基于Hive, 提供服務(wù)給MapReduce, Pig, 將來會(huì)支持HBase。
     
  11. Hive
     
    支持HSQL, 將SQL轉(zhuǎn)換成MapReduce任務(wù)。
     
  12. Mahout
     
    一個(gè)數(shù)據(jù)挖掘, 機(jī)器分析的算法庫。
     
  13. Oozie
     
    用來管理Hadoop中的多輪任務(wù)的工具, 類似DAG管理工具。
     
  14. Tez
     
    也是多個(gè)任務(wù)的DAG管理工具, 但是其做得更底層,直接替代了MR的調(diào)度程序,多個(gè)任務(wù)之間的數(shù)據(jù)傳遞不用再落地到hdfs上了。
     
  15. Pig
     
    跟Hive類似, 提供比裸寫MR更友好的界面, 然后翻譯成MapReduce。只是Hive提供的是SQL, Pig提供的是更高級(jí)別的語言Pig-Latin, 供用戶做數(shù)據(jù)挖掘和分析。
     
  16. Sqoop
     
    Sql-to-Hadoop。將關(guān)系型數(shù)據(jù)庫中的數(shù)據(jù)導(dǎo)入到Hadoop當(dāng)中。
     
  17. ZooKeeper
     
    提供高可用的存儲(chǔ)服務(wù)。內(nèi)部采用paxos一致性協(xié)議。
     
  18. Whirr
     
    用于將Hadoop放到各種IaaS里面去運(yùn)行的環(huán)境部署類項(xiàng)目。
     
  19. Crunch
     
    用來管理Hadoop/Spark上面的Pipeline的軟件。應(yīng)該是比Pig/Hive更低一個(gè)級(jí)別的抽象, 提供數(shù)據(jù)的join/aggregation的Java API。
     
  20. DataFu
     
    為Pig而準(zhǔn)備的系列數(shù)據(jù)挖掘算法軟件包。
     
  21. Hue
     
    Hadoop的漂亮平臺(tái)化界面。

如下是非Apache組織的一些項(xiàng)目

  1. Spark
     
    支持迭代式計(jì)算。將MapReduce的一輪一輪計(jì)算的概念轉(zhuǎn)換成同一批數(shù)據(jù)不停處理的概念, 并提供高級(jí)語言。
     
  2. Shark
     
    Hive On Spark。即支持HSQL。
     
  3. Impala(Cloudera)
     
    另一個(gè)Google的Dremel的開源版本, 界面跟Hive類似(事實(shí)上就是使用的Hive-SQL的子集), 只是不是翻譯成MapReduce而是直接查詢。
     
  4. Sentry(Cloudera)
     
    在Hive/Impala之上獨(dú)立的一層專門做認(rèn)證授權(quán)的系統(tǒng)。
     
  5. SolrCloud
     
    Solr+Hadoop, Big Data Search。

 

責(zé)任編輯:李英杰 來源: cnblogs
相關(guān)推薦

2018-02-23 16:38:58

2012-07-04 11:47:39

大數(shù)據(jù)開源

2019-02-20 23:06:56

大數(shù)據(jù)數(shù)據(jù)語言

2023-11-24 08:02:28

2013-08-14 09:48:02

微軟REEF

2018-06-05 12:06:20

Hadoop開源工具

2012-09-13 09:52:14

大數(shù)據(jù)數(shù)據(jù)應(yīng)用開源工具

2019-04-08 17:16:43

大數(shù)據(jù)開源工具

2009-08-07 18:07:58

C#數(shù)據(jù)庫開發(fā)

2011-04-22 10:53:13

Unix哲學(xué)

2011-04-01 10:35:16

BlackBerry BlackBerry

2014-04-29 09:59:44

2012-04-01 14:57:46

2013-05-22 14:02:34

2022-08-01 11:08:35

自動(dòng)駕駛數(shù)據(jù)

2023-11-27 09:49:37

自動(dòng)駕駛數(shù)據(jù)

2022-08-22 11:34:42

開源數(shù)據(jù)

2018-11-19 12:58:47

大數(shù)據(jù)技術(shù)Java

2018-06-06 15:00:27

開源大數(shù)據(jù)大數(shù)據(jù)項(xiàng)目

2016-09-27 21:35:28

BossiesSparkTensorFlow
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)