自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

Hadoop雖然強大,但不是萬能的

數(shù)據庫 Hadoop
隨著 Hadoop 應用的不斷拓展,使很多人陷入了對它的盲目崇拜中,認為它能解決一切問題。雖然Hadoop是一個偉大的分布式大型數(shù)據計算的框架,但Hadoop不是萬能的。比如在下面這幾種場景就不適合使用Hadoop。

在下面這幾種場景就不適合使用Hadoop:

1、低延遲的數(shù)據訪問

Hadoop并不適用于需要實時查詢和低延遲的數(shù)據訪問。數(shù)據庫通過索引記錄可以降低延遲和快速響應,這一點單純的用Hadoop是沒有辦法代替的。但是如果你真的想要取代一個實時數(shù)據庫,可以嘗試一下HBase來實現(xiàn)數(shù)據庫實時讀寫。

2、結構化數(shù)據

Hadoop不適用于結構化數(shù)據,卻非常適用于半結構化和非結構化數(shù)據。Hadoop和RDBMS不同,一般采用分布式存儲,因此在查詢處理的時候將會面臨延遲問題。

3、數(shù)據量并不大的時候

Hadoop一般適用于多大的數(shù)據量呢?答案是:TB 或者PB。當你的數(shù)據只有幾十GB時,使用Hadoop是沒有任何好處的。按照企業(yè)的需求有選擇性的的使用Hadoop,不要盲目追隨潮流。Hadoop很強大。但企業(yè)在使用Hadoop或者大數(shù)據之前,首先要明確自己的目標,再確定是否選對了工具。

[[108691]]

4、大量的小文件

小文件指的是那些size比HDFS的block size(默認64M)小得多的文件。如果在HDFS中存儲大量的小文件,每一個個文件對應一個block,那么就將要消耗namenode大量的內存來保存這些block的信息。如果小文件規(guī)模再大一些,那么將會超出現(xiàn)階段計算機硬件所能滿足的極限。

5、太多的寫入和文件更新

HDFS是采用的一些多讀方式。當有太多文件更新需求,Hadoop沒有辦法支持。

6、MapReduce可能不是***的選擇

MapReduce是一個簡單的并行編程模型。是大數(shù)據并行計算的利器,但很多的計算任務、工作及算法從本質上來說就是不適合使用MapReduce框架的。

如果你讓數(shù)據共享在MapReduce,你可以這樣做:

迭代:運行多個 MapReduce jobs ,前一個 MapReduce 的輸出結果,作為下一個 MapReduce 的輸入。

共享狀態(tài)信息:但不要分享信息在內存中,由于每個MapReduce的工作是在單個JVM上運行。

原文鏈接:http://www.36dsj.com/archives/5926

責任編輯:彭凡 來源: 36大數(shù)據
相關推薦

2022-11-30 13:13:41

節(jié)能減碳PUE

2021-11-11 10:41:25

代碼開發(fā)工具

2021-09-04 00:11:32

大數(shù)據Hadoop工具

2009-06-22 09:16:00

無線網絡加密網絡安全

2020-10-18 12:36:06

Python開發(fā)函數(shù)

2009-03-19 09:02:44

2013-11-05 09:27:27

ClouderaHadoop數(shù)據解決方案

2024-03-06 11:16:10

2016-11-24 12:07:42

Android萬能圓角ImageView

2017-09-07 14:15:28

2011-06-16 15:57:25

Android

2022-06-27 08:36:08

PythonLambda

2009-12-03 18:13:36

PHP萬能密碼

2021-08-28 23:26:14

程序員編碼電腦

2022-11-21 09:57:18

網關系統(tǒng)

2020-06-16 08:32:00

人工智能技術機器學習

2022-06-23 18:10:15

多云

2009-02-27 13:48:00

Mdaemon郵件服務器

2015-08-26 13:49:28

數(shù)據中心

2024-12-09 09:25:30

點贊
收藏

51CTO技術棧公眾號