自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

Ness SES首席技術官:最終,Hadoop老了!

大數(shù)據 Hadoop
對于Hadoop飄忽不定的未來,Ness SES的首席技術官(CTO)Moshe Kranc寫下了這篇文章。計算機世界充斥著大量先動者的產品,但最終都會被追隨者所取代,后來者從創(chuàng)新者的錯誤中學習并繼續(xù)發(fā)展。我相信這是Hadoop的命運,因為Spark和Cassandra等已經在大數(shù)據社區(qū)獲得了持續(xù)發(fā)展的動力。

對于Hadoop飄忽不定的未來,Ness SES的***技術官(CTO)Moshe Kranc寫下了這篇文章。

計算機世界充斥著大量先動者的產品,但最終都會被追隨者所取代,后來者從創(chuàng)新者的錯誤中學習并繼續(xù)發(fā)展。我相信這是Hadoop的命運,因為Spark和Cassandra等已經在大數(shù)據社區(qū)獲得了持續(xù)發(fā)展的動力。

為了證明上述觀點,我需要先來講一點歷史。

“Hadoop作為一個概念徹底改變了數(shù)據處理世界,并最終迎來了大數(shù)據時代!”

大約20年前,Doug Cutting在創(chuàng)建Web搜索引擎時面臨兩大問題:

  1. 如何可靠地存儲所有信息?
  2. 如何創(chuàng)建大量查找索引?

之后,Hadoop誕生了。它包括分布式、高可用的文件系統(tǒng)和用于大規(guī)模并行計算的Map-Reduce框架。

[[221914]]

MapReduce確實是革命性的,它讓曾經難以解決的問題可以在幾分鐘內被解決。但是,它沒有利用內存來提高性能,并且在處理增量更改時很糟糕,例如,將單個新推文的索引添加到現(xiàn)有的完整Web索引。

隨著時間的推移,Hadoop用Tez取代了原來的MapReduce框架,Tez使用定向非循環(huán)圖進行并行處理,理論基于微軟2010年有關Dryad的論文。但是,Tez已經被另一款產品搶先了,這款產品就是Spark。Spark的實現(xiàn)更通用,例如,可以有效檢查和恢復各計算階段的數(shù)據。Spark可以運行在Hadoop生態(tài)系統(tǒng)中(它很快將取代Tez),或者它可以在自己的獨立環(huán)境中運行。越來越多的項目選擇Spark作為其大數(shù)據解決方案,將Hadoop Spark或Spark standalone作為次要選擇。目前超過25%的Spark項目在Hadoop之外運行,并且這一比例在不斷上升。

很多大數(shù)據人士堅信Haoop會有一個光明年代,認為Spark和Hadoop根本沒有可比性,不愿意承認Hadoop的年代感。

Hadoop文件系統(tǒng)(HDFS)也在展示其年代感。例如,它需要一個活動的NameNode才能運行,并且它使用Zookeeper來監(jiān)控NameNode可用性。因此,當Zookeeper檢測到活動的NameNode崩潰時,它可能會經歷長達一分鐘的“斷電”。Hadoop已經發(fā)展出提高可用性的機制,但其他大數(shù)據系統(tǒng)(如Cassandra's)早已實現(xiàn)了高可用性,而無需主節(jié)點或外部監(jiān)控工具,從而消除掉電風險。

 

[[221915]]

大數(shù)據領域的趨勢越來越明顯。Hadoop作為一個概念徹底改變了數(shù)據處理世界,迎來了大數(shù)據時代。但是,作為一個產品和生態(tài)系統(tǒng)的Hadoop正在顯示其年代感,對于許多用例來說,它已經被Spark等更現(xiàn)代的技術所取代,后者可以從Hadoop不斷增長的痛苦中學習。Spark具有更通用和可擴展的編程模型,這使得它更易于分析。它還可以通過Spark Streaming處理Motion中的大數(shù)據,并作為強大圖形數(shù)據庫(GraphX)和全功能數(shù)據科學庫(MLib)的基礎。

也許這就解釋了最近Gartner報告的發(fā)現(xiàn),盡管對大數(shù)據解決方案的需求在不斷增長,但對Hadoop的需求并沒有像預期那樣加速,企業(yè)對Hadoop的熱情很低。

事實上,絕大多數(shù)接受調查的企業(yè)表示他們現(xiàn)在或未來都沒有計劃投資Hadoop。所以,盡管Spark,Cassandra和MongoDB等其他大數(shù)據技術仍然吸引了很多公司的興趣,但Hadoop似乎正在遭受需求下滑的困擾。

領先的Hadoop廠商Cloudera和Hortonworks可能仍然有很高的估值,但他們花費太多的時間去發(fā)展每個新客戶,并且還沒有突破到主流企業(yè)。

為什么對Hadoop缺乏熱情?一些分析師指責總擁有成本較高,另一些則認為是尋找具備必要技能的工程師存在困難。對我而言,這些只是說Hadoop正在顯示其年齡感的不同方式。與任何具備20年歷史的軟件系統(tǒng)一樣,Hadoop多年來也在不斷發(fā)展,每一次演變都使生態(tài)系統(tǒng)更加復雜,難以部署或維護。像Spark這樣的新系統(tǒng)具有更年輕和更健壯的代碼庫,對年輕的工程師而言,Spark等現(xiàn)代工具擁有比Hadoop更易于使用的現(xiàn)代編程API范例。

沒有Hadoop,Spark和Cassandra恐怕不會取得現(xiàn)在的成績。對Hadoop感恩的同時,我們或許要開始學會遺忘Hadoop,畢竟,它已經不年輕了。

責任編輯:未麗燕 來源: it168網站
相關推薦

2020-02-27 11:41:54

IT安全網絡攻擊網絡安全

2017-11-21 11:19:08

首席分析官首席數(shù)字官首席數(shù)據官

2013-07-01 10:04:26

Intel首席技術官Justin Ratt

2014-01-24 09:59:09

VMware

2021-11-01 10:12:17

首席信息官技術發(fā)展企業(yè)管理者

2022-02-18 11:06:12

首席技術官技術人工智能

2017-09-08 17:22:49

互聯(lián)網

2010-05-10 10:51:52

2023-01-04 08:55:46

2023-07-03 08:00:00

現(xiàn)場首席技術官軟件開發(fā)

2021-05-11 10:33:17

首席信息官首席財務官CIO

2021-11-17 10:11:21

首席信息官首席信息安全網絡安全

2020-02-03 12:08:23

數(shù)字化協(xié)作Gartner

2023-07-11 07:00:00

首席信息官首席技術官營業(yè)利潤率

2022-08-08 10:49:31

首席信息官數(shù)據經濟軟件開發(fā)

2020-12-24 10:49:00

首席信息官首席信息安全官IT

2014-11-19 13:05:04

2012-06-28 10:37:43

微軟古普達

2015-02-26 14:35:00

CSOCIO首席安全官

2023-10-31 14:41:06

CTO首席轉型官
點贊
收藏

51CTO技術棧公眾號