自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

大數(shù)據(jù)與Hadoop的五大優(yōu)勢

大數(shù)據(jù) Hadoop
雖然Google和Facebook等大型Web2.0公司使用Hadoop來存儲和管理其龐大的數(shù)據(jù)集,但Hadoop基于其五大優(yōu)勢也被證明對許多其他更傳統(tǒng)的企業(yè)很有價值。

Hadoop與競爭對手相比有哪些優(yōu)勢?

到目前為止,人們可能已經(jīng)聽說過ApacheHadoop。這個名字來源于一只可愛的玩具大象,但Hadoop只不過是一個毛絨玩具。Hadoop是一個開源軟件項目,它提供了一種存儲和處理大數(shù)據(jù)的新方法。

Hadoop軟件框架是用Java編寫的,用于在由商用硬件構(gòu)建的計算機(jī)集群上對超大型數(shù)據(jù)集進(jìn)行分布式存儲和分布式處理。

雖然Google和Facebook等大型Web2.0公司使用Hadoop來存儲和管理其龐大的數(shù)據(jù)集,但Hadoop基于其五大優(yōu)勢也被證明對許多其他更傳統(tǒng)的企業(yè)很有價值。

以下來看看。

1. Hadoop是可擴(kuò)展的

Hadoop是一個高度可擴(kuò)展的存儲平臺,因為它可以在數(shù)百臺并行運行的廉價服務(wù)器上存儲和分發(fā)非常大的數(shù)據(jù)集。

與無法擴(kuò)展以處理大量數(shù)據(jù)的傳統(tǒng)關(guān)系數(shù)據(jù)庫系統(tǒng)(RDBMS)不同,Hadoop使企業(yè)能夠在涉及數(shù)千TB數(shù)據(jù)的數(shù)千個節(jié)點上運行應(yīng)用程序。

2. 成本效益

Hadoop還為企業(yè)爆炸式數(shù)據(jù)集提供了一種經(jīng)濟(jì)高效的存儲解決方案。傳統(tǒng)關(guān)系數(shù)據(jù)庫管理系統(tǒng)的問題在于,為了處理如此大量的數(shù)據(jù),擴(kuò)展至如此程度的成本極其昂貴。

為了降低成本,過去許多公司不得不對數(shù)據(jù)進(jìn)行下采樣,并根據(jù)某些關(guān)于哪些數(shù)據(jù)最有價值的假設(shè)對其進(jìn)行分類。

原始數(shù)據(jù)將被刪除,因為保留它的成本太高。雖然這種方法可能在短期內(nèi)奏效,但這意味著當(dāng)業(yè)務(wù)優(yōu)先級發(fā)生變化時,完整的原始數(shù)據(jù)集將不可用,因為存儲成本太高。另一方面,Hadoop被設(shè)計為一種橫向擴(kuò)展架構(gòu),可以經(jīng)濟(jì)地存儲公司的所有數(shù)據(jù)以供以后使用。

成本節(jié)省是驚人的:Hadoop提供的計算和存儲功能不是每TB數(shù)千到數(shù)萬英鎊,而是提供了數(shù)百英鎊/TB的計算和存儲能力。

3. 靈活

Hadoop使企業(yè)能夠輕松訪問新數(shù)據(jù)源并利用不同類型的數(shù)據(jù)(結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù))從這些數(shù)據(jù)中產(chǎn)生價值。

這意味著企業(yè)可以使用Hadoop從社交媒體、電子郵件對話或點擊流數(shù)據(jù)等數(shù)據(jù)源中獲得有價值的業(yè)務(wù)洞察力。此外,Hadoop可用于多種用途,例如日志處理、推薦系統(tǒng)、數(shù)據(jù)倉庫、市場活動分析和欺詐檢測

4. Hadoop速度快

Hadoop獨特的存儲方法基于分布式文件系統(tǒng),該系統(tǒng)基本上“映射”數(shù)據(jù)位于集群上的任何位置。數(shù)據(jù)處理工具通常位于數(shù)據(jù)所在的同一臺服務(wù)器上,從而加快了數(shù)據(jù)處理速度。

如果您正在處理大量的非結(jié)構(gòu)化數(shù)據(jù),Hadoop能夠在幾分鐘內(nèi)有效地處理TB級數(shù)據(jù),并在幾小時內(nèi)有效處理PB級數(shù)據(jù)。

5. 對失敗有彈性

使用Hadoop的一個關(guān)鍵優(yōu)勢是它的容錯性。當(dāng)數(shù)據(jù)發(fā)送到單個節(jié)點時,該數(shù)據(jù)也會復(fù)制到集群中的其他節(jié)點,這意味著在發(fā)生故障時,還有另一個副本可供使用。

MapR發(fā)行版超越了這一點,它消除了NameNode并將其替換為提供真正高可用性的分布式NoNameNode架構(gòu)。我們的架構(gòu)提供針對單個和多個故障的保護(hù)。

在以安全且經(jīng)濟(jì)高效的方式處理大型數(shù)據(jù)集方面,Hadoop具有優(yōu)于關(guān)系數(shù)據(jù)庫管理系統(tǒng)的優(yōu)勢,并且隨著非結(jié)構(gòu)化數(shù)據(jù)的不斷增長,它對任何規(guī)模的企業(yè)的價值都將繼續(xù)增加。

責(zé)任編輯:趙寧寧 來源: 機(jī)房360
點贊
收藏

51CTO技術(shù)棧公眾號