開源Hadoop較高下:IBM與AWS關鍵看啥?
就大數(shù)據(jù)的核心而言,Hadoop是一個用于有效存儲和處理大數(shù)據(jù)的開源架構。多年來,開源初創(chuàng)公司Cloudera和Hortonworks在Hadoop市場一直占有絕對地位,諸如Oracle、微軟以及其他一些公司也想在這個市場占有一席之地,但更多是通過與專業(yè)的Hadoop初創(chuàng)公司建立伙伴關系間接地參與市場爭奪。
大數(shù)據(jù)核心(圖片來源google)
根據(jù)Forrester分析的***報告,傳統(tǒng)技術供應商會推出一系列強勢的產(chǎn)品戰(zhàn)略,即使所推出的Hadoop產(chǎn)品仍有許多有待完善的地方。但廠商們卻希望提供基于開源項目的穩(wěn)定產(chǎn)品,直接通過開源技術的合作而獲取產(chǎn)品成果,但可由于在開源領域所做的貢獻太少,因此也很難有太大的影響力。
Hadoop:不是選配而是發(fā)展趨勢
正確把握Hadoop發(fā)展趨勢并不難,就像Forrester說的那樣,Hadoop未來的發(fā)展主要取決于不斷變化的數(shù)據(jù)基礎設施,而且Hadoop已經(jīng)成為“未來靈活數(shù)據(jù)管理平臺的基石”。對技術供應商而言,想要跟上如今企業(yè)的步伐,它只需要一份關于Hadoop的報告。
企業(yè)對Hadoop之說以感興趣,因為它使企業(yè)能夠以較少的成本來存儲和分析大量數(shù)據(jù)。根據(jù)Forrester發(fā)現(xiàn),企業(yè)目前分析的數(shù)據(jù)只占到企業(yè)總數(shù)據(jù)的12%,是由于企業(yè)不知道該如何處理數(shù)據(jù)造成的。
Hadoop可以輕松實現(xiàn)大數(shù)據(jù),因為它支持企業(yè)以更低的成本存儲數(shù)據(jù),一旦它們找到分析數(shù)據(jù)的***辦法,就可以對數(shù)據(jù)進行處理。
即便如此,一些企業(yè)將Hadoop看作“無人監(jiān)管的數(shù)字垃圾場”,隨著越來越了解Hadoop和大數(shù)據(jù),企業(yè)將Hadoop的分析能力與NoSQL實時數(shù)據(jù)處理引擎結合在一起,用以從企業(yè)數(shù)據(jù)中收集有價值的部分,并及時采取行動。
對于Hadoop領域未來發(fā)展,什么樣的供應商值得關注?#p#
但Forrester建議我們不要僅僅關注那些在Hadoop上投入大量資金的供應商。
在開源領域,提供代碼源甚至要比占有源碼更為重要。同樣,專有軟件供應商靠軟件授權收費,因為它對自己知識產(chǎn)權保密,開源供應商的市場力量與供應商對開源項目的影響力有直接關聯(lián),特別是對知識產(chǎn)權的把控上。
圖片來源readwrite.com
對于Forrester的分析也有一些不同的觀點。MongoDB副總裁Matt Asay表示:不要只注重供應商Hadoop服務的當前狀態(tài),F(xiàn)orrester暗示未來真正的贏家應該是IBM、AWS和Pivotal這樣的大型技術公司,而Hadoop初創(chuàng)公司對Hadoop發(fā)展作出的貢獻***。
出人意料的是,盡管“戰(zhàn)略”包括了許可、定價、執(zhí)行力、產(chǎn)品路線圖和客戶支持,F(xiàn)orrester對所有公司的社區(qū)擴展活動不作任何評論。像之前ReadWrite報道的那樣,由于對Hadoop發(fā)展貢獻的很少,像IBM和AWS這樣的供應商很難決定Hadoop發(fā)展的方向,Hadoop創(chuàng)始人Doug Cutting斷言:
我不期盼所有公司都為社區(qū)貢獻一個項目,但那些不作出貢獻的在Hadoop領域?qū)]有發(fā)言權。
同樣,Hortonworks***執(zhí)行官Rob Bearden表示:社區(qū)是保證Hadoop技術精密聯(lián)系的關鍵。
Hadoop正在逐漸成為數(shù)據(jù)體系結構的核心基石,而且我們?nèi)詴ψ龀鲐暙I回報社區(qū),確保新Hadoop內(nèi)核能夠?qū)摿υ谙乱淮鷶?shù)據(jù)平臺上發(fā)揮出來。#p#
開源領域也并非完全公平。例如亞馬遜在MySQL上投入了大量的資金,比MySQL或者Oracle花的還多。同樣,IBM在Linux上花的錢比Linux領域的***Red Hat還多。
但Forrester的觀點可能也不完全正確,例如,在“客戶支持”領域,Hortonworks的貢獻可以打滿分,因為Hortonworks為Hadoop社區(qū)貢獻了很多代碼,但Pivotal和IBM也獲得相應的分值,這似乎并不具備說服力。
Forrester分析覺得IBM與AWS為Hadoop專有產(chǎn)品提供更好的客戶支持。但那些對開源項目發(fā)展沒有多少貢獻的供應商,它們的客戶支持能力也無法和投入很多的供應商相提并論。盡管IBM、Amazon和其他公司將來會構建基于Hadoop的優(yōu)質(zhì)服務,但難以提供很好的客戶支持,因為總是被迫成為Hadoop追隨者,而不是***。
Hadoop技術中強者(圖片來源edureka.in)
Forrester針對Hadoop供應商排名與Hadoop本身關系不大,更多與Hadoop如何融入公司長期產(chǎn)品戰(zhàn)略相關,比如IBM的產(chǎn)品戰(zhàn)略,從產(chǎn)品路線圖看到包括繼續(xù)將IBM其他產(chǎn)品(如SPSS高級分析,高性能計算工作的負載管理、BI工具以及數(shù)據(jù)管理和建模工具)與BigInsights Hadoop解決方案集成。
Hadoop對這些供應商而言,只是一個很好的補充而不是主要部分。
IBM、AWS等廠商盡管通過Hadoop豐富其產(chǎn)品會從市場獲利,但對于那些想要從Hadoop本身獲得價值的公司,可能更容易從對Hadoop發(fā)展貢獻較大的企業(yè)(Cloudera和Hortonworks)獲得好處,并且為Hadoop提供更好的支持。筆者認為IBM、AWS等廠商利用開源Hadoop技術完善產(chǎn)品推廣市場并無問題,但為用戶提供***技術支持推動Hadoop社區(qū)長久并發(fā)展下去才是長遠之計。