Greenplum開源背后的驅(qū)動力是什么
近來社區(qū)消息比較多,有社區(qū)朋友建議能多寫點文章,給大家傳遞一些社區(qū)的最新信息。第一篇文章先來談談greenplum開源的事情。
這幾天最大的消息莫過于greenplum的開源,年初開始pivotal就宣布了greenplum的開源,經(jīng)過大半年的翹首等待,終于在十月底在歐洲的Postgres大會宣布開源,并兌現(xiàn)在github上開放代碼,社區(qū)的官網(wǎng)為http://greenplum.org/,其官方博客也有提到相關(guān)事項。代碼是采用apache許可,今天已經(jīng)有社區(qū)的朋友嘗鮮從社區(qū)取下代碼,在greenplum上測試了tpch的性能,雖然測試比較粗糙但是結(jié)果基本和商業(yè)版的一樣,印證了之前greenplum將走向全開源的消息。雖然里面關(guān)鍵的新一代優(yōu)化器orca還沒有看到代碼,但據(jù)消息這部分后續(xù)也會開出來,估計這個是其對這個最核心資產(chǎn)的一個謹慎的操作。
總體的印象來看,其采取開放的apache許可,代碼基本上無保留開源,這次的開源更大程度是公司層面的戰(zhàn)略行為,而不是簡單的市場推廣的戰(zhàn)術(shù)行為。
greenplum的開源,在我看來有幾個驅(qū)動力。
首先是受其cloud foundry開源戰(zhàn)略成功的驅(qū)動。pivotal在整個emc聯(lián)邦的定位來說是偏中間件這一層,emc是存儲,vmware是虛擬化,pivotal要搞定的是PaaS。而pivotal的業(yè)務上來說,要把云和大數(shù)據(jù)這兩個支柱搞定,才能把emc聯(lián)邦的疆域穩(wěn)定下來。云這一層來說vmware已經(jīng)是私有云的霸主,而剩下的上層PaaS這一層如果落入他人之手對其來說也是一個大威脅,所以PaaS這一層也是志在必得。鑒于當時已經(jīng)在市場有很多對手,2011年的時候cloudfoundry啟動是以開源的模式來去做,把IBM和HP拉上。這個戰(zhàn)略取得了出人意料的巨大成功,現(xiàn)在CF幾乎要變成了PaaS的事實標準,IBM也推出了基于CF的bluemix產(chǎn)品,而pivotal在今年發(fā)布的2014年的財報,極為惹眼的標題:破紀錄的2014年,史上最快的開源產(chǎn)品銷售增長( http://finance.yahoo.com/news/pivotal-cloud-foundry-reports-record-160000128.html )在短短的一年里,就獲得4千萬美金的軟件銷售收入,另外也獲得了財富500強中的100個客戶!這對于基礎(chǔ)軟件來說,基本是神話。說了這么多,無外乎就是給大家強調(diào)一下,整個pivotal在cloudfoudry的巨大成功下,對于開源的認識已經(jīng)到了商業(yè)戰(zhàn)略的層次,已經(jīng)不需要去討論要不要開源,開源已經(jīng)成為殺手級的武器!在此背景下我們來去理解greenplum的開源才更容易理解。
其次,Pivotal的大數(shù)據(jù)戰(zhàn)場,需要新的戰(zhàn)略調(diào)整。上面提到,除了云以外,Pivotal的戰(zhàn)略重心是大數(shù)據(jù),Pivotal除了有自己的hadoop發(fā)行版以外還有g(shù)reenplum作為大數(shù)據(jù)最重要的資產(chǎn)。但是大數(shù)據(jù)整個市場都不是太理想,Hadoop發(fā)行版除了有Cloudera,Hortonworks,MapR這三個第三方發(fā)行版以外,還有Pivotal,IBM,Intel這些廠商本身的發(fā)行版,市場最突出的問題是碎片化(fragmented),Hadoop的門檻低,廠商林立,同質(zhì)化嚴重,不僅僅難以溢價出售,傳統(tǒng)大廠商靠溢價銷售基礎(chǔ)軟件獲取超額利益的路子開始行不通;更為重要的是越來越多的客戶傾向于使用第三方獨立的發(fā)行版,道理不難理解,用戶更希望的是Linux生態(tài)里面有Redhat和SuSe這樣的發(fā)行廠商,而不希望類似AIX或者是Windows Server這種由廠商控制的生態(tài),這個更加加劇了廠商面臨的困境。Intel由于其發(fā)行版的糟糕市場表現(xiàn),開始陸續(xù)解散自己的Hadoop團隊,國內(nèi)的星環(huán)就是在這個背景下誕生,2014年Intel重金投資Cloudera 7.4億美金取得18%的股權(quán),Dell也投入Cloudera的陣營,HP、微軟、Teradata則傾向于直接使用Hortonworks的發(fā)行版,HP還投資了Hortonworks。但是Cloudera的優(yōu)勢明顯,營收是Hortonworks的將近一倍,Cloudera儼然有成為Hadoop生態(tài)的新的霸主的陣勢,市場格局開始慢慢固化,Intel有可能是這場戰(zhàn)役的贏家。在這樣的市場格局里面,Pivotal的困境可想而知,HD的發(fā)行版肯定需要重新調(diào)整策略,所以Pivotal聯(lián)合IBM、GE等15個弱勢玩家, 在今年3月宣告成立ODP(Open Data Platform)組織,本質(zhì)上是希望通過支持Hortonworks抗衡Cloudera,取得平衡。但是這個賭注的勝算并不明顯,Cloudera的CEO甚至公開嘲諷ODP,說其出現(xiàn)本身就是Cloudera的一個勝利( https://gigaom.com/2015/03/03/cloudera-ceo-declares-victory-over-big-data-competition/ ),Greenplum的開源正是作為ODP的砝碼而出現(xiàn),Pivotal決定把HD發(fā)行版、Gemfire、HAWQ還有Greenplum開源,所以從這個角度我們看到,Greenplum的開源本身,就是Pivotal希望贏回這場戰(zhàn)役的一個砝碼,對其而言,越多人用越好,沒有必要隱藏任何功能。
其實在Greenplum開源之前,MPP數(shù)據(jù)庫的日子也并不好過,也是市場碎片化,每個廠家也就區(qū)區(qū)幾千萬美金的營收,市場難以有大的突破,傳統(tǒng)豐厚的DW市場也難以打入,Hadoop生態(tài)又是以開源為主,甚至很多類似Impala這樣的產(chǎn)品也在做其類似的功能,傳統(tǒng)的打不開,新市場又難以全面打開,而且競爭重重,進退兩難。而Greenplum十多年來的架構(gòu)也無力進行大的調(diào)整。正是在這樣的背景下,倒不如開源,盤活大局。下面這篇文章稱其舉動為open sourcing code is the modern graceful way to retire an unprofitable product line (http://skylandtech.net/2015/02/24/thinking-about-the-pivotal-announcements/)
Greenplum的開源應該是相對比較激進和帶有攻擊性(aggressive)一著棋,成敗難料,但對于整個生態(tài)會有比較大的影響,下篇文章里我再給大家分享一下我對于其影響的看法。