【愛分析專訪】蔣步星:超越Oracle必須顛覆原有技術體系,數(shù)據(jù)計算是第一步
在數(shù)據(jù)可視化的概念興起前,所謂數(shù)據(jù)的展現(xiàn)主要就是報表,當時中國各行業(yè)均處于信息化起步階段,而中國報表非常復雜、統(tǒng)計困難,很多國際巨頭軟件廠商都無法解決。
此時,有一家中國廠商橫空出世,以其***的非線性報表模型解決了中國報表問題,實現(xiàn)對國外廠商的超越,這就是蔣步星和他的潤乾。
蔣步星曾被稱為“數(shù)學天才”,是中國***國際數(shù)學奧利匹克競賽團體冠軍成員。從清華畢業(yè)后,先后供職于清華紫光和長天科技,于2001年創(chuàng)建潤乾。最初靠行業(yè)軟件養(yǎng)活團隊,但蔣步星一直想做的是通用軟件,不想做集成商賣別人的產(chǎn)品。
2002年底,蔣步星將報表工具作為切入點,研究了數(shù)千張報表,依靠深厚的數(shù)學功底,發(fā)現(xiàn)其中規(guī)律,一舉解決中國報表問題,大大提升IT人員制作報表的效率。
蔣步星沒有因為報表工具的成功而停止腳步,當時有兩條路可以選擇,一條路是向前端發(fā)展,做BI、可視化工具,很多國內(nèi)廠商選擇這條路,另一條是向后端發(fā)展,解決數(shù)據(jù)計算問題。
蔣步星認為,向前端走又會回到定制化的老路,還是要堅持做通用軟件的路線,因此選擇了更難的一條路,做數(shù)據(jù)計算。
過去,數(shù)據(jù)計算主要依賴Oracle等數(shù)據(jù)庫產(chǎn)品實現(xiàn),Hadoop的崛起,試圖去解決大規(guī)模數(shù)據(jù)計算問題,而中小規(guī)模的數(shù)據(jù)計算問題并沒有得到太多的關注,還是需要昂貴的數(shù)據(jù)庫產(chǎn)品來解決。
蔣步星將這個方向作為切入點,一方面這個問題是客戶剛需,能夠節(jié)省大量成本,另一方面也可以與報表產(chǎn)品結合起來,將底層數(shù)據(jù)處理問題解決好,有助于提升數(shù)據(jù)展現(xiàn)效果。
經(jīng)過幾年潛心研發(fā),潤乾在2015年發(fā)布數(shù)據(jù)計算產(chǎn)品——集算器,解決了數(shù)據(jù)計算在描述和實施上的效率問題。
對蔣步星而言,集算器只是一個開始,幫助潤乾從報表市場切入到數(shù)據(jù)計算這個更大的市場,替換Oracle等成為企業(yè)的數(shù)據(jù)倉庫和數(shù)據(jù)庫,才是***目標。
近期愛分析對蔣步星進行專訪,他分享了自己對報表軟件行業(yè)、數(shù)據(jù)計算行業(yè)的看法,現(xiàn)將精彩內(nèi)容分享。
堅持做軟件廠商,不做定制開發(fā)
愛分析:潤乾從2001年創(chuàng)立,到現(xiàn)在也是經(jīng)歷了十幾年發(fā)展,都經(jīng)歷了哪些階段?
蔣步星: 2001年初我從長天出來,2001年-2003年底,這是一個階段,這個階段其實我們在做行業(yè)軟件,主要是幫助其他高校做信息系統(tǒng)。
我一直想做通用軟件,這是在長天、紫光受了刺激,我覺得我們費老勁當集成商,***都在賣Oracle的數(shù)據(jù)庫,打來打去***都是人家廠商掙錢,我們不停地在出差。所以我們一定要把自己做到廠商的位置去,但找不到方向。
到2002年底,我們感覺到做報表工具是一個挺好的方向,國外勢力沒那么強,而且用戶有需求。所以,我們從2002年底開始做, 2004年初推出報表3版本。到2005年,這個業(yè)務就已經(jīng)盈虧平衡。
然后我立刻把教務系統(tǒng)那部分業(yè)務賣掉了。我的邏輯鏈在于,一定要做廠商,一定要拿光盤換支票,不要做定制開發(fā),不要到用戶那里做項目,產(chǎn)品永遠都是標準化的,這樣才能零成本復制。
2005年至2010年應該是報表業(yè)務發(fā)展比較好的階段,差不多翻了10倍。2011年至2015年,我們內(nèi)部管理層有業(yè)務分歧,這使得公司資源消耗比較嚴重,業(yè)務基本沒有增長,而且明顯感到競爭對手發(fā)展起來了。
2015年底,我們內(nèi)部做了調(diào)整,原來分歧的聲音消除掉了。2016年相當于重建了經(jīng)營隊伍,會是一個新階段。
現(xiàn)在,我們把經(jīng)營重點主要放在數(shù)據(jù)計算上了,我們2月份剛做了報表工具的降價,我降了30倍。公司內(nèi)外要營造一個氣氛,潤乾現(xiàn)在要開拓新業(yè)務,報表這個標簽就會產(chǎn)生障礙,我們現(xiàn)在想做數(shù)據(jù)計算業(yè)務。
愛分析:為什么潤乾做報表這項業(yè)務時,沒碰到什么競爭對手?
蔣步星:國外廠商是不會做報表的,幾方面原因:***,中國市場相對全球市場太小,國外廠商不會專門為中國企業(yè)開發(fā)相關產(chǎn)品的,只會把國外現(xiàn)成產(chǎn)品拿過來用;第二,中國人的報表需求非常復雜。
這個事情之所以被解決,這是我們擅長的,也是潤乾這公司的基因。我們自己發(fā)明了一套理論體系,研究了幾千張報表找規(guī)律。
愛分析:整個團隊現(xiàn)在有多少人?人員結構是什么樣的?
蔣步星:我們現(xiàn)在有70多人,人員還在擴。去年主要是磨合新的經(jīng)營團隊,磨合差不多了,今年就會擴張團隊。我們應該主要是兩部分,研發(fā)和銷售。我們研發(fā)有25人,銷售會多一些。
愛分析:下一步如果擴團隊的話,會主要增加哪部分人員?
蔣步星:研發(fā)人員今年可能不會增加了,售前人員會增加多一些,因為我們現(xiàn)在這個新產(chǎn)品,需要有足夠技術背景才能給客戶講清楚。
愛分析:所以這個產(chǎn)品在研發(fā)投入上不需要太多人?
蔣步星:坦白地說,我認為做這些事情都不需要很多人。我們現(xiàn)在20多人研發(fā)團隊,下半年就可以發(fā)布數(shù)據(jù)庫產(chǎn)品,另外我們還做了數(shù)據(jù)挖掘產(chǎn)品。主要是我們不需要太多交付人員,交付工作都交給集成商伙伴來做,這是我們的原則。
報表工具面向IT人員,更貼近客戶業(yè)務
愛分析:相比BI產(chǎn)品,報表產(chǎn)品會與客戶的業(yè)務更加貼近?
蔣步星:有各方面原因,一個是客戶沒有那么強烈的分析需求,他也不知道具體分析什么,另一個是數(shù)據(jù)相對混亂,不是那么整齊,要做多維分析,數(shù)據(jù)質(zhì)量還是要求很高。還有就是做多維分析要事先建模,但是客戶的業(yè)務還很不穩(wěn)定時,就沒辦法事先建模。
但報表這個產(chǎn)品,客戶總需要看他。而且中國人的報表設計得很豐富,一張報表能反映很多信息。所以,業(yè)務人員還是樂意看這個,使用比較簡單,輸入?yún)?shù)后我想看到的信息都在報表上有體現(xiàn)。
我見過很多上BI平臺的,有可視化、用戶自助出報表,但其實用得***,久經(jīng)考驗的還是那些固定報表。·
愛分析:國內(nèi)外企業(yè)在使用報表產(chǎn)品方面有哪些區(qū)別?
蔣步星:國內(nèi)大部分用戶可以支付得起定制化的成本,花50萬就會有人來做項目開發(fā)了,可以做出非常適合用戶需求的系統(tǒng)。這種場景下,國外BI廠商的產(chǎn)品就比不上這些定制開發(fā)的。
因此,國內(nèi)用戶更加需要可集成的工具,比如我們做報表工具,其實是中間件,并非直接面向終端用戶,需要開發(fā)人員二次開發(fā)將我們集成進去,這時候集成商就愿意用我們這種產(chǎn)品。
在國外,由于人工太貴,用戶一般支付不起這種定制開發(fā)的費用,只能購買這種接近成品的軟件,從這個角度來看,國外BI產(chǎn)品就有它合理之處了。
愛分析:其實,報表這個產(chǎn)品一般來說不會直接面向終端用戶?
蔣步星:是的,終端用戶看報表,但做報表的是集成商的程序員,我們其實是協(xié)助開發(fā)商,讓他更快地做報表。原先程序員寫代碼做報表可能需要一兩周,使用我們的產(chǎn)品可能只需要一天時間,極大提高效率,而且降低對程序員的要求。
愛分析:所以,從收費來說,我們是跟終端用戶收費還是集成商?
蔣步星:我們主要收入還是來自終端,我們與集成商配合,將產(chǎn)品做到解決方案中。其實,像數(shù)據(jù)庫這些產(chǎn)品也類似,終端用戶可能根本不會安裝Oracle,但他卻在買單,因為這是整個解決方案體系中的一個環(huán)節(jié)。
愛分析:現(xiàn)在來看,報表這塊兒的市場空間應該不大,幾個廠商加起來也就是幾億規(guī)模?
蔣步星:這個市場規(guī)模不大有很多原因,***,相比之前,做報表的廠商更多了,競爭更加激烈;第二,移動端快速發(fā)展,使得客戶對報表的復雜性要求在弱化。這些是我們必須轉(zhuǎn)型的原因。倒不是說,市場需求消失了,但市場的增長在放緩,甚至出現(xiàn)停止增長。
另外,報表可以算是可視化的一種基本技術,現(xiàn)在出現(xiàn)了大量開源的可視化技術,這就使得從營收角度來看,市場規(guī)模在變小,用戶發(fā)現(xiàn)使用開源技術也能實現(xiàn)類似需求,就不愿意再花錢購買報表產(chǎn)品了。
做數(shù)據(jù)庫從數(shù)據(jù)計算開始,替代Oracle計算能力
愛分析:數(shù)據(jù)庫市場是不是仍然以Oracle為主導?
蔣步星:銷售額是這樣的,去“IOE”中, EMC是最容易被去掉,IBM的小型機除了大型銀行的交易系統(tǒng)外,都可以被替代掉,就是數(shù)據(jù)庫很難去掉。
Oracle的確做得很好,各個數(shù)據(jù)庫的SQL語法不太一樣,那些不同的地方雖然不多,但是很關鍵。因為大量程序是數(shù)據(jù)處理是用數(shù)據(jù)庫的存儲過程來寫的,想復制出完全一樣的幾乎不可能,還不如徹底替換掉,但Oracle的優(yōu)化的確做得很好,不光是國產(chǎn)數(shù)據(jù)庫,放眼全球也很難比肩的。
愛分析:用新型Hadoop架構開發(fā)的數(shù)據(jù)庫有望超越Oracle么?
蔣步星:其實我們就是要做數(shù)據(jù)庫,做新型數(shù)據(jù)倉庫,我們會先從做計算開始,做集算器。
我個人認為國產(chǎn)數(shù)據(jù)庫沒什么機會超越,國產(chǎn)數(shù)據(jù)庫廠商的確有不少優(yōu)秀人才,但Oracle同樣很優(yōu)秀,而且資金雄厚。除非Oracle犯錯誤,要不然沒有機會。
但是,就算Oracle犯錯誤,頂上來的也未必國產(chǎn)數(shù)據(jù)庫,因為國外還有很多巨頭公司,不可能輪到排名10以外的廠商。因此,想超越Oracle必須要顛覆他,跟隨技術永遠沒希望。
想超越Oracle不能再用那個技術體系,那個體系被Oracle做了40多年,怎么可能有機會。
Hadoop這邊有一定可能性,但現(xiàn)在說還為時過早。數(shù)據(jù)庫功能大體分為兩部分:OLTP,這部分目前還只有關系數(shù)據(jù)庫能搞定;另一部分是OLAP,做計算分析的,這部分Hadoop有一些優(yōu)勢的。
Hadoop優(yōu)勢是建立在比較便宜的PC集群上,不像Oracle需要高端機,Hadoop這個體系相對要廉價一些,而且橫擴能力強,很多用戶都將Hadoop作為未來方向。
Hadoop如果用來做AI等迭代式計算是有優(yōu)勢的。做數(shù)據(jù)倉庫其實和傳統(tǒng)數(shù)據(jù)庫沒差別,MPP并不了太多機器,Hadoop做SQL也同樣如此,。
另外,Hadoop設計規(guī)模是面向超大集群,而非中小集群規(guī)模,但傳統(tǒng)數(shù)據(jù)倉庫的用戶沒有那么多數(shù)據(jù),用Hadoop有點殺雞用牛刀。所以,我們也沒用Hadoop體系,選擇自己做。
愛分析:那我們做集算器是如何構建的?
蔣步星:我們開始做報表,數(shù)據(jù)展現(xiàn)的確很頭疼,我們用非線性報表模型解決了展現(xiàn)問題。但發(fā)現(xiàn)做報表還是很頭疼,數(shù)據(jù)準備比展現(xiàn)還麻煩,原始數(shù)據(jù)與報表數(shù)據(jù)相差很遠,要寫很復雜的運算。當時業(yè)界沒有什么好辦法,大家都是要寫程序。
所以,我們打算做產(chǎn)品解決這個問題,數(shù)據(jù)準備就是數(shù)據(jù)計算,因此,我們做了一個數(shù)據(jù)計算引擎,自己設計一套程序語言,能讓寫這種計算比SQL、JAVA更容易一些,開始作為報表工具的輔助模塊。
后來我們發(fā)現(xiàn),計算本身就是更大市場,比數(shù)據(jù)展現(xiàn)應用面廣很多。所以,我們從技術把計算引擎獨立出來,在這個基礎上我們還可以發(fā)展數(shù)據(jù)庫、數(shù)據(jù)倉庫這些業(yè)務。
集算器這個產(chǎn)品就是想替代數(shù)據(jù)庫的計算能力,提供不依賴數(shù)據(jù)庫的計算能力。當然,這需要一段時間,目前我說服用戶徹底不用數(shù)據(jù)庫是有難度,所以集算器這個產(chǎn)品作為計算引擎出現(xiàn),是不太涉及存儲的,因此原始數(shù)據(jù)還可以放在原先的數(shù)據(jù)庫,集算器只是解決計算,原先客戶除了數(shù)據(jù)庫沒有什么特別好的計算工具,現(xiàn)在多了一個選擇,不一定非得用數(shù)據(jù)庫。
愛分析:所以集算器與報表服務客群是類似的?
蔣步星:其實是一樣的,跟報表也比較容易集成,因為很多時候計算就是為展現(xiàn)而服務的,而且我們現(xiàn)在都不忌諱集算器可以給競爭對手的報表產(chǎn)品提供數(shù)據(jù)。