國產(chǎn)關(guān)系型數(shù)據(jù)庫大調(diào)查
隨著信創(chuàng)改造的深化及國產(chǎn)軟件興起,越來越多的國產(chǎn)數(shù)據(jù)庫受到大家的關(guān)注。近期看到網(wǎng)上幾篇關(guān)于國產(chǎn)數(shù)據(jù)庫代碼起源、開源情況的文章很火,想必廣大企業(yè)用戶也很關(guān)注這些問題。下文從墨天輪社區(qū)及各數(shù)據(jù)庫廠商官網(wǎng)收集信息,共收錄國產(chǎn)關(guān)系型數(shù)據(jù)庫165家;對信息分析供參考。
? 部分廠家產(chǎn)品采用單一品牌多款產(chǎn)品形式,統(tǒng)計(jì)時(shí)會拆分處理。
1. 大調(diào)查:總覽篇
1).流行度
墨天輪社區(qū)提供了流行度評分,其計(jì)算方式是參考搜索引擎、趨勢指數(shù)、三方評測、生態(tài)(社區(qū)、高校合作、培訓(xùn)認(rèn)證等)情況、專利數(shù)、論文數(shù)、招聘崗位數(shù)、書籍搜索量、海外機(jī)構(gòu)排名(Gartner、IDC)綜合得到的分?jǐn)?shù)。從上述評分可以反映產(chǎn)品流行程度。從下圖反映的情況來看,頭部聚集效應(yīng)凸顯,前十名的產(chǎn)品流行度總體占比超72%,前二十名產(chǎn)品的流行度總體占比超82%。
2).地域分布
從地區(qū)分布來看,頭部效應(yīng)更加明顯。北京占比最高,在收集的165家企業(yè)中,超半數(shù)坐落于北京;深圳、上海、杭州也聚集部分廠商。企業(yè)地域聚集現(xiàn)象,一方面與人才市場因素有關(guān),一方面也是很多數(shù)據(jù)庫企業(yè)來自于互聯(lián)網(wǎng)或傳統(tǒng)行業(yè)大廠,與這些大廠分布也有關(guān)。
如果加上數(shù)據(jù)庫流行度評分,各地域的差異就沒那么明顯,深圳、杭州表現(xiàn)突出,武漢和天津則有幾個(gè)排名靠前的數(shù)據(jù)庫頭部廠商。
3).使用場景
傳統(tǒng)數(shù)據(jù)庫的使用場景,主要分為OLTP和OLAP。如今,更多細(xì)化的場景沒提出,如近年比較火的HTAP。很多數(shù)據(jù)庫產(chǎn)品是可以滿足多種場景,統(tǒng)計(jì)中按照支持場景進(jìn)行分類。如單產(chǎn)品支持多場景或有細(xì)分產(chǎn)品滿足此場景,會單獨(dú)統(tǒng)計(jì)。從下左圖可見,OLTP仍然是主流場景,OLAP次之,HTAP也作為很多新產(chǎn)品主打的理念。如果在疊加上流行度因素,如下右圖可見,支持HTAP產(chǎn)品的流行度明顯較高。也就是說越來越多的頭部廠商也將支持HTAP場景作為其主流使用場景之一。
4).開發(fā)模式
隨著開源理念逐步被廣泛接受,正有越來越多的產(chǎn)品選擇開源模式運(yùn)作。從左圖可見,大部分廠商采用商業(yè)開發(fā)模式,開源模式還僅占少數(shù)。但如果考慮到流行度的問題,情況則大不同。參考右圖,疊加上流行度因素可見,開源占比已接近商業(yè),也就是說頭部的廠商更多采用開源策略。這也與其流行度較高有著密不可分的關(guān)系。
2. 大調(diào)查:技術(shù)篇
1).技術(shù)架構(gòu)
從技術(shù)架構(gòu)演進(jìn)來看,數(shù)據(jù)庫走過了單機(jī)式、集中式到分布式的發(fā)展,目前是多種架構(gòu)并存的階段。分布式架構(gòu)以其更好的擴(kuò)展能力,受到更多的關(guān)注。當(dāng)然我們也需要意識到,分布式因其架構(gòu)特點(diǎn)決定,會失去一些傳統(tǒng)架構(gòu)的優(yōu)點(diǎn)。而對于大部分場景來說,集中式甚至單機(jī)架構(gòu)就可以滿足。從下圖可見,兩種架構(gòu)產(chǎn)品處于均分的狀態(tài),甚至分布式稍占優(yōu)。
從場景上來看,不同場景的架構(gòu)占比還有所不同。對于OLAP、HTAP等領(lǐng)域,因其承載數(shù)據(jù)規(guī)模及算力更大,分布式產(chǎn)品更有優(yōu)勢,因而分布式也會占比更高。
2).部署環(huán)境
從部署環(huán)境來看,本地部署與云原生環(huán)境并存。多款產(chǎn)品支持在兩種環(huán)境中部署。但從整體來看,仍然是以本地部署方式為主,云原生的部署方式占少數(shù),如左圖。從技術(shù)架構(gòu)來看,分布式更容易利用云原生提供的計(jì)算與存儲能力,因此更多地支持云原生部署,如右圖。
3).代碼來源
作為基礎(chǔ)軟件之一,數(shù)據(jù)庫需要較大的代碼工程量。在這其中,完全自研還是利用開源產(chǎn)品快速構(gòu)建是兩類思路。如下圖來看,從數(shù)量來說,獨(dú)立自研產(chǎn)品仍然占多數(shù)(其中有些產(chǎn)品未明確聲明基于開源構(gòu)建,因而算為自研)?;陂_源構(gòu)建來說,MySQL和PG是作為流行的兩款開源數(shù)據(jù)庫產(chǎn)品,大量的商業(yè)產(chǎn)品基于其開發(fā)。值得關(guān)注的是排名第三的openGauss,作為一款國人開源的數(shù)據(jù)庫產(chǎn)品,眾多商業(yè)產(chǎn)品基于其構(gòu)建值得祝賀。
如果從另一個(gè)角度流行度來看,基于PG構(gòu)建產(chǎn)品的總流行度要超過基于MySQL構(gòu)建的產(chǎn)品。但這里有個(gè)特殊情況,有些登記的產(chǎn)品是單一品牌多款數(shù)據(jù)庫,但流行度評分是一個(gè),存在一定的偏差。
4).兼容性
數(shù)據(jù)庫兼容能力,是快速獲得用戶的關(guān)鍵,特別是一款新產(chǎn)品。之前國內(nèi)數(shù)據(jù)庫市場以海外大型商用數(shù)據(jù)庫為主,其占據(jù)了很大的份額,構(gòu)建了完整生態(tài)。作為國內(nèi)產(chǎn)品如果想快速被用戶接受,兼容其他擁有較好生態(tài)產(chǎn)品是個(gè)不錯(cuò)的做法。從下圖可見,MySQL作為最為流行的開源數(shù)據(jù)庫,也成為眾多廠商首選的兼容對象,其次是PG和Oracle。
如果我們考慮流行度因素來看兼容性占比,則MySQL仍然為第一,但Oracle、PG整體也占比很高,特別是Oracle成為接近MySQL的第二兼容選擇。