自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

國產數據庫到底能不能打?

數據庫 其他數據庫
在 StackOverflow 2023 調研 中,TiDB 作為最后一名,首次出現在數據庫流行度榜單里,也是唯一入選的 “國產數據庫”。圖左中,TiDB 的開發(fā)者使用率為 0.20%,與排名第一的 PostgreSQL (45.55%) 和排名第二的 MySQL (41.09%) 相比,流行度相差了大約 兩三百倍。

總有朋友問我,國產數據庫到底能不能打?說實話,是個得罪人的問題。所以我們不妨試試用數據說話 —— 希望本文提供的圖表,能夠幫助讀者了解數據庫生態(tài)格局,并建立更為準確的比例感認知。

數據來源與研究方法

評價一個數據庫“能不能打”有許多種方式,但 “流行度” 是最常見的指標。對一項技術而言,流行度決定了用戶的規(guī)模與生態(tài)的繁榮程度,唯有這種最終存在意義上的結果才能讓所有人心服口服。

關于數據庫流行度這個問題,我認為有三份數據可以作為參考:StackOverflow 全球開發(fā)者調研[1],DB-Engine 數據庫流行度排行榜[2],以及墨天輪國產數據庫排行榜[3]。

其中最有參考價值的是 StackOverflow 2017 - 2023 年的全球開發(fā)者問卷調研 —— 樣本調查獲取的第一手數據具有高度的可信度與說服力,并且具有極好的 橫向可比性(在不同數據庫之間水平對比);連續(xù)七年的調查結果也有著足夠的 縱向可比性 (某數據庫和自己過去的歷史對比)。

圖片圖片

其次是 DB-Engine 數據庫流行度排行榜, DB-Engine 屬于綜合性熱搜指數,將 Google, Bing, Google Trends,StackOverflow,DBA Stack Exchange,Indeed, Simply Hired, LinkedIn,Twitter 上的間接數據合成了一個熱搜指數。

圖片圖片

熱度指數有著很好的 縱向可比性 —— 我們可以用它來判斷某個數據庫的流行度走勢 —— 是更流行了還是更過氣了,因為評分標準是一樣的。但在 橫向可比性 上表現不佳 —— 例如你沒辦法細分用戶搜索的目的。所以熱度指標在橫向對比不同數據庫時只能作為一個模糊的參考 —— 但在數量級上的準確性還是OK的。

第三份數據是墨天輪的 “國產數據庫排行榜”,這份榜單收錄了 287 個國產數據庫,主要價值是給我們提供了一份國產數據庫名錄。這里我們簡單認為 —— 收錄在這里的數據庫,就算“國產數據庫”了 —— 盡管這些數據庫團隊不一定會自我認知為國產數據庫。

圖片圖片

有了這三份數據,我們就可以嘗試回答這個問題 —— 國產數據庫在國際上的流行度與影響力到底是什么水平?

錨點:TiDB

TiDB 是唯一一個,同時出現在三個榜單里的數據庫,因此可以作為錨點。

在 StackOverflow 2023 調研 中,TiDB 作為最后一名,首次出現在數據庫流行度榜單里,也是唯一入選的 “國產數據庫”。圖左中,TiDB 的開發(fā)者使用率為 0.20%,與排名第一的 PostgreSQL (45.55%) 和排名第二的 MySQL (41.09%) 相比,流行度相差了大約 兩三百倍。

圖片圖片

第二份 DB-Engine 數據可以交叉印證這一點 —— TiDB 在 DB-Engine 上的評分是國產數據庫中最高的 —— 在2024年4月份,為 5.14 分。關系型數據庫四大天王( PostgreSQL,MySQL,Oracle,SQL Server)相比,也是小幾百倍的差距。

圖片圖片


在墨天輪國產數據庫排名中,TiDB 曾經長時間占據了榜首的位置,盡管最近兩年前面加塞了 OceanBase, PolarDB,openGauss 三個數據庫,但它還在第一梯隊里,稱其為國產數據庫標桿沒有太大問題。

圖片圖片

如果我們以 TiDB 作為參考錨點,將這三份數據融合,立即就能得出一個有趣的結論:國產數據庫看上去人才濟濟,群英薈萃,但即使是最能打的國產數據庫,流行度與影響力也不及頭部開源數據庫的百分之一… 。

整體來看,這些被歸類為“國產數據庫”的產品,絕大多數在國際上的影響力可以評為:微不足道。

微不足道的戰(zhàn)五庫

在 DB-Engine 收錄的全球 478 款數據庫中,可以找到 46 款列入墨天輪國產數據庫名單的產品。將其過去十二年間的流行度繪制在圖表上,得到下圖 —— 乍看之下,好一片 “欣欣向榮”,蓬勃發(fā)展的勢頭。

圖片圖片


然而,當我們把關系數據庫四大天王:PostgreSQL,MySQL,Oracle,SQL Server 的熱度趨勢同樣畫在這張圖上后,看上去就變得大不一樣了 —— 你幾乎看不到任何一個“國產數據庫”了。

圖片圖片

把整個國產數據庫的熱度分數全加起來,也甚至還達不到 PostgreSQL 流行度的零頭。 整體合并入 “其他” 統(tǒng)計項中毫無任何違和感。

圖片圖片

如果把所有國產數據庫視作一個整體,在這個榜單里面可以憑 34.7 分排到第 26 名,占總分數的千分之五。(最上面一條黑帶)

圖片圖片

這個數字,差不多就是國產數據庫國際影響力(DB-Engine)的一個摘要概括:盡管在數量上占了 1/10(如果以墨天輪算可以近半),但總影響力只有千分之五。其中的最強者 TiDB,戰(zhàn)斗力也只有5 ……

當然再次強調,熱度/指數類數據橫向可比性非常一般

僅適合在數量級層面用作參考 —— 但這也夠了……

過氣中的數據庫們

從 DB-Engine 的熱度趨勢上看,國產數據庫從 2017 - 2020 年開始起勢,從 2021 年進入高潮,在 23年5月進入平臺期,從今年年初開始,出現掉頭過氣的趨勢。這和許多業(yè)內專家的判斷一致 —— 2024 年,國產數據庫進入洗牌清算期 —— 大量數據庫公司將倒閉破產或被合并收編。

圖片圖片

如果我們去掉個別出海開源做的還不錯的頭部“國產”數據庫 ——  這個掉頭而下的過氣趨勢會更加明顯。

圖片圖片

但過氣這件事,并非國產數據庫所獨有 — 其實絕大多數的數據庫其實都正在過氣中。DB-Engine 過去12 年中的流行度數據趨勢可以揭示這一點 —— 盡管 DB-Engine 熱度指標的的橫向可比性很一般,但縱向可比性還是很不錯的 —— 因此在判斷流行 & 過氣趨勢上仍然有很大的參考價值。

我們可以對圖表做一個加工處理 —— 以某一年為零點,來看熱度分數從此刻起的變化,從而看出那些數據庫正在繁榮發(fā)展,哪些數據庫正在落伍過氣。

如果我們將目光聚焦在最近三年,不難發(fā)現在所有數據庫中,只有 PostgreSQL 與 Snowflake 的流行度有顯著增長。而最大的輸家是 SQL Server,Oracle,MySQL,與 MongoDB …… 。分析數倉類組件(廣義上的數據庫)在最近三年有少量增長,而絕大部分其他數據庫都處在過氣通道中。

圖片圖片


如果我們以 DB-Engine 最早有記錄的 2012-11 作為參考零點,那么 PostgreSQL 是過去 12 年中數據庫領域的最大贏家;而最大的輸家依然是 SQL Server,Oracle,MySQL 御三家關系型數據庫。

NoSQL 運動的興起,讓 MongoDB ,ElasticSearch,Redis 在 2012 - 2022 互聯網黃金十年中獲得了可觀的增長,但這個增長的勢頭在最近幾年已經結束了,并進入過氣下降通道中,進入吃存量老本的狀態(tài)。

圖片圖片

至于 NewSQL 運動,即所謂的新一代分布式數據庫。如果說 NoSQL 起碼輝煌過,那么可以說 NewSQL 還沒輝煌就已經熄火了。“分布式數據庫” 在國內營銷炒作的非?;馃幔灾劣诖蠹液孟癜阉斪饕粋€可以與 “集中式數據庫” 分庭抗禮的數據庫品類來看待。但如果我們深入研究就不難發(fā)現 —— 這其實只是一個非常冷門的數據庫小眾領域。

一些 NoSQL 組件的流行度還能和 PostgreSQL 放到同一個坐標圖中而不顯突兀,而所有 NewSQL 玩家加起來的流行度分數也比不上 PostgreSQL 的零頭 —— 和“國產數據庫”一樣。

圖片圖片

這些數據為我們揭示出數據庫領域的基本格局

除了 PostgreSQL 之外的主要數據庫都在過氣中,…

圖片圖片

改頭換面的 PostgreSQL 內戰(zhàn)

這幾份數據為我們揭示出數據庫領域的基本格局 —— 除了 PostgreSQL 之外的主要數據庫都在過氣中,無論是 SQL,NoSQL,NewSQL,還是 國產數據庫 。這確實拋出了一個有趣的問題,讓人想問 —— 為什么?。

對于這個問題,我在 《PostgreSQL 正在吞噬數據庫世界》中提出了一種簡單的解釋:PostgreSQL 正在憑借其強大的擴展插件生態(tài),內化吞噬整個數據庫世界。根據奧卡姆剃刀原理 —— 最簡單的解釋往往也最接近真相。

圖片圖片

整個數據庫世界的核心焦點,都已經聚焦在了金剛大戰(zhàn)哥斯拉上:兩個開源巨無霸數據庫 PostgreSQL 與 MySQL 的使用率與其他數據庫遠遠拉開了距離。其他一切議題與之相比都顯得微不足道,無論是 NewSQL 還是 國產數據庫。

圖片圖片

看上去這場搏殺還要再過幾年才能結束,但在遠見者眼中,這場紛爭幾年前就已經塵埃落定了。

Linux 內核一統(tǒng)服務器操作系統(tǒng)天下后,曾經的同臺競爭者 BSD,Solaris,Unix 都成為了時代的注腳。而我們正在目睹同樣的事情在數據庫領域發(fā)生 —— 在這個時代里,想發(fā)明新的實用數據庫內核,約等于堂吉柯德撞風車。

好比今天盡管市面上有這么多的 Linux 操作系統(tǒng)發(fā)行版,但大家都選擇使用同樣的 Linux 內核,吃飽了撐著魔改 OS 內核屬于沒有困難創(chuàng)造困難也要上,會被業(yè)界當成 山炮 看待。

所以,并非所有國產數據庫都不能打,而是能打的國產數據庫,其實是改頭換面的 PostgreSQL 與 MySQL 。如果 PostgreSQL 注定成為數據庫領域的 Linux 內核,那么誰會成為 Postgres 的 Debian / Ubuntu / Suse / RedHat ?

圖片圖片

國產數據庫的競爭,變成了 PostgreSQL / MySQL 生態(tài)內部的競爭。一個國產數據庫能打與否,取決于其 “含P量” —— 含有 PostgreSQL 內核的純度與版本新鮮度。版本越新,魔改越少,附加值越高,使用價值就越高,也就越能打。

國產數據庫看起來最能打的阿里 PolarDB (唯一入選 Gartner 領導者象限),基于三年前的 PostgreSQL 14 進行定制,且保持了 PG 內核的主體完整性,擁有最高的含P量。相比之下,openGauss 選擇基于 12 年前的 PG 9.2 進行分叉,并魔改的親爹都不認識了,所以含P量較低。介于兩者中間的還有:PG 13 的 AntDB,PG 12 的人大金倉,PG 11 的老 Polar,PG XL 的 TBase ,…… 

因此,國產數據庫到底能不能打 —— 真正的本質問題是:誰能代表 PostgreSQL 世界的先進生產力?

做內核的廠商不溫不火,MariaDB 作為 MySQL 的親爹 Fork 甚至都已經瀕臨退市,而白嫖內核自己做服務與擴展賣 RDS 的 AWS 可以賺的缽滿盆翻,甚至憑借這種模式一路干到了全球數據庫市場份額的榜首 —— 毫無疑問地證明:數據庫內核已經不重要了,市場上稀缺的是能力整合。

圖片圖片

在這場競賽中,公有云 RDS 拿到了第一張入場券。而嘗試在本地提供更好、更便宜、 RDS for PostgreSQL 的 Pigsty 對云數據庫這種模式提出了挑戰(zhàn),同時還有十幾款嘗試用 云原生方式解決 RDS 本地化挑戰(zhàn)的 Kubernetes Operator 正在摩拳擦掌,躍躍欲試,要把 RDS 拉下馬來。

圖片圖片

真正的競爭發(fā)生在服務/管控維度,而不是內核。

數據庫領域正在從寒武紀大爆發(fā)走向侏羅紀大滅絕,在這一過程中,1% 的種子將會繼承 99% 的未來,并演化出新的生態(tài)與規(guī)則。我希望數據庫用戶們可以明智地選擇與決策,站在未來與希望的一側,而不要把生命浪費在沒有前途的事物上,比如……

References

[1] StackOverflow 全球開發(fā)者調研: https://survey.stackoverflow.co/2023/?utm_source=so-owned&utm_medium=blog&utm_campaign=dev-survey-results-2023&utm_cnotallow=survey-results#most-popular-technologies-database-prof[2] DB-Engine 數據庫流行度排行榜: https://db-engines.com/en/ranking_trend[3] 墨天輪國產數據庫排行榜: https://www.modb.pro/dbRank

注:本文使用的圖表與數據,公開發(fā)布于 Pigsty Demo 站點:

[1] DB-Engine 數據分析: https://demo.pigsty.cc/d/db-analysis[2] StackOverflow 7年調研數據: https://demo.pigsty.cc/d/sf-survey

責任編輯:武曉燕 來源: 非法加馮
相關推薦

2013-04-19 10:42:02

打車軟件大數據

2025-04-22 08:00:00

2011-08-09 16:08:53

數據庫連接

2021-06-15 11:33:48

監(jiān)控微信聊天前端

2018-03-05 07:38:11

2012-03-05 10:36:30

云計算節(jié)能減排數據中心

2009-07-16 22:39:11

2019-01-24 09:53:49

2018-12-10 09:14:56

AI教育教育資源留守兒童

2019-11-21 09:25:23

AI 數據人工智能

2011-12-06 10:06:33

云存儲

2021-05-11 15:50:52

比特幣加密貨幣貨幣

2016-05-19 17:10:27

銀行

2022-10-20 08:00:37

機器人ZadigChatOps

2021-02-26 21:25:08

比特幣投資貨幣

2020-10-16 18:33:18

Rust語言前端開發(fā)

2010-04-13 10:02:16

索引

2020-12-21 15:09:23

人工智能安全人臉識別

2023-12-27 08:03:53

Go優(yōu)化代碼

2023-04-06 06:55:24

ChatGPTGPT算力
點贊
收藏

51CTO技術棧公眾號