中國數(shù)據(jù)庫告別卡脖子之憂:阿里OceanBase霸氣衛(wèi)冕全球第一
本文經(jīng)AI新媒體量子位(公眾號ID:QbitAI)授權(quán)轉(zhuǎn)載,轉(zhuǎn)載請聯(lián)系出處。
中國自研OceanBase數(shù)據(jù)庫,又刷新了世界紀錄。
時隔七月,再次在TPC-C公開證明實力。
但這一次,不只是新晉霸主地位的鞏固,也不止于打破業(yè)界塵封9年世界紀錄后的新里程碑……
更是技術(shù)性能benchmark、底層基礎(chǔ)自主研發(fā),以及全球標(biāo)準(zhǔn)話語權(quán)的關(guān)鍵事件。
很多年后回溯起來,這還可能是兩個時代的分水嶺。
數(shù)據(jù)庫、操作系統(tǒng)和芯片,科技產(chǎn)業(yè)和數(shù)字化經(jīng)濟中三大當(dāng)之無愧的底座技術(shù),之前無一項主動權(quán)掌握在中國手中。
現(xiàn)在,阿里巴巴、支付寶,十年之功、20萬億行代碼之力——在數(shù)據(jù)庫領(lǐng)域,打破全球紀錄的7個月后,再次創(chuàng)造了新的標(biāo)準(zhǔn)線。
究竟是怎樣的成就?
去年十一,我們就報道過,阿里自主研發(fā)的金融級分布式關(guān)系數(shù)據(jù)庫OceanBase,在國際事務(wù)處理性能委員會(TPC)的TPC-C基準(zhǔn)測試中登上榜首。
這一成績還打破了由美國公司甲骨文(Oracle)保持了9年之久的世界記錄,成為首個登頂該榜單的中國數(shù)據(jù)庫產(chǎn)品。
中國工程院院士、計算機專家李國杰都盛贊說:“這是中國基礎(chǔ)軟件取得的重大突破。”
如今,7個月后,紀錄再度被刷新。

OceanBase不僅打破了去年自己保持的世界紀錄,性能分數(shù)首次突破7.07億,相比去年大幅提升近11倍。
而且這一次還是擴展能力的展現(xiàn),在分布式架構(gòu)下使用超過1500個節(jié)點的數(shù)據(jù)庫集群,最終實現(xiàn)了整體性能的大幅提升——這在傳統(tǒng)的集中式數(shù)據(jù)庫是無法想象的。
更重要的是,在產(chǎn)業(yè)領(lǐng)域,分布式數(shù)據(jù)庫解決了傳統(tǒng)數(shù)據(jù)庫幾十年的難題,標(biāo)志著數(shù)據(jù)庫行業(yè)迎來了新一輪技術(shù)變革。


TPC-C,被譽為“數(shù)據(jù)庫領(lǐng)域的世界杯”。
是全球主流計算機硬件廠商、數(shù)據(jù)庫廠商公認的性能評價標(biāo)準(zhǔn),其對數(shù)據(jù)庫系統(tǒng)的軟硬件協(xié)同能力要求極高。
也是全球目前最具公信力的聯(lián)機交易處理(OLTP)數(shù)據(jù)庫的功能與性能結(jié)合的測試標(biāo)準(zhǔn),金融、電信、政府等關(guān)鍵領(lǐng)域的客戶,一般參照 TPC-C 結(jié)果來衡量各個數(shù)據(jù)庫廠商的事務(wù)處理能力。
更直接來說,TPC-C的測試就是數(shù)據(jù)庫產(chǎn)品真實實力的最佳公開證明。
具體到測試本身,主要涵蓋兩大方向,分別是基本屬性和壓力性能。
在模擬真實交易環(huán)境并考察數(shù)據(jù)庫基本性能的需求下,要求連續(xù)運行至少2小時,通過每分鐘創(chuàng)建新訂單數(shù)量來評價數(shù)據(jù)庫的性能和性價比,規(guī)定測試任務(wù)需要在指定時間內(nèi)完成,95%事務(wù)在1s內(nèi)完成。
所以一款商業(yè)數(shù)據(jù)庫想要向業(yè)界證明自身實力,TPC-C測試,絕對是一項硬指標(biāo)。
然而,TPC-C排行榜長期被甲骨文、IBM和微軟等傳統(tǒng)數(shù)據(jù)庫和硬件廠商占據(jù)……
中國自研品牌的身影,從未出現(xiàn)過。
直到2019年9月,阿里一鳴驚人,打破甲骨文長達9年的霸榜壟斷。

然而當(dāng)是時,雖然成績超第一名甲骨文紀錄兩倍有余,但外界依然有不少質(zhì)疑的聲音,且認為“蹭”了硬件紅利。
于是這一次,時隔7個月再戰(zhàn)——硬件基本無變化,要的就是技術(shù)架構(gòu)和軟件實力的證明。
所以也有外界評價說:「再無敵手,獨孤求敗」。
但參與此次“證明”的阿里工程師表示:這個評價聽起來太狂了。
不過也認同,在數(shù)據(jù)庫領(lǐng)域,技術(shù)架構(gòu)的優(yōu)越和領(lǐng)先,確實短時間內(nèi)是很難超越的。
阿里憑什么?
這一次,OceanBase在測試壓力性能時被要求連續(xù)運行至少八小時,1500多個數(shù)據(jù)庫節(jié)點以及5000多萬個倉庫與對應(yīng)數(shù)量的客戶端參與其中,過程中上下抖動情況不超過1%。
以最苛刻的方式,無壓力通過了該測試,而且短時間內(nèi),別人再以同樣標(biāo)準(zhǔn)通過測試,幾無可能。
OceanBase總經(jīng)理楊冰,阿里連續(xù)兩次刷榜的帶頭人。
他分享了OceanBase取勝的核心原因:
分布式整體系統(tǒng)可用性的技術(shù)創(chuàng)新。
即不用擔(dān)心高額的軟硬件投入來保障擴展性能所造成的杯水車薪,又可搞定節(jié)點故障無法使用主備鏡像技術(shù)等問題。
以此為出發(fā)點,OceanBase大膽采用了Paxos分布式一致性協(xié)議,作為整個分布式數(shù)據(jù)庫中最核心的技術(shù)之一。
OceanBase創(chuàng)始人陽振坤坦言,無論是主備庫數(shù)據(jù)不一致還是分布式事務(wù)的技術(shù)缺陷,根本原因都在于關(guān)系型數(shù)據(jù)庫自身軟件高可用性的缺失,僅僅通過堆砌硬件紅利來解決問題顯然是治標(biāo)不治本的做法;而OceanBase則是從數(shù)據(jù)庫內(nèi)部入手將問題解決。
當(dāng)然,經(jīng)過首次沖擊TPC-C測試成功再到二次震撼TPC-C并滿載而歸,期間OceanBase技術(shù)團隊也做了很多重要的優(yōu)化升級工作。
例如提供兼容Oracle的租戶模式并支持兼容PL/SQL的存儲過程;實踐分布式并行查詢的新執(zhí)行引擎幫助更好支持TPC-H這類場景測試,更快走向混合負載等。
關(guān)于兼容Oracle的工作難點,楊冰強調(diào)OceanBase團隊的目標(biāo)是打算用兩年時間做到業(yè)務(wù)的平滑遷移,不需要修改一行代碼,也不需要業(yè)務(wù)做任何調(diào)整,但過程中由于Oracle本身功能較多,先去突破哪些具體的內(nèi)容確實是一種挑戰(zhàn)。
另外甲骨文一直以來都是一家技術(shù)能力強大的企業(yè),對自身專利權(quán)限十分看重,未來在兼容工作進行過程中技術(shù)團隊認為務(wù)必要基于自研數(shù)據(jù)庫的屬性對類似功能的加持保持慎重。
更重要的是,分析甲骨文單機數(shù)據(jù)庫強大的技術(shù)功能后,OceanBase團隊發(fā)現(xiàn)其混合負載是其重要的技術(shù)殺手锏,“未來在OceanBase分布式技術(shù)架構(gòu)中實現(xiàn)此項功能的確算是一種不小的技術(shù)挑戰(zhàn)。”
此外,對于OceanBase來說,公開挑戰(zhàn)里的成功,只是日常實力的證明方式之一。
與諸多中國技術(shù)公司一樣,業(yè)務(wù)場景才是最好的練兵場,而且中國業(yè)務(wù)場景下的挑戰(zhàn),可能比基準(zhǔn)測試還要復(fù)雜多變得多。
或許你多少有了解,支付寶投身OceanBase獲得成功,除了強大的專業(yè)技術(shù)人才投入之外,更重要的是阿里經(jīng)濟體與支付寶業(yè)務(wù)為代表的的互聯(lián)網(wǎng)規(guī)模、金融級場景的復(fù)雜度,以及每年雙十一大促時期的大型歷練機會……

這些都為其提供了天然的練兵場,因為只有經(jīng)過豐富的業(yè)務(wù)場景考驗才能證明數(shù)據(jù)庫系統(tǒng)的通用性,“用出來”才是硬道理。
舉個例子,在高效解決銀行業(yè)務(wù)從傳統(tǒng)Oracle遷移到OceanBase的有關(guān)問題時,由于實操經(jīng)驗豐富,團隊早已面向開發(fā)者、運維人員等不同技術(shù)層面人群提供了完成與大數(shù)據(jù)鏈路同步以及異構(gòu)數(shù)據(jù)庫、同構(gòu)數(shù)據(jù)庫同步與遷移的諸多工具,例如OCP、OMS等。
現(xiàn)如今隨著OceanBase在金融場景的商用化程度越發(fā)深入,創(chuàng)始人陽振坤表示,未來團隊更想該產(chǎn)品代表下一代分布式數(shù)據(jù)庫的技術(shù)趨勢前沿與發(fā)展方向,在除金融行業(yè)以外的多個領(lǐng)域。
例如交通、鐵路與航天等也都陸續(xù)出現(xiàn)OceanBase的身影,夯實金融場景技術(shù)創(chuàng)新之余大力推進商用化進程,逐漸成長位至關(guān)重要的通用性技術(shù)。
包括如今面貌一新的國民應(yīng)用,目前背后底座就是OceanBase。
所以可以想見,隨著TPC-C的再次實力證明,會有更多公司、業(yè)務(wù)、場景和領(lǐng)域,用上全球領(lǐng)先且中國自研的OceanBase數(shù)據(jù)庫。
在波詭云譎的大環(huán)境中,不必再擔(dān)心任何形式的斷供。
十年磨一劍
但即便如此,OceanBase一路走來,也并非輕而易舉。
現(xiàn)在看到的是全球矚目,之前卻有十年的風(fēng)雨兼程。
OceanBase創(chuàng)始人陽振坤回憶,當(dāng)時完全是憑借技術(shù)靈感,認定傳統(tǒng)集中式數(shù)據(jù)庫,總會有盡頭。
“我雖然不是做數(shù)據(jù)庫的,但長期的分布式經(jīng)驗讓我覺得像Oracle那種單機數(shù)據(jù)庫總會有個盡頭。畢竟業(yè)務(wù)數(shù)據(jù)量沒幾個月就要翻一翻,分布式絕對是個機會。”

△OceanBase創(chuàng)始人陽振坤
于是當(dāng)年6月25日,OceanBase正式立項。
又一年,OceanBase 0.1版本正式發(fā)布,在淘寶收藏夾上線,成功幫助淘寶收藏夾業(yè)務(wù)的數(shù)據(jù)庫服務(wù)器數(shù)量大幅度減少。
2013年,支付寶開始啟動“去 IOE”,即去掉了Oracle數(shù)據(jù)庫、IBM小型機和EMC存儲。
2014年支付寶交易庫上線,OceanBase產(chǎn)品真正帶到金融核心業(yè)務(wù)。
2017年第一個外部用戶南京銀行也正式上線OceanBase。
再到去年9月,一戰(zhàn)成名,打破壟斷。
但更重要的是今年3月,OceanBase宣布正式通過阿里云向全球開放,實現(xiàn)更廣泛的高可用、高性能、低成本服務(wù)。
而篳路藍縷的研發(fā)之路中,一度因為困難重重、中途因為找不到愿意使用的業(yè)務(wù),OceanBase團隊還曾經(jīng)瀕臨解散。
如今春風(fēng)化雨,一切盡付笑談中。
更重要的是,曾經(jīng)因為數(shù)據(jù)庫技術(shù)壟斷,甲骨文創(chuàng)始人拉里·埃里森,讓中國合作方在零下二十多度的凜冽環(huán)境中苦等2小時的傲慢往事,或許再也不會有了。
現(xiàn)在,我們不僅有了國產(chǎn)自研OceanBase數(shù)據(jù)庫可供選擇,而且OceanBase,也是最好的選擇。
接下來,就看操作系統(tǒng)和芯片的了。