近日受邀參加了由阿里云主辦的2025 PolarDB 開發(fā)者大會。會上重點發(fā)布了PolarDB的近期的一些成果,很令人期待。此外,還特參加了針對媒體的專訪活動,聽到阿里云官方的一些信息。整個一天會議下來,收獲滿滿,下面就談?wù)勎覍Υ髸囊恍└惺堋?/span>
1. 大會觀感:理念篇
1).DATA + AI:雙輪驅(qū)動引擎
在大會初試環(huán)節(jié),阿里云PolarDB定位為“數(shù)據(jù)與智能雙驅(qū)動的數(shù)據(jù)平臺”,這首次將AI放入如此高的位置。隨著近些年來大模型的大熱,包括近期焦點的DeepSeek,無疑都將人工智能的使用門檻大大降低,企業(yè)對于AI的需求正變得更加熱切。從下圖的人工智能大模型生命周期可見,人工智能通俗來講其實是一種“數(shù)據(jù)應(yīng)用”,一方面是需要依賴數(shù)據(jù),需要數(shù)據(jù)存儲能力相配合;一方面是一種新型的數(shù)據(jù)計算方式,需要有對應(yīng)的算力。從這個角度來看,當(dāng)前數(shù)據(jù)的主要載體“數(shù)據(jù)庫”就變得非常合適,如果能在一個平臺中涵蓋從數(shù)據(jù)存儲、數(shù)據(jù)計算、人工智能等多種能力,那無疑對客戶是非常有意義。這也是PolarDB在此次大會上傳達的一種思想。
1.PNG
2).“一體化”的全新解讀
從上面雙輪驅(qū)動的引擎引申過來,就是希望打造一款“一體化”的數(shù)據(jù)處理平臺。從數(shù)據(jù)庫/倉庫的發(fā)展來看,其實一直在沿襲這樣的道路。在數(shù)據(jù)庫誕生之初,其定位主要是完成在線交易(OLTP)的能力,隨著數(shù)據(jù)規(guī)模的增加、數(shù)據(jù)計算復(fù)雜度的增大,出現(xiàn)了在線分析的訴求,于是有了OLAP。但這種情況,就不得不面臨數(shù)據(jù)來回搬遷的問題(ETL),隨著對數(shù)據(jù)處理的時效性、經(jīng)濟性等多方面的考慮,后期又出現(xiàn)了HTAP,正是在OLTP與OLAP的能力結(jié)合,提出的一種一體化的技術(shù)方案。與此類似的,還包括結(jié)合數(shù)據(jù)倉庫與數(shù)據(jù)湖能力的湖倉一體等等。那么如今,在人工智能方興未艾之時,是否會出現(xiàn)一種新的數(shù)據(jù)處理能力“OLIP”呢?顯然,我們不想重蹈覆轍,而是在早期就考慮一體化的方式。這就是PolarDB希望打造的一體化數(shù)據(jù)庫產(chǎn)品,即用一款產(chǎn)品滿足用戶多元化的需求,讓技術(shù)決策變的簡單。那么從下圖可見,其一體化的能力包括的多層的解讀。從內(nèi)到外,在一個核心的基礎(chǔ)上,包括生態(tài)一體化(MySQL、PG、Oracle)、架構(gòu)一體化(集中式、分布式)、場景一體化(OLTP、OLAP、OLIP)及若干通用性能力(高可用、高彈性、智能化等等)。
2.png
我們從另外一張簡圖了可見,PolarDB 通過一站式的統(tǒng)一入口接入,下面針對不同對數(shù)據(jù)計算需求,可靈活配置多種計算負載節(jié)點,包括有面向交易的RW節(jié)點、面向查詢的RO節(jié)點、面向在線分析的HTAP節(jié)點、面向人工智能的AI節(jié)點、面向向量的Vector節(jié)點等。并且上述節(jié)點橫向可實現(xiàn)1~63個節(jié)點的擴展,縱向可實現(xiàn)從0.5~32CPU的資源擴展。真正實現(xiàn)一體化,滿足用戶需求。
3.PNG
其實,這也是一種趨勢,從下圖來自Gartner魔力象限分析來看,已經(jīng)不再按場景區(qū)分數(shù)據(jù)庫產(chǎn)品及廠商進行對比,而是將多種場景全部納入統(tǒng)一考察范疇。下圖中的云數(shù)據(jù)庫管理系統(tǒng),就是覆蓋有多種場景來看待。
4.png
3).新一代云數(shù)據(jù)庫“3.0版本”
回顧數(shù)據(jù)庫的發(fā)展,數(shù)據(jù)庫從之前的傳統(tǒng)數(shù)據(jù)庫、到后期的云托管數(shù)據(jù)庫、再到云原生數(shù)據(jù)庫。伴隨著云這種新的資源供給方式的出現(xiàn),數(shù)據(jù)庫也在不斷演進變化。其核心點正如下圖所示的,將數(shù)據(jù)庫服務(wù)供給能力與數(shù)據(jù)庫需求之間平衡,希望打造一種能完全貼合需求的一種資源供給方式。云原生數(shù)據(jù)庫,這種按照云單獨設(shè)計的數(shù)據(jù)庫產(chǎn)品更有利于使用好云資源,提供更為便捷、經(jīng)濟的數(shù)據(jù)庫服務(wù)。
5.png
展開來看,現(xiàn)代的計算機并沒有脫離傳統(tǒng)的馮諾依曼體系,與之不同的是計算機內(nèi)部資源的排布。從傳統(tǒng)的簡單劃分為計算與存儲,到云所提供的可拓展的計算機資源。理論來說,我們可以將整個數(shù)據(jù)庫中心視為一臺計算機,其內(nèi)部CPU、MEM、STORAGE、NETWORK等都是可以靈活分配來使用。PolarDB正是基于此構(gòu)建自己依托云的架構(gòu),包含了兩種架構(gòu)(Share-Storage、Share-Nothing)。
6.png
其一直致力于將各層次云資源解耦,充分利用云所提供的彈性能力。如果我們將之前的托管時代的數(shù)據(jù)庫,稱為云數(shù)據(jù)庫1.0版本,以存算分離為代表的云原生數(shù)據(jù)庫稱之為2.0版本,那么現(xiàn)在以計算/內(nèi)存/存儲三層解耦為代表的新一代云原生數(shù)據(jù)庫,就可以成為云數(shù)據(jù)庫的3.0版本。
7.png
那么未來,包括如GPU等為代表的新興硬件也可以實現(xiàn)資源解耦,真的就可以將整個數(shù)據(jù)中心當(dāng)做一臺擁有海量資源的計算機了。會上PolarDB也闡述了對云原生數(shù)據(jù)庫發(fā)展方向的一些思考,就包括了多層解耦、Serverless、架構(gòu)一體化、多種工作負載(HTAP、Data+MLOps等)、寫擴展(多主多寫)、數(shù)據(jù)存儲優(yōu)化(壓縮、分層)等等。
8.png
2. 大會觀感:產(chǎn)品篇
1).軟硬結(jié)合新突破-CXL
此次大會最為重磅的產(chǎn)品發(fā)布,就是基于CXL技術(shù)發(fā)布的PolarDB的新版本。所謂CXL,是一種將CPU與MEM解耦的連接技術(shù),通過兩者解耦,可實現(xiàn)內(nèi)存池化、做到內(nèi)存里的數(shù)據(jù)共享,有助于大幅降低TCO。
9.png
CXL的出現(xiàn),突破原有架構(gòu)在擴展性方面的不足,在極低的延遲下提供近似本機的資源訪問能力,真正在CPU、MEM、STORAGE全部獨立可擴展,并且有了內(nèi)存共享能力后,也有助于實現(xiàn)更輕量化計算節(jié)點的擴展、更快速的可用性切換、更簡潔高效的數(shù)據(jù)庫內(nèi)核,實現(xiàn)了性能與擴展性的雙重提升。
10.png
此外,在會議上也提到,針對此次CXL技術(shù),也同步推出了數(shù)據(jù)庫專屬機型(會場內(nèi)就擺了一臺,不少人參觀),未來將在公有云規(guī)?;褂?。但官方也表示,目前尚無推出一體機的計劃。
11.png
除此之外,PolarDB 還談到對新一代持續(xù)化內(nèi)存AliSCM,配合SSD可實現(xiàn)更為快速的持久化等等。
12.png
2).模型算子化
另外一個發(fā)布的產(chǎn)品的重要能力,就是模型算子化(即 PolarDB-Model as an Operator)
13.png
所謂模型算子化,就是將對數(shù)據(jù)模型處理能力內(nèi)置在數(shù)據(jù)庫中,通過SQL或API的方式來使用。這點是基于對人工智能未來發(fā)展的一些判斷,因而內(nèi)置這一能力。一方面,模型訓(xùn)練仍然面臨高昂的成本問題,會逐步寡頭化,只有上游少數(shù)幾個玩家,更多用戶會基于此做微調(diào),AI應(yīng)用后期會大規(guī)模爆發(fā),需要在底層支持能力上做好準備;另一方面,數(shù)據(jù)被人工智能使用,不得不面對安全問題,如何能做到數(shù)據(jù)不出域、不搬遷就能實現(xiàn)計算,這也對底層基礎(chǔ)平臺提供了更高的要求。此次發(fā)布中,PolarDB通過模型內(nèi)置,支持通義千問和DeepSeek,并通過優(yōu)化實現(xiàn)更高效率計算,進而支持更多在線用戶。
3).其他產(chǎn)品亮點
14.png
15.png
16.png
17.png
18.png
3. 大會觀感:趨勢篇
1).云是未來,也是現(xiàn)實
會上來自Gartner分析師也談到對云的一些判斷,其觀點是“云數(shù)據(jù)庫是未來趨勢,也是現(xiàn)在的現(xiàn)實”。通過Gartner收集的全球數(shù)據(jù)庫市場數(shù)據(jù)來看,一方面云廠商逐步占據(jù)主導(dǎo),另一方面增量也多來自云市場。此外根據(jù)Gartner的預(yù)測,2027年,云數(shù)據(jù)庫會占據(jù)整個數(shù)據(jù)庫市場份額的70%。可以說,云不是一種未來趨勢,已經(jīng)是實際正在發(fā)展的一種變革。
19.png
2).現(xiàn)有平臺會成長為AI底座
Gartner預(yù)測,未來企業(yè)級AI應(yīng)用的核心是數(shù)據(jù),而不是模型。企業(yè)獨有的高價值密度數(shù)據(jù)才是AI的殺手锏。技術(shù)革命的高速變化對底層平臺可組裝性提出更好要求。到2028年,80%的生成式AI業(yè)務(wù)應(yīng)用將會在企業(yè)現(xiàn)有的數(shù)據(jù)管理平臺上開發(fā),從而將實施復(fù)雜性和交付時間減少50%。這也對現(xiàn)有廠商及產(chǎn)品提出了更好的要求,這也可以理解諸如向量數(shù)據(jù)的存儲與計算都開始成為數(shù)據(jù)庫的標配功能了。
3).關(guān)系型吞噬非關(guān)系型
Gartner預(yù)測,未來只會有一個數(shù)據(jù)庫市場。之前出現(xiàn)的關(guān)系型與非關(guān)系型并立的情況會改變,關(guān)系型產(chǎn)品雖然不能完全替代非關(guān)系型數(shù)據(jù)庫產(chǎn)品,但會大幅度替換。預(yù)計到2027年,全球非關(guān)系型數(shù)據(jù)庫(NoSQL)的功能中的80%會被整合到關(guān)系型數(shù)據(jù)庫中,這一比例高于2022年的60%。這也是我們看到關(guān)系型數(shù)據(jù)庫中開始越來越多內(nèi)置對多模數(shù)據(jù)的處理能力。
4).云廠商不會通吃數(shù)據(jù)庫市場
因為云中立等問題,云廠商不會通吃掉獨立數(shù)據(jù)庫廠商,后者仍然會有較大的生存空間。從海外的諸如Snowflake、MongoDB等發(fā)展,可見一斑。
5).數(shù)據(jù)庫技術(shù)變革是馬拉松
數(shù)據(jù)庫技術(shù)變革不是短跑,而是一場馬拉松。現(xiàn)在的一項獨特功能,可能在幾個月后就變得司空見慣。用戶不會為個別功能買單,而是會考慮選擇一個全能戰(zhàn)士。通過時間的積累,數(shù)據(jù)庫功能會趨同,只有跑的長遠的選手才能最后脫穎而出。
4. 大會觀感:其他篇
1).TPC-C 打榜發(fā)布
雖然在春節(jié)期間,已經(jīng)披露了這一消息,但本次大會是正式將這一打榜情況做一發(fā)布。這里還是要恭喜下阿里云PolarDB產(chǎn)品,取得這一佳績。這一打榜除了博取大家眼球之外,更多意義是來自PolarDB追求極致性價比,更高效利用資源的一個縮影。這是對廣大用戶具有現(xiàn)實意義的。此外,會上也談到小的一點遺憾,此次打榜的性能受限于存儲容量,尚未發(fā)揮到最佳水平,據(jù)測算理論上最終可達到28億tpmC的成績。
20.png
2).阿里云是“最云原生”廠商
來自 Gartner 的分析指出,阿里云是中國數(shù)據(jù)庫廠商中“最云原生”的一家,這無疑是對阿里云的一種褒獎。那么阿里云做了什么,才使其成為最云原生的呢?在會后交流中,阿里云談到其產(chǎn)品設(shè)計構(gòu)建中,堅持了三化原則,即標準化、產(chǎn)品化、規(guī)?;脑瓌t。甚至不惜丟掉一些單子,也堅持了這一原則,產(chǎn)品完全基于公有云來構(gòu)建。
21.png
3).開源策略是戰(zhàn)略方向
在媒體見面環(huán)節(jié),阿里云官方也談到了對開源想法。其開源策略,是作為公司戰(zhàn)略方向來投入的。開源產(chǎn)品力的構(gòu)建,都是在大規(guī)模云上驗證過后開源開放,都是企業(yè)級能力,可見公司對開源的支持力度。在開源生態(tài)構(gòu)建上面,始終秉持著開放態(tài)度,目前也正在適配開源大模型。在社會活躍上,將進一步放大群體,激發(fā)包括但不限于傳統(tǒng)DBA、開發(fā)者參與進來,未來也將向企業(yè)業(yè)務(wù)去拓展。
4).擁抱信創(chuàng),擁抱云化
作為強監(jiān)管驅(qū)動的信創(chuàng)市場,阿里云也是非常關(guān)注。作為國內(nèi)為數(shù)不多的集中式、分布式都通過國測的國產(chǎn)數(shù)據(jù)庫廠商,阿里云正全面擁抱這一市場,從產(chǎn)品力打造、服務(wù)支持等多角度加大投入。與會上也談到一個不可回避的話題,云數(shù)據(jù)庫是否在信創(chuàng)也有市場?云作為大勢所趨,信創(chuàng)也在擁抱云,但又與公有云有所不同。針對這一問題,阿里云領(lǐng)導(dǎo)也給出一個形象的比喻,公有云與專有云(私有化部署)就如同大海與湖泊,體量有所差異,但底層是相通的。
22.png