一款優(yōu)秀數(shù)據(jù)庫中間件的不完全解析
本文內(nèi)容概述
數(shù)據(jù)庫中間件有啥用
架構(gòu)剖析之高屋建瓴
2.1. 整體概述
2.2. 組件圖看架構(gòu)
細(xì)節(jié)剖析之一葉知秋
3.1. 配置加載和bean初始化
3.2. 細(xì)說讀寫分離
總結(jié)
Part1數(shù)據(jù)庫中間件有啥用
有一天,你去三亞玩耍,就想玩?zhèn)€沖浪,即時你不差錢,難道還要自己采買快艇、滑板等等裝備來滿足這為數(shù)不多的心血來潮么。租一個就行了嘛。這其實就是連接池的作用。
數(shù)據(jù)庫中間件可以理解為是一種具有連接池功能,但比連接池更高級的、帶很多附加功能的輔助組件,不僅可以租沖浪板,還可以提供地點推薦、上保險等等各類服務(wù)。
從網(wǎng)上的資料看,zdal應(yīng)該算是半開源的,好像是之前開源過,但后續(xù)沒有準(zhǔn)備維護(hù),然后就刪除了,不過github被fork下來好多,隨便一搜就是一片,當(dāng)前,只是老的版本。目前螞蟻內(nèi)部的zdal好像已經(jīng)更新到zdal5了吧,那咱可就看不到了。
越復(fù)雜的系統(tǒng),數(shù)據(jù)庫中間件的作用越大。就拿zdal來說,它提供分庫分表,結(jié)果集合并,sql解析,數(shù)據(jù)庫failover動態(tài)切換等數(shù)據(jù)訪問層統(tǒng)一解決方案。下面就一起來看下,其內(nèi)部實現(xiàn)是怎么樣的。
Part2架構(gòu)剖析之高屋建瓴
2.1整體概述
如上圖所示,zdal有四個重要的組成部分:
價值體現(xiàn)--客戶端Client包。對外暴露基本操作接口,用于業(yè)務(wù)層簡單黑盒的操作數(shù)據(jù)源;業(yè)務(wù)只和client交互,動態(tài)切換/路由等邏輯只需要進(jìn)行規(guī)則配置,相關(guān)邏輯由zdal實現(xiàn)。
核心功能--連接管理datasource包。最核心的能力,提供多種類型數(shù)據(jù)庫的連接管理;不管功能多花哨,最終目的還是為了解決數(shù)據(jù)庫連接的問題。
關(guān)鍵能力--SQL解析parser包?;A(chǔ)SQL解析能力;解析sql類型、字段名稱、數(shù)據(jù)庫等等,配合規(guī)則進(jìn)行路由
擴展能力--庫表路由rule包。根據(jù)parser解析出的字段確定邏輯庫表和物理庫表。
2.2組件圖看架構(gòu)
組件圖對整體架構(gòu)和各組件及相互聯(lián)系的理解可以起到很好的幫助。一個簡版的組件圖畫了好久,還有不少錯,不過大概是這么個意思,哎,基本功要丟~
對照上圖可以比較清晰的看到:
Client包對應(yīng)用層暴露的數(shù)據(jù)源、負(fù)責(zé)監(jiān)聽配置動態(tài)變更的監(jiān)聽組件、負(fù)責(zé)加載組織各部分的配置組件、負(fù)責(zé)加載spring bean 和庫表規(guī)則的配置組件;
Client中加載了規(guī)則組件,實現(xiàn)邏輯表和數(shù)據(jù)庫的路由規(guī)則。
Client中的庫表配置調(diào)用datasource中的數(shù)據(jù)源管理服務(wù)并構(gòu)建連接池的連接池;
Client中的SqlDispatcher服務(wù)調(diào)用SQL解析組件實現(xiàn)SQL解析。
Part3細(xì)節(jié)剖析之一葉知秋
3.1配置加載和bean初始化
大部分情況下,我們使用如mybatis這樣的ORM框架來進(jìn)行數(shù)據(jù)庫操作,其實不管是ORM還是其他方式,應(yīng)用層都需要對數(shù)據(jù)源進(jìn)行配置。
所以,client對外暴露了一個符合JDBC標(biāo)準(zhǔn)的datasource數(shù)據(jù)源,用來滿足應(yīng)用層ORM等框架配置數(shù)據(jù)源的要求--ZdalDataSource
如圖片被壓縮看不清,后臺回復(fù)<zdal類圖>獲取
- //只提供了一個init方法,這也是spring啟動時時,必須要調(diào)用的初始化方法,所有功能,都從這里開始
- public class ZdalDataSource extends AbstractZdalDataSource implements DataSource{
- public void init() {
- try {
- super.initZdalDataSource();
- } catch (Exception e) {
- CONFIG_LOGGER.error("...");
- throw new ZdalClientException(e);
- }
- }
ZdalDataSource#init() 方法即為配置加載的核心入口,init中負(fù)責(zé)加載spring配置,根據(jù)配置初始化數(shù)據(jù)源,并創(chuàng)建連接池,同時,將邏輯表和物理庫的對應(yīng)關(guān)系都維護(hù)起來供后續(xù)路由調(diào)用。
- /*父類的init方法*/
- protected void initZdalDataSource() {
- /*用FileSystemXmlApplicationContext方式加載配置文件中的數(shù)據(jù)源和規(guī)則,轉(zhuǎn)化成zdalConfig對象*/
- this.zdalConfig = ZdalConfigurationLoader.getInstance().getZdalConfiguration(appName,dbmode, appDsName, configPath);
- this.dbConfigType = zdalConfig.getDataSourceConfigType();
- this.dbType = zdalConfig.getDbType();
- //初始化數(shù)據(jù)源
- this.initDataSources(zdalConfig);
- this.inited.set(true);
- }
- }
從上面的類圖和這里的兩個入口方法大概了解到zdal配置加載的啟動流程。下面我們就來詳細(xì)看一下,讀寫分離和分庫分表的規(guī)則是怎么被加載,怎么起作用的。
3.2細(xì)說讀寫分離
讀寫分離配置的加載
首先,我們需要有數(shù)據(jù)源的相關(guān)配置,如下圖:
圖片此XML配置會在init方法被調(diào)用時,被初始化,解析成ZdalConfig類的屬性,ZdalConfig類的主要成員見下面代碼:
- public class ZdalConfig {
- /** key=dsName;value=DataSourceParameter 所有物理數(shù)據(jù)源的配置項,比如用戶名,密碼,庫名等 */
- private Map<String, DataSourceParameter> dataSourceParameters = new ConcurrentHashMap<String, DataSourceParameter>();
- /** 邏輯數(shù)據(jù)源和物理數(shù)據(jù)源的對應(yīng)關(guān)系:key=logicDsName,value=physicDsName */
- private Map<String, String> logicPhysicsDsNames = new ConcurrentHashMap<String, String>();
- /** 數(shù)據(jù)源的讀寫規(guī)則,比如只讀,或讀寫等配置*/
- private Map<String, String> groupRules = new ConcurrentHashMap<String, String>();
- /** 異常轉(zhuǎn)移的數(shù)據(jù)源規(guī)則*/
- private Map<String, String> failoverRules = new ConcurrentHashMap<String, String>();
- //一份完整的讀寫分離和分庫分表規(guī)則配置
- private AppRule appRootRule;
可以看到,xml中的規(guī)則,被解析到xxxRules里。這里以groupRules為例,failover同理。
下一步則是通過解析得到的zdalConfig 來初始化數(shù)據(jù)源:
- protected final void initDataSources(ZdalConfig zdalConfig) {
- //DataSourceParameter中存的是數(shù)據(jù)源參數(shù),如用戶名密碼,最大最小連接數(shù)等
- for (Entry<String, DataSourceParameter> entry : zdalConfig.getDataSourceParameters().entrySet()) {
- try {
- //初始化連接池
- ZDataSource zDataSource = new ZDataSource(/*設(shè)置最大最小連接數(shù)*/createDataSourceDO(entry.getValue(),zdalConfig.getDbType(), appDsName + "." + entry.getKey()));
- this.dataSourcesMap.put(entry.getKey(), zDataSource);
- } catch (Exception e) {
- //...
- }
- }
- //其他分支略,只看最簡單的分組模式
- if (dbConfigType.isGroup()) {
- //讀寫配置賦值
- this.rwDataSourcePoolConfig = zdalConfig.getGroupRules();
- //初始化多份讀庫下的負(fù)載均衡
- this.initForLoadBalance(zdalConfig.getDbType());
- }
- //注冊監(jiān)聽:為了滿足動態(tài)切換
- this.initConfigListener();
- }
initForLoadBalance的方法如下:
- private void initForLoadBalance(DBType dbType) {
- Map<String, DBSelector> dsSelectors = this.buildRwDbSelectors(this.rwDataSourcePoolConfig);
- this.runtimeConfigHolder.set(new ZdalRuntime(dsSelectors));
- this.setDbTypeForDBSelector(dbType);
- }
可以看到,首先構(gòu)建出了DB選擇器,然后賦值給了runtimeConfigHolder供運行時獲取。而構(gòu)建DB選擇器的時候,其實是按讀寫兩個維度,把所有數(shù)據(jù)源都構(gòu)建了一遍,即group_r和group_w下都包含5個數(shù)據(jù)源,只不過各自的權(quán)重不一樣:
- //比如按上面的配置寫庫只有一個,但是也會包含全數(shù)據(jù)源
- group_0_w_0 :< bean:read0DataSource , writeWeight:0>
- group_0_w_1 :< bean:writeDataSource , writeWeight:10>
- group_0_w_2 :< bean:read1DataSource , writeWeight:0>
- group_0_w_3 :< bean:read2DataSource , writeWeight:0>
- group_0_w_4 :< bean:read3DataSource , writeWeight:0>
- //上述就是寫相關(guān)的DBSelecter的內(nèi)容。
讀寫分離怎么起作用
以delete為例,更新刪除是要操作寫庫的
- public void delete(ZdalDataSource dataSource) {
- String deleteSql = "delete from test";
- Connection conn = null;
- PreparedStatement pst = null;
- try {
- conn = dataSource.getConnection();
- pst = conn.prepareStatement(deleteSql);
- pst.execute();
- } catch (Exception e) {
- //...
- } finally {
- //資源關(guān)閉
- }
- }
getConnection會從上文中提到的runtimeConfigHolder中獲取DBSelecter,然后執(zhí)行execute方法
- public boolean execute() throws SQLException {
- SqlType sqlType = getSqlType(sql);
- // SELECT相關(guān)的就選擇group_r對應(yīng)的DBSelecter
- if (sqlType == SqlType.SELECT || sqlType == SqlType.SELECT_FOR_UPDATE|| sqlType == SqlType.SELECT_FROM_DUAL) {
- //略
- return true;
- //update/delete相關(guān)的就選擇group_w對應(yīng)的DBSelecter
- } else if (sqlType == SqlType.INSERT || sqlType == SqlType.UPDATE|| sqlType == SqlType.DELETE) {
- if (super.dbConfigType == DataSourceConfigType.GROUP) {
- executeUpdate0();
- } else {
- executeUpdate();
- }
- return false;
- }
如果是讀取相關(guān)的,那就選_r的DBSelecter,如果是寫相關(guān)的,那就選_W的DBSelecter。那么executeUpdate0中是怎么執(zhí)行區(qū)分讀寫數(shù)據(jù)源的呢,其實就是把這一組的數(shù)據(jù)源根據(jù)權(quán)重篩選一遍。
- // WeightRandom#select(int[], java.lang.String[])
- private String select(int[] areaEnds, String[] keys) {
- //這里的areaEnds數(shù)組,是一個累加范圍值數(shù)據(jù)
- //比如三個庫權(quán)重 10 9 8
- //那么areaEnds就是 10 19 27 是對每個權(quán)重的累加,最后一個值是總和
- int sum = areaEnds[areaEnds.length - 1];
- //這樣隨機出來的數(shù),是符合權(quán)重分布的
- int rand = random.nextInt(sum);
- for (int i = 0; i < areaEnds.length; i++) {
- if (rand < areaEnds[i]) {
- return keys[i];
- }
- return null;
- }
Part4總結(jié)
本篇文章,把阿里數(shù)據(jù)庫中間件相關(guān)的組件和加載流程進(jìn)行了總結(jié),就一個最基本的分組讀寫分離的流程,對內(nèi)部實現(xiàn)進(jìn)行了闡述。說是解析,其實是提供給大家一種閱讀的思路,畢竟篇幅有限,如果對中間件感興趣的同學(xué),可以fork下代碼,按上述邏輯自己閱讀下。
看源碼時,比如dubbo這些中間件其實是比較容易入手的,因為他們都依托于Spring進(jìn)行JavaBean的裝載,所有,對Spring容器暴露的那些init、load方法,就是很好的切入點。個人思路,希望對大家有所幫助。