自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<sup id="hp6mb"></sup>

<cite id="hp6mb"><rp id="hp6mb"></rp></cite>

<legend id="hp6mb"><track id="hp6mb"><dfn id="hp6mb"></dfn></track></legend>

<thead id="hp6mb"></thead>

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項目管理免費題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設(shè)置退出

小工具：助你上手分布式數(shù)據(jù)庫

原創(chuàng) 精選

作者：韓鋒 2022-11-21 07:33:30

數(shù)據(jù)庫其他數(shù)據(jù)庫

如何上手分布式數(shù)據(jù)庫，針對常見的如何做表分片、如何選擇分片鍵等問題加以描述。為了降低過程難度，結(jié)合之前在項目實施中的一點經(jīng)驗，自己也嘗試編寫工具來方便遷移分析。

?分布式數(shù)據(jù)庫，無疑是近些年來數(shù)據(jù)庫領(lǐng)域的重大技術(shù)進(jìn)步。越來越多的用戶考慮將傳統(tǒng)集中式或單機數(shù)據(jù)庫，遷移到分布式數(shù)據(jù)庫。然而，正如同其他新技術(shù)一樣，使用分布式數(shù)據(jù)庫同樣面臨一定的使用門檻。如何平滑地遷移到這一新架構(gòu)，享受新架構(gòu)帶來的優(yōu)勢的同時，還需規(guī)避潛在的劣勢。盡管很多分布式數(shù)據(jù)庫產(chǎn)品，正努力降低使用門檻，讓用戶近似傳統(tǒng)數(shù)據(jù)庫的體驗去使用它，但這一過程仍面臨諸多問題。此外，要想更好地使用分布式數(shù)據(jù)庫，是需要其實現(xiàn)細(xì)節(jié)有著更多的了解。本文，嘗試從研發(fā)角度談?wù)?，如何上手分布式?shù)據(jù)庫，針對常見的如何做表分片、如何選擇分片鍵等問題加以描述。為了降低過程難度，結(jié)合之前在項目實施中的一點經(jīng)驗，自己也嘗試編寫工具來方便遷移分析。

1. 分布式數(shù)據(jù)庫設(shè)計要點

1).選擇分片對象

分布式數(shù)據(jù)庫設(shè)計的第一個要點，就是選擇需分片的對象。這其中需考慮幾個問題：

數(shù)據(jù)規(guī)模

一般來說，選擇分布式數(shù)據(jù)庫的常見原因之一就是原有數(shù)據(jù)庫容量不足，通過分布式架構(gòu)存儲更多的數(shù)據(jù)。因此，大數(shù)據(jù)量的表是優(yōu)先采用分片設(shè)計的首要理由。當(dāng)然，也存在些特例情況，如表雖然規(guī)模很大，但無法明確使用到部分?jǐn)?shù)據(jù)或數(shù)據(jù)不經(jīng)常使用等，也可考慮使用數(shù)據(jù)分析或大數(shù)據(jù)平臺。

熱點表

還有一種常見的的情況是表雖然不大，但非常熱，在單機或集中式架構(gòu)下成為熱點，存在性能擴展的瓶頸。這種情況下，也適合采用分片方式將其分而治之。

管理需求

第三種情況是有些表有著管理需求，如歸檔、清理、備份等，也可以通過分片設(shè)計更精準(zhǔn)地滿足此類需求。

誤區(qū)：所有表都需要分片

在分布式數(shù)據(jù)庫下，是否是所有對象都需要分片呢？答案是否定的。當(dāng)表采用分片化設(shè)計后，在享受到分片帶來的收益的同時，勢必也會有損失。如數(shù)據(jù)庫約束會受到限制、數(shù)據(jù)表訪問存在約束、數(shù)據(jù)庫結(jié)構(gòu)變更更為復(fù)雜等。因此，在分布式數(shù)據(jù)庫下仍可考慮采用“單表”設(shè)計。此時，就需要考慮如存儲位置（單片或廣播）等。

2).選擇分片鍵

當(dāng)確定了哪些表采用分片設(shè)計后，后面的問題就是確定每個表的分片鍵如何選擇？這往往也是分布式改造中最難取舍的地方。因為，分布式數(shù)據(jù)庫下，數(shù)據(jù)只能按照一種方式分布。數(shù)據(jù)分布的方式主要就是由分片鍵字段和選擇的分片算法來確定。因此，選擇一個最具有代表意義的字段最為分片鍵尤為重要。而選擇依據(jù)主要是看表是如何被訪問的及字段的數(shù)據(jù)特征，根據(jù)多種因素綜合考慮。當(dāng)表按照某種分片邏輯拆分后，其他無法使用該拆分邏輯進(jìn)行的訪問又該如何處理呢？這是可考慮如異構(gòu)二級索引、冗余對象等方式來解決了。下文介紹的小工具，就是從SQL語句的角度分析潛在的劃分依據(jù)，供設(shè)計者參考。后面將詳細(xì)展開說明。

3).關(guān)聯(lián)對象設(shè)計

當(dāng)表確定了分片方式后，其關(guān)聯(lián)對象需同步進(jìn)行設(shè)計。這里面設(shè)計包括：

約束

在分布式架構(gòu)下，傳統(tǒng)的約束會受到很大限制，這其中包括主鍵、外鍵、非空、唯一、檢查五類。很多分布式數(shù)據(jù)庫不再支持上面這些約束中的部分。這時就需在設(shè)計時有所考慮，將約束能力上移到應(yīng)用側(cè)去解決。

索引

索引，是優(yōu)化數(shù)據(jù)庫訪問最常用的手段之一。在分布式架構(gòu)下，索引能力同樣有所限制。一般來說，若索引字段前綴包含分片字段，還可以支持；否則，只能通過異構(gòu)索引方式來實現(xiàn)。可簡單理解為，分布式架構(gòu)下的索引就是按照另一種方式存儲的分片表。當(dāng)然，過多的索引在分布式架構(gòu)下，開銷也是很大的。因此，因分布式架構(gòu)下分片內(nèi)的數(shù)據(jù)已經(jīng)有限，某些索引是可以考慮不再創(chuàng)建。

序列

序列，主要是為了滿足唯一性或自增類需求的。這一能力在單機或集中式架構(gòu)下比較簡單，在分布式架構(gòu)下通?？煽紤]用“分布式ID”的方式實現(xiàn)。功能上較之前還是有所限制，特別是自增需求。有些分布式數(shù)據(jù)庫雖然支持，但性能也會較差。

視圖

一般來說，分布式數(shù)據(jù)庫支持簡單視圖，對于復(fù)雜視圖來說則各有差異。此外，需要注意的是優(yōu)化器的差異。針對視圖類的優(yōu)化，是比較考驗優(yōu)化器能力的，這點各家產(chǎn)品差異較大。

庫內(nèi)計算（存儲過程、函數(shù)、觸發(fā)器等）

針對庫內(nèi)計算，是單機或集中式數(shù)據(jù)庫的一大優(yōu)勢。離數(shù)據(jù)越近的運算，其效率往往也越高，但對于分布式數(shù)據(jù)庫，存在較大技術(shù)難點。目前行業(yè)內(nèi)，能較完美地支持分布式架構(gòu)下的庫內(nèi)計算，尚有不小的差距。建議還是在應(yīng)用側(cè)去解決。

4).關(guān)聯(lián)語句驗證

在做好上述分片設(shè)計后，很重要的一步就是要驗證上面設(shè)計是否滿足需要。驗證的方式就是將對象關(guān)聯(lián)的語句提取出來，分析在分布式條件下的運行情況。這里包括語法是否支持、語義是否等價、效率是否有保障？若上述驗證不滿足預(yù)期，就需要考慮做出調(diào)整。有些可通過改寫方式解決，有些更為復(fù)雜情況可能需考慮在應(yīng)用側(cè)甚至架構(gòu)層面來解決。這一過程也是很多分布式改造的痛點，存在大量驗證過程。

5).其他需考慮因素

除去上述要點外，還有其他因素值得關(guān)注：

分區(qū)表情況

在傳統(tǒng)數(shù)據(jù)庫中，應(yīng)對海量數(shù)據(jù)規(guī)模的有效手段之一就是分區(qū)。是否在分片條件下仍然使用分區(qū)，是需要綜合考慮的。原則上來講，數(shù)據(jù)經(jīng)過分片設(shè)計，已經(jīng)減少處理規(guī)模，分區(qū)必要性有所降低，要綜合考慮。

復(fù)雜計算情況

分布式架構(gòu)下，有些計算是無法下推到分片內(nèi)完成的，這就需要提取分片數(shù)據(jù)，匯聚后計算。這對于上面的計算層的壓力較大，也會造成很大的資源開銷。這點要關(guān)注到分布式數(shù)據(jù)庫的處理邏輯，驗證其這方面能力如何。

數(shù)據(jù)分析需求

針對數(shù)據(jù)分析類需求，很多分布式數(shù)據(jù)庫考慮到這點，引入諸如HTAP方向的技術(shù)能力來解決。有此類需求的場景，需重點驗證。

2. 工具實踐：分片設(shè)計輔助分析

如上面闡述，在分布式數(shù)據(jù)庫改造中，選擇需分片的表、確定分片字段及方式是非常重要的環(huán)節(jié)。之前在不少客戶實施過程中，這一過程較為繁瑣。雖然通過用戶培訓(xùn)，能夠了解原理上手設(shè)計，但在實操中如何從紛繁復(fù)雜的運行環(huán)境中找到要點，在眾多可能選擇中選出相對較優(yōu)仍比較困難。為解決上述問題，自己嘗試通過工具解決上述痛點，降低遷移難度、減少工作量。其原理是以運行環(huán)境中SQL為輸入，通過解析SQL語句，找到業(yè)務(wù)核心對象及使用方式；再關(guān)聯(lián)數(shù)據(jù)字典提取數(shù)據(jù)特征，方便設(shè)計者快速做出選擇且不遺漏重要信息。下面根據(jù)工具輸出，簡單介紹下，感興趣者可與我私聊。

1).輸出解讀

概覽信息

此部分主要為概覽性信息，主要包括數(shù)據(jù)庫及分析語句。

此部分為收集數(shù)據(jù)庫信息。目前支持MySQL，其他數(shù)據(jù)庫可擴展支持。

此部分為分析SQL文本。根據(jù)輸入，可能為多條。

設(shè)計參考

此部分是根據(jù)輸入的SQL語句，提取出表。根據(jù)數(shù)據(jù)字典信息提取表的統(tǒng)計信息。這里需重點關(guān)注表大小。如上面所說，表大小分片設(shè)計的考慮因素之一。小規(guī)模的表，是可以考慮設(shè)計為單表或廣播表。

此部分是根據(jù)數(shù)據(jù)表，提取索引信息。這些原有的索引設(shè)計，可作為后續(xù)分片設(shè)計的參考之一。此外，分片情況下索引代價過大，也可根據(jù)此信息做取舍設(shè)計。

此部分根據(jù)SQL語句解析結(jié)果，提取關(guān)聯(lián)或過濾謂詞；并進(jìn)一步將謂詞左右的字段及字段數(shù)據(jù)特征顯示出來。這些提取出的字段，可作為分片鍵字段選擇的重要參考依據(jù)。其對應(yīng)的數(shù)據(jù)類型、是否為空、基數(shù)及使用它的謂詞，可方便設(shè)計者快速決策。

2).使用建議

工具使用上，可依據(jù)如下步驟：

提取業(yè)務(wù)SQL。可通過系統(tǒng)日志、數(shù)據(jù)庫日志等，提取業(yè)務(wù)SQL，作為工具輸入。提取的SQL需真實反應(yīng)線上情況，不遺漏重要的業(yè)務(wù)SQL。

分析業(yè)務(wù)SQL。通過工具分析提取SQL，獲取輸出報告。

輔助設(shè)計。得到報告后，可根據(jù)數(shù)據(jù)量定位待分片表；根據(jù)表字段及謂詞字段，確定分片鍵的范圍；根據(jù)前面信息和索引，做出初步的設(shè)計決策。

驗證設(shè)計。根據(jù)初步的設(shè)計結(jié)果，在分布式環(huán)境下驗證上述設(shè)計，判斷是否滿足之前提到的語法、語義及性能。

3).增強改進(jìn)

這一工具，目前僅考慮到SQL文本，未來可增加對runtime信息的捕獲能力，可更為準(zhǔn)確描述業(yè)務(wù)負(fù)載。從上述信息中增加對不同語句權(quán)重，為后續(xù)設(shè)計判斷提供更為豐富的依據(jù)。?

責(zé)任編輯：武曉燕來源：韓鋒頻道

分布式數(shù)據(jù)庫工具

51CTO技術(shù)棧公眾號

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營