自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認證廠商認證 IT技術(shù)PMP項目管理免費題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設(shè)置退出

優(yōu)秀的優(yōu)化器是在實踐中磨練出來的

作者：白鱔 2022-11-26 00:02:00

數(shù)據(jù)庫其他數(shù)據(jù)庫

Oracle DBA看到這條SQL會覺得十分不解，為啥能寫出這樣的SQL語句來呢？程序員的大腦DBA是很難理解的。就是不知道我們的數(shù)據(jù)庫廠商懂不懂了。不過實際應(yīng)用場景中我們確實經(jīng)常遇到這樣的奇葩SQL。

?在和一些國產(chǎn)數(shù)據(jù)庫廠商的朋友交流的的時候，總能聽到他們說自己的優(yōu)化器是高手設(shè)計出來的，充分利用了現(xiàn)代軟硬件技術(shù)，因此與Oracle相比只強不弱。我不太贊成這樣的說法，因為一個優(yōu)秀的優(yōu)化器設(shè)計能夠做到的只是在大的框架上比較不錯，針對一些常規(guī)的SQL語句比較有效，而SQL語句的復(fù)雜性往往遠遠超出數(shù)據(jù)庫設(shè)計人員的想象，我們的數(shù)據(jù)庫廠商也往往低估了開發(fā)人員寫SQL的能力。那些天馬行空的神來之筆，會讓再優(yōu)秀的優(yōu)化器都感到力不從心。

前些年一個朋友在做一個數(shù)據(jù)庫遷移的時候遇到一條SQL的性能問題，這條SQL在Oracle上執(zhí)行的效率很不錯，但是到了一個基于PG的國產(chǎn)數(shù)據(jù)庫上，就慢得讓人受不了了。我們通過一個簡單的測試案例來復(fù)現(xiàn)這個問題。

用戶現(xiàn)場是一個內(nèi)網(wǎng)系統(tǒng)，因此我們只能采用模仿的方式來給大家復(fù)一復(fù)盤。我們用dba_objects和dba_tables兩個系統(tǒng)視圖來創(chuàng)建兩張物理表。然后執(zhí)行這條語句：

Oracle DBA看到這條SQL會覺得十分不解，為啥能寫出這樣的SQL語句來呢？程序員的大腦DBA是很難理解的。就是不知道我們的數(shù)據(jù)庫廠商懂不懂了。不過實際應(yīng)用場景中我們確實經(jīng)常遇到這樣的奇葩SQL。

我們在PG數(shù)據(jù)庫上做一個類似的測試用例，我們使用PG_TABLES、PG_INDEXES這兩個視圖來創(chuàng)建t1/t2表。

保險起見，建完表后我們做一次vacuum analyze。然后看看這條SQL的執(zhí)行計劃如何：

這條SQL貌似執(zhí)行速度還行，不過實際上真實環(huán)境的數(shù)據(jù)是不同的。我們從執(zhí)行計劃上來看看會有些什么問題。首先在T2表上是做了一個根據(jù)掃描，查到一個數(shù)組，這個被定義為SubPlan1，然后對T1表做掃描，通過SubPlan1的結(jié)果做過濾，獲得最終的數(shù)據(jù)。這個執(zhí)行計劃的問題實際上是十分明顯的，當(dāng)T1/T2表很大的時候，這個查詢會變得很慢。比如我們增加T2的大小到幾萬條記錄。

可以看到，PG的執(zhí)行計劃變成了在T2表上通過索引掃描，這是優(yōu)化器做了有效的優(yōu)化。我們用同樣的方法擴大T2表，到幾十萬條記錄，看看會有什么情況。

執(zhí)行計劃還是如此，而執(zhí)行時間已經(jīng)加大到400多毫秒了。如果數(shù)據(jù)庫的IO性能有點問題，并且t1表十分巨大，那么這個執(zhí)行計劃肯定就會有問題了。實際生產(chǎn)環(huán)境中就是因為數(shù)據(jù)量較大，才出現(xiàn)了性能問題。

我們再來看看Oracle的執(zhí)行計劃，可以看出這兩個執(zhí)行計劃之間的差異是很大的。

Oracle的執(zhí)行計劃采用了一個Hash 半連接，通過兩次索引掃描獲得半連接的兩個半?yún)^(qū)數(shù)據(jù)，然后用HASH UNIQUE探測內(nèi)表數(shù)據(jù)。做一個10053 trace我們可以看到，Oracle在編譯這條SQL的時候，做了多種FPD和轉(zhuǎn)換的分析，最終才找到了這個最優(yōu)解。如果對這個分析過程感興趣的朋友可以自己做個10053看看，這里篇幅有限我就不做詳細的介紹了，整個trace文件接近6000行。

這個執(zhí)行計劃可以說是沒有太大毛病的，通過兩個索引避免了兩張大表的全表掃描，通過Hash半連接確保了整個JOIN的總體規(guī)模可控。

一個優(yōu)秀的數(shù)據(jù)庫產(chǎn)品，其優(yōu)化器一定會隨著應(yīng)用規(guī)模的擴大，遇到的奇葩SQL越多而變得越來越強大的。如果我們總是告訴用戶，你不應(yīng)該這么寫SQL，而不從優(yōu)化器的角度去解決這些奇葩SQL的性能問題，那么我們的進步就會變得太慢，我們與Oracle的技術(shù)差距就會越來越大。

對于這個案例，前陣子我正好和一家國產(chǎn)數(shù)據(jù)庫廠商做過一些交流。他們的老版本中的執(zhí)行計劃也不是很好。

當(dāng)時我和廠商的朋友分析他們的執(zhí)行計劃的時候，我認為雖然在T2的TABLE SCAN上做了LIMIT(1)的過濾，但是如果符合條件的記錄位于一張大表的最后幾行，那么這個掃描的成本會很高。并且最致命的是Nested loop Join Cartestan這個算子，如果T1符合條件的數(shù)據(jù)比較多，那么這條SQL的執(zhí)行效率將會特別低，甚至幾個小時執(zhí)行不出來。

最近我測試了他們的最新版本的產(chǎn)品，讓我感到了新版本在優(yōu)化器方面的能力提升還是比較大的。

當(dāng)表的數(shù)據(jù)量不大的時候，執(zhí)行計劃通過對兩個索引的掃描，然后做MERGE半連接。

數(shù)據(jù)量較大的時候，執(zhí)行計劃改走了Hash 右半連接，與Oracle的執(zhí)行計劃不同的是，對較小的表T1采用了全表掃描的模式。

雖然在這個執(zhí)行計劃上還有一些可以商榷的地方，不過不同的數(shù)據(jù)庫因為對全表掃描的成本的計算不同，因此可能會有不同的選擇。從兩個版本的執(zhí)行計劃的優(yōu)化效果上，我們也看到了國產(chǎn)數(shù)據(jù)庫在核心能力方面的進步。這種進步恐怕只能在不斷的實踐中才能磨練出來。因此我們也有理由相信，隨著數(shù)據(jù)庫信創(chuàng)工作的不斷深入，我們的數(shù)據(jù)庫產(chǎn)品也會越來越好的。?

責(zé)任編輯：武曉燕來源：白鱔的洞穴

優(yōu)化器 SQL 語句

51CTO技術(shù)棧公眾號

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營