自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

層次查詢SQL性能故障不斷?給你份可靠的避坑指南!

數(shù)據(jù)庫 SQL Server
近期頻頻遇到層次查詢SQL的性能問題,結(jié)合歷史故障案例,匯總了一些場景connect by常見的性能故障類型,在本文中做個分享。

近期頻頻遇到層次查詢SQL的性能問題,結(jié)合歷史故障案例,匯總了一些場景connect by常見的性能故障類型,在本文中做個分享。

一、結(jié)果中過濾or生成樹中過濾

過濾條件放置于where后,為在結(jié)果樹生成完成后裁剪葉子節(jié)點;放置于connect by后,為在生成樹的過程中裁剪子樹。

頻繁發(fā)生的現(xiàn)象是業(yè)務(wù)邏輯上其實并不需要先生成結(jié)果樹再去過濾,由于開發(fā)人員對過濾條件放置于不同的位置(where 后,connect by后)產(chǎn)生的過濾效果混淆,導(dǎo)致了低效的性能。

下面這個SQL就是典型案例。用戶反饋,zzzz.SYS_RC_ROUTE_DETAIL表上生產(chǎn)環(huán)境就3000+條數(shù)據(jù),但SQL語句運行時卻跑不出來結(jié)果:

 

  1. select  xxxxx 
  2.   from zzzz.SYS_RC_ROUTE_DETAIL t 
  3.  where t.route_id = (select a.route_id 
  4.                        from xxx.sys_rc_route a, xxx.g_wo_base b 
  5.                       where a.route_id = b.route_id 
  6.                         and b.work_order = 'yyyyyyyyy'
  7.  start with t.node_type = '0' 
  8. connect by nocycle prior next_node_id = node_id 

讓客戶運行了SQL一分鐘后cancel掉,抓取了監(jiān)視報告如下:

層次查詢SQL性能故障不斷?給你份可靠的避坑指南!

問題點很明顯,表中nextnodeid = node_id的重復(fù)值很多,導(dǎo)致了海量的結(jié)果集。SQL運行的一分鐘內(nèi),connect by尚未把完整的樹生產(chǎn)完成,就已經(jīng)有了3000W+數(shù)據(jù),于是我們開始思考,在邏輯上是否有必要在構(gòu)建完整的樹后再過濾。

與業(yè)務(wù)部門溝通后,發(fā)現(xiàn)果然不需要。

以下數(shù)據(jù)可以測試下,3000行數(shù)據(jù)量,但是count(*) 會非常慢。

 

  1. SQL> create table test1 as 
  2. select 
  3.     mod(rownum,2)                     id, 
  4.     mod(rownum +1 ,2)                  id2 
  5. from 
  6.     dual 
  7. connect by level <= 3000 
  8. ;  2    3    4    5    6    7    8 
  9.  
  10. Table created. 
  11.  
  12. SQL> set timing on 
  13. SQL> select count(*) from test1  where id =0  start with id =0 connect by nocycle prior id = id2 ; 
  14.  
  15.   COUNT(*) 
  16. ---------- 
  17.       1500 
  18.  
  19. Elapsed: 00:09:26.88 
  20. SQL> 

結(jié)果中過濾如上所示,用了9分鐘;而生成樹中過濾則只用0.3s:

 

  1. SQL> select count(*) from test1  start with id =0 connect by nocycle prior id = id2 and id = 0 ; 
  2.  
  3.   COUNT(*) 
  4. ---------- 
  5.       1500 
  6.  
  7. Elapsed: 00:00:00.31 

很多情況下,兩種寫法的結(jié)果集可能是相同的,如下:

 

  1. create table test2 as 
  2.  select 
  3.       rownum                     id, 
  4.       rownum +1                 id2, 
  5.       rownum + 2               id3 
  6.  from 
  7.      dual 
  8.  connect by level <= 3000; 
  9.  
  10.  SQL> select id from test2 where id3 < 10 start with id = 3 connect by nocycle prior id2 = id; 
  11.  
  12.      ID 
  13.  ---------- 
  14.       1 
  15.       2 
  16.       3 
  17.       4 
  18.       5 
  19.       6 
  20.       7 
  21.  
  22.  7 rows selected. 
  23.  
  24.  SQL> select id from test2  start with id = 1 connect by nocycle prior id2 = id and id3 <10; 
  25.  
  26.      ID 
  27.  ---------- 
  28.       1 
  29.       2 
  30.       3 
  31.       4 
  32.       5 
  33.       6 
  34.       7 
  35.  
  36.  7 rows selected. 

但其實這兩種寫法在語義上差別很大,結(jié)果集也可能不相同,如下:

 

  1.   SQL> select id from test2 where id3 = 10 start with id = 3 connect by nocycle prior id2 = id; 
  2.  
  3.     ID 
  4. ---------- 
  5.      8 
  6.  
  7. Elapsed: 00:00:00.13 
  8.  
  9. SQL> select id from test2  start with id = 3 connect by nocycle prior id2 = id and id3=10; 
  10.  
  11.     ID 
  12. ---------- 
  13.      3 
  14.  
  15. Elapsed: 00:00:00.00 

二、CBO估算不準確

層次查詢的SQL語句頻繁出現(xiàn)的問題,就是CBO估算返回結(jié)果集偏差,引起執(zhí)行計劃不準確。雖然表上收集過統(tǒng)計信息,但是CBO對于結(jié)果集的估算跟實際值偏差非常大(幾百上千的倍的差距),但是這個也不能全怪CBO,畢竟遞歸查詢有多少層、有多少數(shù)據(jù)要裁剪,結(jié)合起來考慮,結(jié)果確實難以估量。

層次查詢SQL性能故障不斷?給你份可靠的避坑指南!

 

層次查詢SQL性能故障不斷?給你份可靠的避坑指南!

對于CBO估算不準的問題,我們考慮了對結(jié)果集相對特殊的參數(shù),在SQL文本上做區(qū)分,應(yīng)用識別特殊參數(shù)運行帶hint地改造SQL,通過hint來指定返回結(jié)果集。這種情況不同于普通的數(shù)據(jù)傾斜,無法通過baseline給出一個不涉及應(yīng)用改造的方案。

層次查詢SQL性能故障不斷?給你份可靠的避坑指南!

三、并行處理

層次查詢的SQL直接使用parallel的hint,會遭遇并行串行化的問題,也就是不能真正并行。對于一些重要且耗時長的層次查詢,可以考慮PIPELINED TABLE FUNCTION改寫SQL的方式來實現(xiàn)。

以下腳本測試參考了陳煥生童鞋的blog以及oracle相關(guān)文檔(Doc ID 2168864.1):

 

  1. drop table t1; 
  2. -- t1 with 100,000 rows 
  3. create table t1 
  4. as 
  5. select 
  6.     rownum                      id, 
  7.     lpad(rownum, 10, '0')       v1, 
  8.     trunc((rownum - 1)/100)     n1, 
  9.     rpad(rownum, 100)           padding 
  10. from 
  11.     dual 
  12. connect by level <= 100000 
  13.  
  14. begin 
  15.     dbms_stats.gather_table_stats(user,'T1'); 
  16. end
  17.  
  18. select /*+ monitor */ 
  19.     count(*) 
  20. from 
  21.     select 
  22.         CONNECT_BY_ROOT ltrim(id) root_id, 
  23.         CONNECT_BY_ISLEAF is_leaf, 
  24.         level as t1_level, 
  25.         a.v1 
  26.     from t1 a 
  27.     start with a.id <=1000 
  28.     connect by NOCYCLE id = prior id + 1000 
  29. ); 
  30.  
  31. create or replace package refcur_pkg 
  32. AS 
  33.     TYPE R_REC IS RECORD (row_id ROWID); 
  34.     TYPE refcur_t IS REF CURSOR RETURN R_REC; 
  35. END
  36.  
  37. create or replace package connect_by_parallel 
  38. as 
  39.    /*  Naviagates a shallow hiearchy in parallel, where we do a tree walk for each root */ 
  40.  
  41.     CURSOR C1 (p_rowid ROWID) IS     -- Cursor done for each subtree. This select is provided by the customer 
  42.     select  CONNECT_BY_ROOT ltrim(id) root_id, CONNECT_BY_ISLEAF is_leaf, level as t1_level, a.v1 
  43.           from t1 a 
  44.           start with rowid = p_rowid 
  45.           connect by NOCYCLE id = prior id + 1000; 
  46.  
  47.     TYPE T1_TAB is TABLE OF C1%ROWTYPE; 
  48.  
  49.     FUNCTION treeWalk (p_ref refcur_pkg.refcur_t) RETURN T1_TAB 
  50.              PIPELINED 
  51.     PARALLEL_ENABLE(PARTITION p_ref BY ANY); 
  52.  
  53. END connect_by_parallel; 
  54.  
  55. create or replace package body connect_by_parallel 
  56. as  
  57. FUNCTION treeWalk (p_ref refcur_pkg.refcur_t) RETURN T1_TAB 
  58.           PIPELINED PARALLEL_ENABLE(PARTITION p_ref BY ANY
  59. IS 
  60.   in_rec p_ref%ROWTYPE; 
  61. BEGIN 
  62.    execute immediate 'alter session set "_old_connect_by_enabled"=true'
  63.    LOOP -- for each root 
  64.     FETCH p_ref INTO in_rec; 
  65.     EXIT WHEN p_ref%NOTFOUND; 
  66.     FOR c1rec IN c1(in_rec.row_id)  LOOP -- retrieve rows of subtree 
  67.         PIPE ROW(c1rec); 
  68.     END LOOP; 
  69.   END LOOP; 
  70.   execute immediate 'alter session set "_old_connect_by_enabled"=false';  
  71.   RETURN
  72. END  treeWalk; 
  73.  
  74. END connect_by_parallel; 
  75.  
  76. SELECT 
  77.   /*+ monitor */ 
  78.   COUNT(*) 
  79. FROM TABLE(connect_by_parallel.treeWalk (CURSOR 
  80.   (SELECT /*+ parallel (a 100) */ 
  81.     rowid FROM t1 a WHERE id <= 100))) b; 

層次查詢的SQL在整個SQL優(yōu)化場景中占比相對較小,但這種類型的SQL優(yōu)化卻往往比較麻煩,本文分享的三個案例均為實戰(zhàn)中總結(jié),對于Oracle層次查詢的SQL優(yōu)化有極大的借鑒意義,特別是陳煥生提供的做并行的案例,含金量很高,感興趣的童鞋可以測試下。

作者介紹

蔣健,云趣網(wǎng)絡(luò)科技聯(lián)合創(chuàng)始人,Oracle ACE,11g OCM,多年Oracle設(shè)計、管理及實施經(jīng)驗,精通數(shù)據(jù)庫優(yōu)化,Oracle CBO及并行原理。云趣鷹眼監(jiān)控核心設(shè)計和開發(fā)者,資深Python Web開發(fā)者。

責(zé)任編輯:未麗燕 來源: DBAplus社群
相關(guān)推薦

2018-07-03 10:49:22

性能故障排查

2024-04-03 12:30:00

C++開發(fā)

2024-04-24 13:45:00

2021-02-26 00:46:11

CIO數(shù)據(jù)決策數(shù)字化轉(zhuǎn)型

2020-12-16 10:00:59

Serverless數(shù)字化云原生

2021-02-22 17:00:31

Service Mes微服務(wù)開發(fā)

2022-03-04 18:11:16

信服云

2021-05-08 12:30:03

Pythonexe代碼

2023-05-24 10:06:42

多云實踐避坑

2021-05-07 21:53:44

Python 程序pyinstaller

2018-01-20 20:46:33

2020-06-12 11:03:22

Python開發(fā)工具

2021-04-28 09:26:25

公有云DTS工具

2020-08-26 07:37:25

Nacos微服務(wù)SpringBoot

2023-11-01 15:32:58

2019-02-12 15:07:42

屏幕參數(shù)PC

2018-03-26 11:14:13

程序猿bug代碼

2019-04-24 17:45:24

微服務(wù)容器青云

2021-08-02 08:53:26

設(shè)計師面試求職

2020-09-13 09:19:10

LinuxPython3.6
點贊
收藏

51CTO技術(shù)棧公眾號