Oracle性能優(yōu)化之SQL優(yōu)化【上】
(1) 選擇最有效率的表名順序 (只在基于規(guī)則的優(yōu)化器 (Oracle 有兩種優(yōu)化器:RBO 基于規(guī)則的優(yōu)化器和 CBO 基于成本的優(yōu)化器) 中有效):
ORACLE 的解析器按照從右到左的順序處理 FROM 子句中的表名,F(xiàn)ROM 子句中寫在***的表 (基礎(chǔ)表 driving table) 將被***處理,在 FROM 子句中包含多個(gè)表的情況下, 你必須選擇記錄條數(shù)最少的表作為基礎(chǔ)表。如果有 3 個(gè)以上的表連接查詢, 那就需要選擇交叉表 (intersection table) 作為基礎(chǔ)表, 交叉表是指那個(gè)被其他表所引用的表。
(2) WHERE 子句中的連接順序.:
ORACLE 采用自下而上的順序解析 WHERE 子句,根據(jù)這個(gè)原理,表之間的連接必須寫在其他 WHERE 條件之前,那些可以過濾掉***數(shù)量記錄的條件必須寫在 WHERE 子句的末尾。
(3) SELECT 子句中避免使用 ‘ * ‘:
ORACLE 在解析的過程中, 會(huì)將’*’ 依次轉(zhuǎn)換成所有的列名, 這個(gè)工作是通過查詢數(shù)據(jù)字典完成的,這意味著將耗費(fèi)更多的時(shí)間。
(4) 減少訪問數(shù)據(jù)庫的次數(shù):
ORACLE 在內(nèi)部執(zhí)行了許多工作: 解析 SQL 語句,估算索引的利用率,綁定變量,讀數(shù)據(jù)塊等;
(5) 在 SQL*Plus , SQL*Forms 和 Pro*C 中重新設(shè)置 ARRAYSIZE 參數(shù),可以增加每次數(shù)據(jù)庫訪問的檢索數(shù)據(jù)量, 建議值為 200。
(6) 使用 DECODE 函數(shù)來減少處理時(shí)間:
使用 DECODE 函數(shù)可以避免重復(fù)掃描相同記錄或重復(fù)連接相同的表。
(7) 整合簡(jiǎn)單, 無關(guān)聯(lián)的數(shù)據(jù)庫訪問:
如果你有幾個(gè)簡(jiǎn)單的數(shù)據(jù)庫查詢語句, 你可以把它們整合到一個(gè)查詢中 (即使它們之間沒有關(guān)系)
(8) 刪除重復(fù)記錄:
***效的刪除重復(fù)記錄方法 (因?yàn)槭褂昧?ROWID) 例子:
DELETE FROM EMP E WHERE E.ROWID > (SELECT MIN(X.ROWID)
FROM EMP X WHERE X.EMP_NO = E.EMP_NO);
(9) 用 TRUNCATE 替代 DELETE:
當(dāng)刪除表中的記錄時(shí),在通常情況下,回滾段 (rollback segments) 用來存放可以被恢復(fù)的信息。 如果你沒有 COMMIT 事務(wù), ORACLE 會(huì)將數(shù)據(jù)恢復(fù)到刪除之前的狀態(tài) (準(zhǔn)確地說是恢復(fù)到執(zhí)行刪除命令之前的狀況) 而當(dāng)運(yùn)用 TRUNCATE 時(shí), 回滾段不再存放任何可被恢復(fù)的信息。 當(dāng)命令運(yùn)行后,數(shù)據(jù)不能被恢復(fù)。 因此很少的資源被調(diào)用,執(zhí)行時(shí)間也會(huì)很短. (譯者按: TRUNCATE 只在刪除全表適用, TRUNCATE 是 DDL 不是 DML)
(10) 盡量多使用 COMMIT:
只要有可能,在程序中盡量多使用 COMMIT,這樣程序的性能得到提高,需求也會(huì)因?yàn)?COMMIT 所釋放的資源而減少:
COMMIT 所釋放的資源:
a. 回滾段上用于恢復(fù)數(shù)據(jù)的信息
b. 被程序語句獲得的鎖
c. redo log buffer 中的空間
d. ORACLE 為管理上述 3 種資源中的內(nèi)部花費(fèi)
(11) 用 Where 子句替換 HAVING 子句:
避免使用 HAVING 子句, HAVING 只會(huì)在檢索出所有記錄之后才對(duì)結(jié)果集進(jìn)行過濾。這個(gè)處理需要排序,總計(jì)等操作。如果能通過 WHERE 子句限制記錄的數(shù)目,那就能減少這方面的開銷。(非 oracle 中)on、where、having 這三個(gè)都可以加條件的子句中,on 是***執(zhí)行,where 次之,having ***,因?yàn)?on 是先把不符合條件的記錄過濾后才進(jìn)行統(tǒng)計(jì),它就可以減少中間運(yùn)算要處理的數(shù)據(jù),按理說應(yīng)該速度是最快的,where 也應(yīng)該比 having 快點(diǎn)的,因?yàn)樗^濾數(shù)據(jù)后才進(jìn)行 sum,在兩個(gè)表聯(lián)接時(shí)才用 on 的,所以在一個(gè)表的時(shí)候,就剩下 where 跟 having 比較了。在這單表查詢統(tǒng)計(jì)的情況下,如果要過濾的條件沒有涉及到要計(jì)算字段,那它們的結(jié)果是一樣的,只是 where 可以使用 rushmore 技術(shù),而 having 就不能,在速度上后者要慢如果要涉及到計(jì)算的字段,就表示在沒計(jì)算之前,這個(gè)字段的值是不確定的,根據(jù)上篇寫的工作流程,where 的作用時(shí)間是在計(jì)算之前就完成的,而 having 就是在計(jì)算后才起作用的,所以在這種情況下,兩者的結(jié)果會(huì)不同。在多表聯(lián)接查詢時(shí),on 比 where 更早起作用。系統(tǒng)首先根據(jù)各個(gè)表之間的聯(lián)接條件,把多個(gè)表合成一個(gè)臨時(shí)表后,再由 where 進(jìn)行過濾,然后再計(jì)算,計(jì)算完后再由 having 進(jìn)行過濾。由此可見,要想過濾條件起到正確的作用,首先要明白這個(gè)條件應(yīng)該在什么時(shí)候起作用,然后再?zèng)Q定放在那里
(12) 減少對(duì)表的查詢:
在含有子查詢的 SQL 語句中, 要特別注意減少對(duì)表的查詢。 例子:
SELECT TAB_NAME FROM TABLES WHERE (TAB_NAME,DB_VER) = ( SELECT
TAB_NAME,DB_VER FROM TAB_COLUMNS WHERE VERSION = 604)
(13) 通過內(nèi)部函數(shù)提高 SQL 效率.:
復(fù)雜的 SQL 往往犧牲了執(zhí)行效率。 能夠掌握上面的運(yùn)用函數(shù)解決問題的方法在實(shí)際工作中是非常有意義的
(14) 使用表的別名 (Alias):
當(dāng)在 SQL 語句中連接多個(gè)表時(shí), 請(qǐng)使用表的別名并把別名前綴于每個(gè) Column 上。這樣一來, 就可以減少解析的時(shí)間并減少那些由 Column 歧義引起的語法錯(cuò)誤。
(15) 用 EXISTS 替代 IN、用 NOT EXISTS 替代 NOT IN:
在許多基于基礎(chǔ)表的查詢中, 為了滿足一個(gè)條件,往往需要對(duì)另一個(gè)表進(jìn)行聯(lián)接. 在這種情況下,使用 EXISTS(或 NOT EXISTS) 通常將提高查詢的效率。 在子查詢中,NOT IN 子句將執(zhí)行一個(gè)內(nèi)部的排序和合并。 無論在哪種情況下,NOT IN 都是***效的 (因?yàn)樗鼘?duì)子查詢中的表執(zhí)行了一個(gè)全表遍歷)。 為了避免使用 NOT IN,我們可以把它改寫成外連接 (Outer Joins) 或 NOT EXISTS.
例子:
(高效)SELECT * FROM EMP (基礎(chǔ)表) WHERE EMPNO > 0 AND EXISTS (SELECT ‘X’ FROM DEPT WHERE DEPT.DEPTNO = EMP.DEPTNO AND LOC = ‘MELB’)
(低效)SELECT * FROM EMP (基礎(chǔ)表) WHERE EMPNO > 0 AND DEPTNO IN(SELECT DEPTNO FROM DEPT WHERE LOC = ‘MELB’)
(16) 識(shí)別’低效執(zhí)行’的 SQL 語句:
雖然目前各種關(guān)于 SQL 優(yōu)化的圖形化工具層出不窮, 但是寫出自己的 SQL 工具來解決問題始終是一個(gè)***的方法:
SELECT EXECUTIONS , DISK_READS, BUFFER_GETS,
ROUND((BUFFER_GETS-DISK_READS)/BUFFER_GETS,2) Hit_radio,
ROUND(DISK_READS/EXECUTIONS,2) Reads_per_run,
SQL_TEXT
FROM V$SQLAREA
WHERE EXECUTIONS>0
AND BUFFER_GETS > 0
AND (BUFFER_GETS-DISK_READS)/BUFFER_GETS < 0.8
ORDER BY 4 DESC;
(17) 用索引提高效率:
索引是表的一個(gè)概念部分, 用來提高檢索數(shù)據(jù)的效率,ORACLE 使用了一個(gè)復(fù)雜的自平衡 B-tree 結(jié)構(gòu)。 通常, 通過索引查詢數(shù)據(jù)比全表掃描要快。 當(dāng) ORACLE 找出執(zhí)行查詢和 Update 語句的***路徑時(shí), ORACLE 優(yōu)化器將使用索引。 同樣在聯(lián)結(jié)多個(gè)表時(shí)使用索引也可以提高效率。 另一個(gè)使用索引的好處是,它提供了主鍵 (primary key) 的唯一性驗(yàn)證。那些 LONG 或 LONG RAW 數(shù)據(jù)類型,你可以索引幾乎所有的列。通常, 在大型表中使用索引特別有效。 當(dāng)然,你也會(huì)發(fā)現(xiàn), 在掃描小表時(shí),使用索引同樣能提高效率。 雖然使用索引能得到查詢效率的提高, 但是我們也必須注意到它的代價(jià)。 索引需要空間來存儲(chǔ), 也需要定期維護(hù),每當(dāng)有記錄在表中增減或索引列被修改時(shí), 索引本身也會(huì)被修改, 這意味著每條記錄的 INSERT , DELETE , UPDATE 將為此多付出 4 , 5 次的磁盤 I/O 。 因?yàn)樗饕枰~外的存儲(chǔ)空間和處理, 那些不必要的索引反而會(huì)使查詢反應(yīng)時(shí)間變慢。定期的重構(gòu)索引是有必要的:
ALTER INDEX REBUILD