對(duì)DB2 V9.7 本地分區(qū)索引的詳細(xì)描述
此文章主要講述的是DB2 V9.7 本地分區(qū)索引的介紹,DB2 V9.7 數(shù)據(jù)庫其提出了范圍分區(qū)表的分區(qū)索引的實(shí)際操作的概念,這主要是為客戶在原有的全局索引基礎(chǔ)上增加了一個(gè)新的功能選擇。
分區(qū)索引采用 B 樹結(jié)構(gòu),將一棵全局大樹分解為諾干個(gè)小樹,樹的層次將會(huì)顯著減少,這將會(huì)提高數(shù)據(jù)的插入、更新、刪除和掃描的性能。分區(qū)索引在分區(qū)表的 Roll in/Roll out 時(shí)不需要重新構(gòu)建整個(gè)索引,加速了數(shù)據(jù)的滾入和滾出。
簡(jiǎn)介
在 DB2 V9.7 以前,范圍分區(qū)表只支持全局索引(或者稱為非分區(qū)索引),這樣即使分區(qū)表的數(shù)據(jù)是分布在多個(gè)表空間上的,分區(qū)表的所有索引只能存儲(chǔ)在同一個(gè)表空間中。這一特性限制了索引掃描只能在一個(gè)表空間上對(duì)該索引的頁面進(jìn)行讀取,導(dǎo)致讀取頁面過多并約束了掃描的并行性。
DB2 V9.7 使用分區(qū)索引的索引組織方案,即索引數(shù)據(jù)根據(jù)表的分區(qū)方案分布到多個(gè)索引分區(qū)中,每個(gè)索引分區(qū)都只引用對(duì)應(yīng)數(shù)據(jù)分區(qū)中的表行。從 DB2 V9.7 開始,創(chuàng)建索引時(shí)默認(rèn)創(chuàng)建分區(qū)索引,除非出現(xiàn)以下情況:
對(duì) CREATE INDEX 語句指定了 UNIQUE,并且索引鍵未包括所有表分區(qū)鍵列。
創(chuàng)建基于空間數(shù)據(jù)的索引。
創(chuàng)建基于 XML 數(shù)據(jù)的索引
分區(qū)索引的創(chuàng)建
一個(gè)分區(qū)表可以同時(shí)存在分區(qū)索引和非分區(qū)索引。如果創(chuàng)建分區(qū)索引,那個(gè)每個(gè)索引分區(qū)將都包含單個(gè)數(shù)據(jù)分區(qū)的索引條目,索引葉子節(jié)點(diǎn)中的 RID 也將只指向單個(gè)數(shù)據(jù)分區(qū)。
在我們使用 Alter table 語句的 Attach Partition 子句將數(shù)據(jù) Roll in 或者 Roll Out 分區(qū)表時(shí),分區(qū)索引將特別有用。如果使用非分區(qū)索引,那么必須先發(fā)出 Set Integrity 語句,新添加的分區(qū)中的數(shù)據(jù)才能進(jìn)入聯(lián)機(jī)狀態(tài)。這個(gè)過程可能非常消耗時(shí)間,并可能消耗大量日志空間。當(dāng)使用分區(qū)索引時(shí)這些開銷將會(huì)被消除。
分區(qū)索引的每個(gè)分區(qū)均采用 B 樹結(jié)構(gòu)存儲(chǔ),由于分區(qū)后一個(gè)大型 B 樹被劃分為若干小型 B 樹,樹的層數(shù)將會(huì)減少,這會(huì)提高數(shù)據(jù)的插入、更新、刪除以及掃描的性能。同時(shí)我們執(zhí)行查詢時(shí),DB2 將會(huì)采用分區(qū)消除優(yōu)化方法提高掃描性能和并行性。分區(qū)消除技術(shù)幫助優(yōu)化器先過濾了不需要的索引分區(qū),只需要掃描相應(yīng)的分區(qū)就能完成查詢,這比掃描非分區(qū)的索引更為高效。
清單 1. 創(chuàng)建示例分區(qū)表與索引
- CREATE TABLE t1 ( l_orderkey INTEGER, l_partkey INTEGER, l_suppkey INTEGER,
- l_shipdate date, padding1 char(30) )
- PARTITION BY RANGE(l_shipdate)
- (
- partition quarter01 STARTING '2008-01-01' ENDING '2008-03-31'in DMS_D1,
- partition quarter02 STARTING '2008-04-01' ENDING '2008-06-30'in DMS_D2,
- partition quarter03 STARTING '2008-07-01' ENDING '2008-09-30' in DMS_D3,
- partition quarter04 STARTING '2008-10-01' ENDING '2008-12-31' in DMS_D4
- );
- Create index idx_t1_l_orderkey on t1(l_orderkey) NOT partitioned ;
- Create index idx_t1_l_partkey on t1(l_partkey) partitioned;
上面代碼中,我們創(chuàng)建了一個(gè)擁有四個(gè)分區(qū)的范圍分區(qū)表,同時(shí)創(chuàng)建了兩個(gè)索引。索引 index idx_t1_l_orderkey 是非分區(qū)索引,idx_t1_l_partkey 是分區(qū)索引。
我們下面查看一下上面代碼執(zhí)行后數(shù)據(jù)字典關(guān)于表 T1 以及它的索引的描述。系統(tǒng)視圖 syscat.datapartitions 中包含了分區(qū)表的分區(qū)信息以及相關(guān)統(tǒng)計(jì)信息,系統(tǒng)視圖 syscat.indexpartitions 中則包含了分區(qū)索引的分區(qū)信息和相關(guān)統(tǒng)計(jì)信息。
清單 2. 分區(qū)表的數(shù)據(jù)分區(qū)信息
- db2 "select substr(TABNAME ,1,10) t_name,substr(DATAPARTITIONNAME ,1,10) part_name,
- DATAPARTITIONID ,substr(LOWVALUE,1,12) low_value,substr(HIGHVALUE,1,12) high_value
- from syscat.datapartitions where tabname='T1'"
- T_NAME PART_NAME DATAPARTITIONID TBSPACEID LOW_VALUE HIGH_VALUE ----------
- T1 QUARTER01 0 8 '2008-01-01' '2008-03-31'
- T1 QUARTER02 1 9 '2008-04-01' '2008-06-30'
- T1 QUARTER03 2 10 '2008-07-01' '2008-09-30'
- T1 QUARTER04 3 11 '2008-10-01' '2008-12-31'
清單 2 中代碼執(zhí)行查詢,從系統(tǒng)視圖 syscat.datapartitions 中獲取關(guān)于數(shù)據(jù)分區(qū)的信息。查詢結(jié)果顯示,表 T1 具有四個(gè)分區(qū),名稱與我們創(chuàng)建時(shí)相同,ID 依次為 0、1、2、3,數(shù)據(jù)分布在表空間 DMS_D1(ID 為 8)、DMS_D2(ID 為 9)、DMS_D2(ID 為 10)、DMS_D3(ID 為 11)上。本例中的表空間信息如下:
清單 3. 表空間信息
- db2 "select substr(TBSPACE,1,18) tablespace_name,TBSPACEID ,TBSPACETYPE
- from syscat.tablespaces"
- TABLESPACE_NAME TBSPACEID TBSPACETYPE
- SYSCATSPACE 0 D TEMPSPACE1 1 S USERSPACE1 2 D
- IBMDB2SAMPLEREL 3 D IBMDB2SAMPLEXML 4 D SYSTOOLSPACE 5 D
- SYSTOOLSTMPSPACE 6 S TBS_TEST 7 D
- DMS_D1 8 D DMS_D2 9 D DMS_D3 10 D DMS_D4 11 D DMS_I1 12 D
清單 4. 索引基本信息
- db2 "select substr(tabname,1,10) tab_name, substr(INDNAME,1,18) inx_name,TBSPACEID
- from syscat.indexes where tabname='T1'"
- TAB_NAME INX_NAME TBSPACEID ---------- ------------------ -----------
- T1 IDX_T1_L_ORDERKEY
- 8
- T1 IDX_T1_L_PARTKEY 65530
我們看到非分區(qū)索引 IDX_T1_L_ORDERKEY 數(shù)據(jù)存放在表空間 DMS_D1 上(ID 為 8),這意味著在創(chuàng)建索引未明確指定表空間時(shí),DB2 將使用***個(gè)數(shù)據(jù)分區(qū)所在的表空間存放非分區(qū)索引。而索引 IDX_T1_L_PARTKEY 所在的表空間 ID 為 65530,我們通過表空間信息部分看到我們的數(shù)據(jù)庫中沒有 ID 為 65530 表空間。
由于分區(qū)索引的存儲(chǔ)特性是和數(shù)據(jù)分區(qū)關(guān)聯(lián)的,一個(gè)索引將分布在多個(gè)表空間中,因此 DB2 用了 65530 特殊值表示索引的表空間,并不表示這個(gè) ID 對(duì)應(yīng)的表空間存在以上的相關(guān)內(nèi)容就是對(duì)DB2 V9.7 本地分區(qū)索引的介紹,望你能有所收獲。
完整內(nèi)容的學(xué)習(xí),請(qǐng)?jiān)L問:
http://www.ibm.com/developerworks/cn/data/library/techarticles/dm-0907luohq/
【編輯推薦】