Oracle聚簇索引的使用方式
很多初學(xué)者,在接觸Oracle數(shù)據(jù)庫后,都會很疑惑Oracle聚簇索引是什么,如何使用Oracle聚簇索引,Oracle散列聚簇又與Oracle聚簇索引有什么關(guān)系。本文針對這3個問題結(jié)合相關(guān)資料,給出了點看法。
1. 什么是聚簇
聚簇是根據(jù)碼值找到數(shù)據(jù)的物理存儲位置,從而達(dá)到快速檢索數(shù)據(jù)的目的。Oracle聚簇索引的順序就是數(shù)據(jù)的物理存儲順序,葉節(jié)點就是數(shù)據(jù)節(jié)點。非聚簇索引的順序與數(shù)據(jù)物理排列順序無關(guān),葉節(jié)點仍然是索引節(jié)點,只不過有一個指針指向?qū)?yīng)的數(shù)據(jù)塊。一個表最多只能有一個聚簇索引。
2. 使用 Oracle聚簇索引
聚簇是一種存儲表的方法,這些表密切相關(guān)并經(jīng)常一起連接進(jìn)磁盤的同一區(qū)域。例如,表 BOOKSHELF 和BOOKSHELF_AUTHOR 數(shù)據(jù)行可以一起插入到稱為簇(Cluster)的單個區(qū)域中,而不是將兩個表放在磁盤上的不同扇區(qū)上。簇鍵(Cluster Key)可以是一列或多列,通過這些列可以將這些表在查詢中連接起來(例如,BOOKSHELF表和BOOKSHELF_AUTHOR表中的 Title列)。為了將表聚集在一起,必須擁有這些將要聚集在一起的表。
下面是create cluster命令的基本格式:
create cluster (column datatype [, column datatype]...) [other options];
cluster的名字遵循表命名約定,column datatype是將作為簇鍵使用的名字和數(shù)據(jù)類型。column的名字可以與將要放進(jìn)該簇中的表的一個列名相同,或者為其他有效名字。下面是一個例子:
create cluster BOOKandAUTHOR (Col1 VARCHAR2(100));
這樣就建立了一個沒有任何內(nèi)容的簇(象給表分配了一塊空間一樣)。COL1的使用對于簇鍵是不相干的,不會再使用它。但是,它的定義應(yīng)該與要增加的表的主鍵相符。接下來,建立包含在該簇中的表:
create table BOOKSHELF
(Title VARCHAR2(100) primary key,
Publisher VARCHAR2(20),
CategoryName VARCHAR2(20),
Rating VARCHAR2(2),
constraint CATFK foreign key (CategoryName) references CATEGORY(CategoryName)
)
cluster BOOKandAUTHOR(Title);
在向BOOKSHELF表中插入數(shù)據(jù)行之前,必須建立一個Oracle聚簇索引:
create index BOOKandAUTHORndx on cluster BOOKandAUTHOR;
在上面的create table語句中,簇BOOKandAUTHOR(Title)子句放在表的列清單的閉括號的后面。BOOKandAUTHOR是前面建立的聚簇的名字。
Title是將存儲到聚簇Col1中的該表的列。create cluster語句中可能會有多個簇鍵,并且在created table語句中可能有多個列存儲在這些鍵中。請注意,沒有任何語句明確說明Title列進(jìn)入到Col1中。這種匹配僅僅是通過位置做到的,即Col1和Title都是在它們各自的簇語句中提到的***個對象。多個列和簇鍵是***個與***個匹配,第二個與第二個匹配,第三個與第三個匹配,等等?,F(xiàn)在,添加第二個表到聚簇中:
create table BOOKSHELF_AUTHOR
(Title VARCHAR2(100),
AuthorName VARCHAR2(50),
constraint TitleFK Foreign key (Title) references BOOKSHELF(Title),
constraint AuthorNameFK Foreign key (AuthorName) references AUTHOR(AuthorName)
)
cluster BOOKandAUTHOR (Title);
當(dāng)這兩個表被聚在一起時,每個***的Title在簇中實際只存儲一次。對于每個Title,都從這兩個表中附加列。
來自這兩個表的數(shù)據(jù)實際上存放在一個位置上,就好像簇是一個包含兩個表中的所有數(shù)據(jù)的大表一樣。
3. 散列聚簇
對于散列聚簇,它只有一個表。它通過散列算法求出存儲行的物理存儲位置,從而快速檢索數(shù)據(jù)。創(chuàng)建散列聚簇時要指定碼列的數(shù)據(jù)類型,數(shù)據(jù)行的大小及不同碼值的個數(shù)。如果碼值不是平均分布的,就可能有許多行存儲到溢出塊上,從而會降低查詢該表的SQL語句的性能。
散列聚簇被用在總是通過主鍵查詢數(shù)據(jù)的情況,例如要從表 T 查詢數(shù)據(jù)并且查詢語句總是是這樣:
select * from T where id = :x;
這時散列聚簇是一個好的選擇,因為不需要索引。Oracle 將通過散列算法得到值 :x 所對應(yīng)的物理地址,從而直接取到數(shù)據(jù)。不用進(jìn)行索引掃描,只通過散列值進(jìn)行一次表訪問。
【編輯推薦】