面試突擊:聊聊聚簇索引和非聚簇索引到底有什么區(qū)別?
在 MySQL 默認(rèn)引擎 InnoDB 中,索引大致可分為兩類:聚簇索引和非聚簇索引,它們的區(qū)別也是常見的面試題,所以我們今天就來盤它們。
聚簇索引
聚簇索引(Clustered Index)一般指的是主鍵索引(如果存在主鍵索引的話),聚簇索引也被稱之為聚集索引。
聚簇索引在 InnoDB 中是使用 B+ 樹實(shí)現(xiàn)的,比如我們創(chuàng)建一張 student 表,它的構(gòu)建 SQL 如下:
drop table if exists student;
create table student(
id int primary key,
name varchar(16),
class_id int not null,
index (class_id)
)engine=InnoDB;
-- 添加測(cè)試數(shù)據(jù)
insert into student(id,name,class_id) values(1,'張三',100),
(2,'李四',200),(3,'王五',300);
以上 student 表中有一個(gè)聚簇索引(也就是主鍵索引)id,和一個(gè)非聚簇索引 class_id。
聚簇索引 id 對(duì)應(yīng)的 B+ 樹如下圖所示:
在聚簇索引的葉子節(jié)點(diǎn)直接存儲(chǔ)用戶信息的內(nèi)存地址,我們使用內(nèi)存地址可以直接找到相應(yīng)的行數(shù)據(jù)。
非聚簇索引
非聚簇索引在 InnoDB 引擎中,也叫二級(jí)索引,以上面 student 表為例,在 student 中非聚簇索引 class_id 對(duì)應(yīng) B+ 樹如下圖所示:
從上圖我們可以看出,在非聚簇索引的葉子節(jié)點(diǎn)上存儲(chǔ)的并不是真正的行數(shù)據(jù),而是主鍵 ID,所以當(dāng)我們使用非聚簇索引進(jìn)行查詢時(shí),首先會(huì)得到一個(gè)主鍵 ID,然后再使用主鍵 ID 去聚簇索引上找到真正的行數(shù)據(jù),我們把這個(gè)過程稱之為回表查詢。
總結(jié)
在 MySQL 的 InnoDB 引擎中,每個(gè)索引都會(huì)對(duì)應(yīng)一顆 B+ 樹,而聚簇索引和非聚簇索引最大的區(qū)別在于葉子節(jié)點(diǎn)存儲(chǔ)的數(shù)據(jù)不同,聚簇索引葉子節(jié)點(diǎn)存儲(chǔ)的是行數(shù)據(jù),因此通過聚簇索引可以直接找到真正的行數(shù)據(jù);而非聚簇索引葉子節(jié)點(diǎn)存儲(chǔ)的是主鍵信息,所以使用非聚簇索引還需要回表查詢,因此我們可以得出聚簇索引和非聚簇索引的區(qū)別主要有以下幾個(gè):
- 聚簇索引葉子節(jié)點(diǎn)存儲(chǔ)的是行數(shù)據(jù);而非聚簇索引葉子節(jié)點(diǎn)存儲(chǔ)的是聚簇索引(通常是主鍵 ID)。
- 聚簇索引查詢效率更高,而非聚簇索引需要進(jìn)行回表查詢,因此性能不如聚簇索引。
- 聚簇索引一般為主鍵索引,而主鍵一個(gè)表中只能有一個(gè),因此聚簇索引一個(gè)表中也只能有一個(gè),而非聚簇索引則沒有數(shù)量上的限制。