MyISAM與InnoDB的索引,究竟有什么差異?
數(shù)據(jù)庫的索引分為主鍵索引(Primary Inkex)與普通索引(Secondary Index)。InnoDB和MyISAM是怎么利用B+樹來實現(xiàn)這兩類索引,其又有什么差異呢?這是今天要聊的內(nèi)容。
一、MyISAM的索引
MyISAM的索引與行記錄是分開存儲的,叫做非聚集索引(UnClustered Index)。
其主鍵索引與普通索引沒有本質(zhì)差異:
- 有連續(xù)聚集的區(qū)域單獨存儲行記錄;
- 主鍵索引的葉子節(jié)點,存儲主鍵,與對應(yīng)行記錄的指針;
- 普通索引的葉子結(jié)點,存儲索引列,與對應(yīng)行記錄的指針;
畫外音:MyISAM的表可以沒有主鍵。 主鍵索引與普通索引是兩棵獨立的索引B+樹,通過索引列查找時,先定位到B+樹的葉子節(jié)點,再通過指針定位到行記錄。
舉個例子,MyISAM:
- t(id PK, name KEY, sex, flag);
表中有四條記錄:
- 1, shenjian, m, A
- 3, zhangsan, m, A
- 5, lisi, m, A
- 9, wangwu, f, B
其B+樹索引構(gòu)造如上圖:
- 行記錄單獨存儲;
- id為PK,有一棵id的索引樹,葉子指向行記錄;
- name為KEY,有一棵name的索引樹,葉子也指向行記錄;
二、InnoDB的索引
InnoDB的主鍵索引與行記錄是存儲在一起的,故叫做聚集索引(Clustered Index):
- 沒有單獨區(qū)域存儲行記錄;
- 主鍵索引的葉子節(jié)點,存儲主鍵,與對應(yīng)行記錄(而不是指針);
畫外音:因此,InnoDB的PK查詢是非??斓?。
因為這個特性,InnoDB的表必須要有聚集索引:
- 如果表定義了PK,則PK就是聚集索引;
- 如果表沒有定義PK,則第一個非空unique列是聚集索引;
- 否則,InnoDB會創(chuàng)建一個隱藏的row-id作為聚集索引;
聚集索引,也只能夠有一個,因為數(shù)據(jù)行在物理磁盤上只能有一份聚集存儲。
InnoDB的普通索引可以有多個,它與聚集索引是不同的:
- 普通索引的葉子節(jié)點,存儲主鍵(也不是指針);
對于InnoDB表,這里的啟示是:
- 不建議使用較長的列做主鍵,例如char(64),因為所有的普通索引都會存儲主鍵,會導(dǎo)致普通索引過于龐大;
- 建議使用趨勢遞增的key做主鍵,由于數(shù)據(jù)行與索引一體,這樣不至于插入記錄時,有大量索引分裂,行記錄移動;
仍是上面的例子,只是存儲引擎換成InnoDB:
- t(id PK, name KEY, sex, flag);
表中還是四條記錄:
- 1, shenjian, m, A
- 3, zhangsan, m, A
- 5, lisi, m, A
- 9, wangwu, f, B
其B+樹索引構(gòu)造如上圖:
- id為PK,行記錄和id索引樹存儲在一起;
- name為KEY,有一棵name的索引樹,葉子存儲id;
當:
- select * from t where name=‘lisi’;
會先通過name輔助索引定位到B+樹的葉子節(jié)點得到id=5,再通過聚集索引定位到行記錄。
畫外音:所以,其實掃了2遍索引樹。
三、總結(jié)
MyISAM和InnoDB都使用B+樹來實現(xiàn)索引:
- MyISAM的索引與數(shù)據(jù)分開存儲;
- MyISAM的索引葉子存儲指針,主鍵索引與普通索引無太大區(qū)別;
- InnoDB的聚集索引和數(shù)據(jù)行統(tǒng)一存儲;
- InnoDB的聚集索引存儲數(shù)據(jù)行本身,普通索引存儲主鍵;
- InnoDB一定有且只有一個聚集索引;
- InnoDB建議使用趨勢遞增整數(shù)作為PK,而不宜使用較長的列作為PK;
【本文為51CTO專欄作者“58沈劍”原創(chuàng)稿件,轉(zhuǎn)載請聯(lián)系原作者】