我被嘲笑了:被查詢的列,為啥要放到索引里?
《??MySQL性能調(diào)優(yōu),這個(gè)工具最有用??》留了一個(gè)尾巴:
select id,name where name='shenjian'
select id,name,sex where name='shenjian'
- 多查詢了一個(gè)屬性,為何檢索過程完全不同?
- 什么是回表查詢?
- 什么是索引覆蓋?
- 如何實(shí)現(xiàn)索引覆蓋?
- 哪些場(chǎng)景,可以利用索引覆蓋來優(yōu)化SQL?
這些,這是今天要分享的內(nèi)容。
畫外音:本文試驗(yàn)基于MySQL5.6-InnoDB。
一、什么是回表查詢?
這先要從InnoDB的索引實(shí)現(xiàn)說起,InnoDB有兩大類索引:
- 聚集索引(clustered index);?
- 普通索引(secondary index);?
InnoDB聚集索引和普通索引有什么差異?
InnoDB聚集索引的葉子節(jié)點(diǎn)存儲(chǔ)行記錄,因此, InnoDB必須要有,且只有一個(gè)聚集索引:
- 如果表定義了PK,則PK就是聚集索引;
- 如果表沒有定義PK,則第一個(gè)not NULL unique列是聚集索引;
- 否則,InnoDB會(huì)創(chuàng)建一個(gè)隱藏的row-id作為聚集索引;
畫外音:所以PK查詢非常快,直接定位行記錄。
InnoDB普通索引的葉子節(jié)點(diǎn)存儲(chǔ)主鍵值。
畫外音:注意,不是存儲(chǔ)行記錄頭指針,MyISAM的索引葉子節(jié)點(diǎn)存儲(chǔ)記錄指針。
舉個(gè)栗子,不妨設(shè)有表:
t(id PK, name KEY, sex, flag);
畫外音:id是聚集索引,name是普通索引。
表中有四條記錄:
1, shenjian, m, A
3, zhangsan, m, A
5, lisi, m, A
9, wangwu, f, B
兩個(gè)B+樹索引分別如上圖:
- id為PK,聚集索引,葉子節(jié)點(diǎn)存儲(chǔ)行記錄;
- name為KEY,普通索引,葉子節(jié)點(diǎn)存儲(chǔ)PK值,即id;
既然從普通索引無法直接定位行記錄,那普通索引的查詢過程是怎么樣的呢?
通常情況下,需要掃碼兩遍索引樹。
例如:
select * from t where name='lisi';
是如何執(zhí)行的呢?
如粉紅色路徑,需要掃碼兩遍索引樹:
- 先通過普通索引定位到主鍵值id=5;
- 在通過聚集索引定位到行記錄;
這就是所謂的回表查詢,先定位主鍵值,再定位行記錄,它的性能較掃一遍索引樹更低。
二、什么是索引覆蓋(Covering index)?
額,樓主并沒有在MySQL的官網(wǎng)找到這個(gè)概念。
借用一下SQL-Server官網(wǎng)的說法。
MySQL官網(wǎng),類似的說法出現(xiàn)在explain查詢計(jì)劃優(yōu)化章節(jié),即explain的輸出結(jié)果Extra字段為Using index時(shí),能夠觸發(fā)索引覆蓋。
不管是SQL-Server官網(wǎng),還是MySQL官網(wǎng),都表達(dá)了:只需要在一棵索引樹上就能獲取SQL所需的所有列數(shù)據(jù),無需回表,速度更快。
三、如何實(shí)現(xiàn)索引覆蓋?
常見的方法是:將被查詢的字段,建立到聯(lián)合索引里去。
仍是《MySQL性能調(diào)優(yōu),這個(gè)工具最有用》中的例子:
create table user (
id int primary key,
name varchar(20),
sex varchar(5),
index(name)
)engine=innodb;
第一個(gè)SQL語句:
select id,name from user where name='shenjian';
能夠命中name索引,索引葉子節(jié)點(diǎn)存儲(chǔ)了主鍵id,通過name的索引樹即可獲取id和name,無需回表,符合索引覆蓋,效率較高。
畫外音,Extra:Using index。
第二個(gè)SQL語句:
select id,name,sex from user where name='shenjian';
能夠命中name索引,索引葉子節(jié)點(diǎn)存儲(chǔ)了主鍵id,但sex字段必須回表查詢才能獲取到,不符合索引覆蓋,需要再次通過id值掃碼聚集索引獲取sex字段,效率會(huì)降低。
畫外音,Extra:Using index condition。
如果把(name)單列索引升級(jí)為聯(lián)合索引(name, sex)就不同了。
create table user (
id int primary key,
name varchar(20),
sex varchar(5),
index(name, sex)
)engine=innodb;
可以看到:
select id,name where name='shenjian';
select id,name,sex where name='shenjian';
都能夠命中索引覆蓋,無需回表。
畫外音,Extra:Using index。
四、哪些場(chǎng)景可以利用索引覆蓋來優(yōu)化SQL?
場(chǎng)景1:全表count查詢優(yōu)化
原表為:
user(PK id, name, sex);
直接:
select count(name) from user;
不能利用索引覆蓋。
添加索引:
alter table user add key(name);
就能夠利用索引覆蓋提效。
場(chǎng)景2:列查詢回表優(yōu)化
select id,name,sex where name='shenjian';
這個(gè)例子不再贅述,將單列索引(name)升級(jí)為聯(lián)合索引(name, sex),即可避免回表。
場(chǎng)景3:分頁查詢
select id,name,sex order by name limit 500,100;
將單列索引(name)升級(jí)為聯(lián)合索引(name, sex),也可以避免回表。
InnoDB聚集索引普通索引,回表,索引覆蓋,希望這1分鐘大家有收獲。?