如何避免回表查詢?什么是索引覆蓋? | 1分鐘MySQL優(yōu)化系列
《迅猛定位低效SQL?》留了一個(gè)尾巴:
- select id,name where name='shenjian'
- select id,name,sex where name='shenjian'
多查詢了一個(gè)屬性,為何檢索過程完全不同?
- 什么是回表查詢?
- 什么是索引覆蓋?
- 如何實(shí)現(xiàn)索引覆蓋?
- 哪些場(chǎng)景,可以利用索引覆蓋來優(yōu)化SQL?
這些,這是今天要分享的內(nèi)容。
畫外音:本文試驗(yàn)基于MySQL5.6-InnoDB。
一、什么是回表查詢?
這先要從InnoDB的索引實(shí)現(xiàn)說起,InnoDB有兩大類索引:
- 聚集索引(clustered index)
- 普通索引(secondary index)
InnoDB聚集索引和普通索引有什么差異?
InnoDB聚集索引的葉子節(jié)點(diǎn)存儲(chǔ)行記錄,因此, InnoDB必須要有,且只有一個(gè)聚集索引:
- 如果表定義了PK,則PK就是聚集索引;
- 如果表沒有定義PK,則第一個(gè)not NULL unique列是聚集索引;
- 否則,InnoDB會(huì)創(chuàng)建一個(gè)隱藏的row-id作為聚集索引;
畫外音:所以PK查詢非???,直接定位行記錄。
InnoDB普通索引的葉子節(jié)點(diǎn)存儲(chǔ)主鍵值。
畫外音:注意,不是存儲(chǔ)行記錄頭指針,MyISAM的索引葉子節(jié)點(diǎn)存儲(chǔ)記錄指針。
舉個(gè)栗子,不妨設(shè)有表:
- t(id PK, name KEY, sex, flag);
畫外音:id是聚集索引,name是普通索引。
表中有四條記錄:
- 1, shenjian, m, A
- 3, zhangsan, m, A
- 5, lisi, m, A
- 9, wangwu, f, B
兩個(gè)B+樹索引分別如上圖:
- id為PK,聚集索引,葉子節(jié)點(diǎn)存儲(chǔ)行記錄;
- name為KEY,普通索引,葉子節(jié)點(diǎn)存儲(chǔ)PK值,即id;
既然從普通索引無法直接定位行記錄,那普通索引的查詢過程是怎么樣的呢?
通常情況下,需要掃碼兩遍索引樹。
例如:
- select * from t where name='lisi';
是如何執(zhí)行的呢?
如粉紅色路徑,需要掃碼兩遍索引樹:
- 先通過普通索引定位到主鍵值id=5;
- 在通過聚集索引定位到行記錄;
這就是所謂的回表查詢,先定位主鍵值,再定位行記錄,它的性能較掃一遍索引樹更低。
二、什么是索引覆蓋(Covering index)?
額,樓主并沒有在MySQL的官網(wǎng)找到這個(gè)概念。
畫外音:治學(xué)嚴(yán)謹(jǐn)吧?
借用一下SQL-Server官網(wǎng)的說法。
MySQL官網(wǎng),類似的說法出現(xiàn)在explain查詢計(jì)劃優(yōu)化章節(jié),即explain的輸出結(jié)果Extra字段為Using index時(shí),能夠觸發(fā)索引覆蓋。
不管是SQL-Server官網(wǎng),還是MySQL官網(wǎng),都表達(dá)了:只需要在一棵索引樹上就能獲取SQL所需的所有列數(shù)據(jù),無需回表,速度更快。
三、如何實(shí)現(xiàn)索引覆蓋?
常見的方法是:將被查詢的字段,建立到聯(lián)合索引里去。
仍是《迅猛定位低效SQL?》中的例子:
- create table user (
- id int primary key,
- name varchar(20),
- sex varchar(5),
- index(name)
- )engine=innodb;
第一個(gè)SQL語句:
- select id,name from user where name='shenjian';
能夠命中name索引,索引葉子節(jié)點(diǎn)存儲(chǔ)了主鍵id,通過name的索引樹即可獲取id和name,無需回表,符合索引覆蓋,效率較高。
畫外音,Extra:Using index。
第二個(gè)SQL語句:
- select id,name,sex from user where name='shenjian';
能夠命中name索引,索引葉子節(jié)點(diǎn)存儲(chǔ)了主鍵id,但sex字段必須回表查詢才能獲取到,不符合索引覆蓋,需要再次通過id值掃碼聚集索引獲取sex字段,效率會(huì)降低。
畫外音,Extra:Using index condition。
如果把(name)單列索引升級(jí)為聯(lián)合索引(name, sex)就不同了。
- create table user (
- id int primary key,
- name varchar(20),
- sex varchar(5),
- index(name, sex)
- )engine=innodb;
可以看到:
- select id,name ... where name='shenjian';
- select id,name,sex ... where name='shenjian';
都能夠命中索引覆蓋,無需回表。
畫外音,Extra:Using index。
四、哪些場(chǎng)景可以利用索引覆蓋來優(yōu)化SQL?
場(chǎng)景1:全表count查詢優(yōu)化
原表為:
- user(PK id, name, sex);
直接:
- select count(name) from user;
不能利用索引覆蓋。
添加索引:
- alter table user add key(name);
就能夠利用索引覆蓋提效。
場(chǎng)景2:列查詢回表優(yōu)化
- select id,name,sex ... where name='shenjian';
這個(gè)例子不再贅述,將單列索引(name)升級(jí)為聯(lián)合索引(name, sex),即可避免回表。
場(chǎng)景3:分頁查詢
- select id,name,sex ... order by name limit 500,100;
將單列索引(name)升級(jí)為聯(lián)合索引(name, sex),也可以避免回表。
InnoDB聚集索引普通索引,回表,索引覆蓋,希望這1分鐘大家有收獲。
提示,如果你不清楚explain結(jié)果Extra字段為Using index的含義,請(qǐng)閱讀前序文章:《如何利用工具,迅猛定位低效SQL?》
【本文為51CTO專欄作者“58沈劍”原創(chuàng)稿件,轉(zhuǎn)載請(qǐng)聯(lián)系原作者】

戳這里,看該作者更多好文