一分鐘帶你學(xué)會(huì)MySQL覆蓋索引,讓你的SQL更高效
覆蓋索引是MySQL優(yōu)化sql性能的一種非常重要而且常用的手段,通過(guò)覆蓋索引,我們可以直接查詢(xún)到需要的結(jié)果,而不用回表,從而大大減少樹(shù)的搜索次數(shù),非常明顯的提升查詢(xún)性能。
數(shù)據(jù)如何存儲(chǔ)與查找
我們知道,MySQL的數(shù)據(jù)都是存儲(chǔ)在B+樹(shù)上的,每一個(gè)索引都代表一個(gè)B+樹(shù)。
對(duì)于主鍵索引,葉子節(jié)點(diǎn)存儲(chǔ)的是一行記錄的所有字段值(邏輯上),而非主鍵索引的葉子節(jié)點(diǎn)存儲(chǔ)的是主鍵值,非葉子節(jié)點(diǎn)存儲(chǔ)的是索引以及指向數(shù)據(jù)的指針。
那我們查詢(xún)數(shù)據(jù)的時(shí)候,MySQL是如何執(zhí)行的呢?
以主鍵索引為例,就是在主鍵索引樹(shù)上,從根節(jié)點(diǎn)出發(fā),一直向下查找,直到找到符合條件的記錄。
如果我們要查下圖中的User2節(jié)點(diǎn),那么查找路徑就是UserA->UserC->UserF->User2。
回表
只按照主鍵查詢(xún)是一種理想中的狀態(tài),隨著業(yè)務(wù)逐漸復(fù)雜,表中的字段會(huì)越來(lái)越多,我們也會(huì)建立更多的非主鍵索引以應(yīng)對(duì)業(yè)務(wù)帶來(lái)的挑戰(zhàn)。
但是非主鍵索引會(huì)帶來(lái)一個(gè)問(wèn)題:回表。
以下面這條sql為例:
我們?cè)诒韙的m字段上設(shè)置一個(gè)索引,那么這條sql的執(zhí)行流程就是:
- 在索引樹(shù)m上,找到記錄3,獲取到主鍵id,比如id=100;
- 拿著100這個(gè)id去主鍵索引樹(shù)上,獲取到這一行的數(shù)據(jù);
- 在索引樹(shù)m上,找到記錄4,獲取到主鍵id,比如id=101;
- 拿著101這個(gè)id去主鍵索引樹(shù)上,獲取到這一行的數(shù)據(jù);
- 在索引樹(shù)上查找下一個(gè)記錄5(不一定是5,這里的5只是代表記錄4后面的一條記錄),記錄5不符合查詢(xún)條件,結(jié)束查詢(xún)。
在上面的流程中,步驟2,4代表了回主鍵索引樹(shù)搜索,這個(gè)動(dòng)作就叫做回表。
而MySQL之所以做回表這個(gè)動(dòng)作,是因?yàn)槲覀円榈臄?shù)據(jù) select *,只有在主鍵索引樹(shù)上才有,所以不得不回表查詢(xún)。
覆蓋索引
如果我們把上面的sql改成下面這樣:
這個(gè)時(shí)候只需要查詢(xún)id就行,而id這個(gè)值已經(jīng)在m索引樹(shù)上了,這時(shí)就不用再回表了,可以直接提供查詢(xún)結(jié)果。
可以說(shuō),索引m覆蓋了我們的查詢(xún)請(qǐng)求,這種情況我們就稱(chēng)為覆蓋索引。
這也是為什么我們?cè)诤芏郙ySQL規(guī)范中可以看到,要求我們查詢(xún)數(shù)據(jù)時(shí)盡量避免"select *",就是因?yàn)?select *"會(huì)導(dǎo)致覆蓋索引失效,從而引起強(qiáng)制回表,sql性能可能大幅下降。
最后
在我們查詢(xún)SQL時(shí),我們不僅要考慮where條件是否匹配了索引,還要盡量考慮查詢(xún)的字段是否可以通過(guò)索引直接獲取,覆蓋索引可以減少樹(shù)的搜索次數(shù),顯著的提升SQL查詢(xún)性能。