阿里開(kāi)發(fā)強(qiáng)制要求的11條索引創(chuàng)建規(guī)范,提高性能
1. 【強(qiáng)制】業(yè)務(wù)上具有唯一特性的字段,即使是多個(gè)字段的組合,也必須建成唯一索引。
說(shuō)明:不要以為唯一索引影響了insert速度,這個(gè)速度損耗可以忽略,但提高查找速度是明顯的;另外,即使在應(yīng)用層做了非常完善的校驗(yàn)控制,只要沒(méi)有唯一索引,根據(jù)墨菲定律,必然有臟數(shù)據(jù)產(chǎn)生。
2. 【強(qiáng)制】超過(guò)三個(gè)表禁止join。需要join的字段,數(shù)據(jù)類型必須絕對(duì)一致;多表關(guān)聯(lián)查詢時(shí),保證被關(guān)聯(lián)的字段需要有索引。
說(shuō)明:即使雙表join也要注意表索引、SQL性能。
3. 【強(qiáng)制】在varchar字段上建立索引時(shí),必須指定索引長(zhǎng)度,沒(méi)必要對(duì)全字段建立索引,根據(jù)實(shí)際文本區(qū)分度決定索引長(zhǎng)度即可。
說(shuō)明:索引的長(zhǎng)度與區(qū)分度是一對(duì)矛盾體,一般對(duì)字符串類型數(shù)據(jù),長(zhǎng)度為20的索引,區(qū)分度會(huì)高達(dá)90%以上,可以使用count(distinct left(列名, 索引長(zhǎng)度))/count(*)的區(qū)分度來(lái)確定。
4. 【強(qiáng)制】頁(yè)面搜索嚴(yán)禁左模糊或者全模糊,如果需要請(qǐng)走搜索引擎來(lái)解決。
說(shuō)明:索引文件具有B-Tree的最左前綴匹配特性,如果左邊的值未確定,那么無(wú)法使用此索引。
5. 【推薦】如果有order by的場(chǎng)景,請(qǐng)注意利用索引的有序性。order by ***的字段是組合索引的一部分,并且放在索引組合順序的***,避免出現(xiàn)file_sort的情況,影響查詢性能。
正例:where a=? and b=? order by c; 索引:a_b_c 反例:索引中有范圍查找,那么索引有序性無(wú)法利用,如:WHERE a>10 ORDER BY b; 索引a_b無(wú)法排序。
6. 【推薦】利用覆蓋索引來(lái)進(jìn)行查詢操作,避免回表。
說(shuō)明:如果一本書需要知道第11章是什么標(biāo)題,會(huì)翻開(kāi)第11章對(duì)應(yīng)的那一頁(yè)嗎?目錄瀏覽一下就好,這個(gè)目錄就是起到覆蓋索引的作用。
正例:能夠建立索引的種類分為主鍵索引、唯一索引、普通索引三種,而覆蓋索引只是一種查詢的一種效果,用explain的結(jié)果,extra列會(huì)出現(xiàn):using index。
7. 【推薦】利用延遲關(guān)聯(lián)或者子查詢優(yōu)化超多分頁(yè)場(chǎng)景。
說(shuō)明:MySQL并不是跳過(guò)offset行,而是取offset+N行,然后返回放棄前offset行,返回N行,那當(dāng)offset特別大的時(shí)候,效率就非常的低下,要么控制返回的總頁(yè)數(shù),要么對(duì)超過(guò)特定閾值的頁(yè)數(shù)進(jìn)行SQL改寫。
正例:先快速定位需要獲取的id段,然后再關(guān)聯(lián): SELECT a.* FROM 表1 a, (select id from 表1 where 條件 LIMIT 100000,20 ) b where a.id=b.id
8. 【推薦】 SQL性能優(yōu)化的目標(biāo):至少要達(dá)到 range 級(jí)別,要求是ref級(jí)別,如果可以是consts***。 說(shuō)明:
1)consts 單表中最多只有一個(gè)匹配行(主鍵或者唯一索引),在優(yōu)化階段即可讀取到數(shù)據(jù)。 2)ref 指的是使用普通的索引(normal index)。
3)range 對(duì)索引進(jìn)行范圍檢索。 反例:explain表的結(jié)果,type=index,索引物理文件全掃描,速度非常慢,這個(gè)index級(jí)別比較range還低,與全表掃描是小巫見(jiàn)大巫。
9. 【推薦】建組合索引的時(shí)候,區(qū)分度***的在最左邊。
說(shuō)明:存在非等號(hào)和等號(hào)混合時(shí),在建索引時(shí),請(qǐng)把等號(hào)條件的列前置。如:where c>? and d=? 那么即使c的區(qū)分度更高,也必須把d放在索引的最前列,即索引idx_d_c。
正例:如果where a=? and b=? ,如果a列的幾乎接近于唯一值,那么只需要單建idx_a索引即可。
10. 【推薦】防止因字段類型不同造成的隱式轉(zhuǎn)換,導(dǎo)致索引失效。
11. 【參考】創(chuàng)建索引時(shí)避免有如下極端誤解:
1)寧濫勿缺。認(rèn)為一個(gè)查詢就需要建一個(gè)索引。
2)寧缺勿濫。認(rèn)為索引會(huì)消耗空間、嚴(yán)重拖慢更新和新增速度。
3)抵制惟一索引。認(rèn)為業(yè)務(wù)的惟一性一律需要在應(yīng)用層通過(guò)“先查后插”方式解決。