SQL優(yōu)化-隱式字符編碼轉(zhuǎn)換
MySQL中我們知道有:
- 如果對(duì)索引字段做函數(shù)操作,可能會(huì)破壞索引值的有序性,因此優(yōu)化器就決定放棄走樹(shù)搜索功能。
- 隱式類(lèi)型轉(zhuǎn)換也會(huì)導(dǎo)致放棄走樹(shù)搜索。
因?yàn)轭?lèi)型轉(zhuǎn)換等價(jià)于在條件字段上使用了函數(shù)比如:
假設(shè)tradeid字段有索引,且為varchar類(lèi)型:
mysql> select * from tradelog where tradeid=110717;
等價(jià)于:
mysql> select * from tradelog where CAST(tradid AS signed int) = 110717;
下面來(lái)看看隱式字符編碼轉(zhuǎn)換導(dǎo)致的一個(gè)慢SQL::
業(yè)務(wù)上有個(gè)SQL執(zhí)行需要1.31秒:
看看執(zhí)行計(jì)劃:
從執(zhí)行計(jì)劃分析看出問(wèn)題出在r表也就是 h_merge_result_new_indicator 表全表掃描,查看該表的表結(jié)有聯(lián)合索引。但是聯(lián)合索引范圍后會(huì)失效,于是打算新建一個(gè)聯(lián)合索引:
查看預(yù)新建聯(lián)合索引的字段選擇性:
結(jié)合選擇性來(lái)看:
create index idx_hmrni on h_merge_result_new_indicator(keyName,module,BATCH_NO);
創(chuàng)建后,再次查看執(zhí)行計(jì)劃依然無(wú)效:
查看表結(jié)構(gòu):
另外3個(gè)表結(jié)構(gòu)其中有2個(gè)utf8mb4,1個(gè)utf8:
字符集 utf8mb4 是 utf8 的超集,所以當(dāng)這兩個(gè)類(lèi)型的字符串在做比較的時(shí)候,MySQL 內(nèi)部的操作是:先把 utf8 字符串轉(zhuǎn)成 utf8mb4 字符集,再做比較。
因此:
這部分會(huì)轉(zhuǎn)換后再與h_merge_result_new_indicator關(guān)聯(lián)。
優(yōu)化就只需要將字符集編碼轉(zhuǎn)為utf8再和h_merge_result_new_indicator關(guān)聯(lián)就能用上索引:
再看查詢(xún)只需要0.02秒了:
但是還有個(gè)問(wèn)題,如上執(zhí)行計(jì)劃key_len是606 =(100*3+3)+(100*3+3)
也就是說(shuō),沒(méi)有用上BATCH_NO字段上的索引,我們知道索引少一個(gè)字段,占用會(huì)減少,不會(huì)太臃腫。因此,聯(lián)合索引只需要包含r(keyName,module):
drop index idx_hmrni on h_merge_result_new_indicator;
create index idx_hmrni on h_merge_result_new_indicator(keyName,module);
結(jié)論
對(duì)索引字段做函數(shù)操作,可能會(huì)破壞索引值的有序性,因此優(yōu)化器就決定放棄走樹(shù)搜索功能。該例子是隱式字符編碼轉(zhuǎn)換,它們都跟其他條件索引上使用函數(shù)一樣,因?yàn)橐笤谒饕侄紊献龊瘮?shù)操作而導(dǎo)致了全索引掃描。
MySQL 的優(yōu)化器確實(shí)有“偷懶”的嫌疑,即使簡(jiǎn)單地把 where id+1=1000 改寫(xiě)成 where id=1000-1 就能夠用上索引快速查找,也不會(huì)主動(dòng)做這個(gè)語(yǔ)句重寫(xiě)。
保證在條件索引上不做破壞索引值的有序性,是優(yōu)化索引的利器。