由淺入深講解MySQL數(shù)據(jù)庫(kù)索引的選擇性
數(shù)據(jù)庫(kù)索引就好比是一本書的目錄部分,便于大家查找數(shù)據(jù)庫(kù)中數(shù)據(jù),方便快捷,給數(shù)據(jù)庫(kù)管理員的工作帶來(lái)了很多的便利。在MySQL數(shù)據(jù)庫(kù)中,對(duì)于索引的使用并是一直都采用正確的決定。
簡(jiǎn)單表的示例:
CREATE TABLE `r2` (
ID` int(11) DEFAULT NULL,
ID1` int(11) DEFAULT NULL,
CNAME` varchar(32) DEFAULT NULL,
KEY `ID1` (`ID1`)
) ENGINE=MyISAM DEFAULT CHARSET=latin1
SELECT COUNT(*) FROM r2;
250001 (V1)
SELECT COUNT(*) FROM r2 WHERE ID1=1;
83036 (V2)
(execution time = 110 ms)
(ID1=1)條件查詢索引的選擇性是 V2/V1 = 0.3321 或 33.21%
一般來(lái)說(例如書 “SQL Tuning“),如果選擇性超過 20% 那么全表掃描比使用索引性能更優(yōu)。
我知道Oracle一直是在選擇性超過25%時(shí)會(huì)選擇全表掃描。
而MySQL呢:
mysql> EXPLAIN SELECT COUNT(SUBNAME) FROM r2 WHERE ID1=1;
+----+-------------+-------+------+---------------+-----
| id | select_type | TABLE | type | possible_keys | KEY | key_len | ref | rows | Extra |
+----+-------------+-------+------+---------------+-----
| 1 | SIMPLE | t2 | ref | ID1 | ID1 | 5 | const | 81371 | USING WHERE |
+----+-------------+-------+------+---------------+-----
這就是MySQL將會(huì)使用索引來(lái)完成這個(gè)查詢。
讓我們來(lái)對(duì)比索引查詢和全表掃描的執(zhí)行時(shí)間:
SELECT COUNT(SUBNAME) FROM t2 WHERE ID1=1 - 410 ms
SELECT COUNT(SUBNAME) FROM t2 IGNORE INDEX (ID1) WHERE ID1=1 - 200 ms
如你所看到全表掃描要快2倍。
參考更特殊的例子:選擇性 ~95%:
SELECT cnt2 / cnt1 FROM (SELECT count(*) cnt1 FROM r2) d1, (SELECT count(*) cnt2 FROM r2 WHERE ID1=1) d2;
0.9492 = 94.92%;
說明MySQL將會(huì)用索引來(lái)完成查詢。
執(zhí)行時(shí)間:
SELECT COUNT(SUBNAME) FROM t2 WHERE ID1=1 - 1200 ms
SELECT COUNT(SUBNAME) FROM t2 IGNORE INDEX (ID1) WHERE ID1=1 - 260 ms
這次全表掃描要快4.6倍。
為什么MySQL選擇索引訪問查詢?
MySQL沒有計(jì)算索引的選擇性,只是預(yù)測(cè)邏輯IO操作的數(shù)量,并且我們的例子中間的邏輯IO數(shù)量,索引訪問要少于全表掃描。
最后我們得出結(jié)論,對(duì)于索引要小心使用,因?yàn)樗鼈儾⒉荒軒椭械牟樵儭K源蠹以谑褂脭?shù)據(jù)庫(kù)索引時(shí)還是需要根據(jù)具體的情況作出決定。
【編輯推薦】