關(guān)于SQL Server索引密度的知識(shí)
文章主要描述的是SQL Server索引密度(Index Densities),當(dāng)一個(gè)查詢的SARG 的值直到查詢運(yùn)行時(shí)才得以知曉,或是SARG是一個(gè)關(guān)于索引的多列時(shí),SQL Server才使用為索引中每列存儲(chǔ)的密度值。
對(duì)于組合鍵值,SQL Server為第一列的組合鍵存儲(chǔ)了密度值;為第一列和第二列;為第一、二、三列;等等。這些信息可以從Listing34.1的DBCC SHOW_STATISTICS 輸出信息的All density區(qū)域看到。
SQL Server索引密度表示為鍵的唯一鍵值的倒數(shù)。每個(gè)鍵的密度可以按照下面的公式進(jìn)行計(jì)算:
引用
Key density = 1.00/ ( Count of distinct key values in the table)
鍵密度 = 1.00 / (表中的不同鍵值數(shù))
所以,pubs數(shù)據(jù)庫的author表中state列的密度計(jì)算公式如下:
Sql代碼
- Select Density = 1.00/ (select count (distinct state) from authors)
- Go
- Select Density = 1.00/ (select count (distinct state) from authors)
- Go
- Density
- .1250000000000
State和zip的組合列密度計(jì)算如下:
Sql代碼
- Select density = 1.00/( select count (distinct state + zip) from authors)
- Go
- Select density = 1.00/( select count (distinct state + zip) from authors)
- Go
- Density
- .0555555555555
注意,不像選擇率,越小的SQL Server索引密度意味著具有更高的索引選擇性。當(dāng)密度趨近于1,索引就變得有更少的選擇性,基本上沒有用處了。當(dāng)索引的選擇性低的時(shí)候,優(yōu)化器可能會(huì)選擇一個(gè)表掃描(table scan),或者葉子級(jí)的索引掃描(Index scan),而不會(huì)進(jìn)行索引查找(index seek),因?yàn)檫@樣會(huì)付出更多的代價(jià)。
引用
提示:
當(dāng)心你的數(shù)據(jù)庫中低選擇性的索引。這樣的索引通常是對(duì)系統(tǒng)的性能是一個(gè)損害。它們通常不僅不會(huì)用來進(jìn)行數(shù)據(jù)的檢索,而且也會(huì)使得數(shù)據(jù)修改語句變得緩慢,因?yàn)樾枰~外的索引維護(hù)。識(shí)別這些索引,考慮刪除掉它們。
通常,當(dāng)你給鍵中添加更多的列時(shí),密度值應(yīng)該變得更小。例如,在Listing 34.2,密度值逐漸變小。
- Key Column Index Density
- title_id 1.8621974E-3
- title_id, stor_id 5.997505E-6
- title_id, stor_id, ord_num 5.9268041E-6
以上的相關(guān)內(nèi)容就是對(duì)SQL Server索引密度(Index Densities)的介紹,望你能有所收獲。
【編輯推薦】