深度揭露Oracle索引使用中的限制
筆者認(rèn)為對(duì)于數(shù)據(jù)庫(kù)索引的作用,應(yīng)該分兩面看。除了肯定其對(duì)數(shù)據(jù)庫(kù)性能帶來(lái)的正面影響外,還需要認(rèn)識(shí)到其可能帶來(lái)的負(fù)面影響。只有如此,數(shù)據(jù)庫(kù)管理員才能夠在正確的場(chǎng)合使用正確的索引。要知道有時(shí)候一個(gè)錯(cuò)誤的索引可能引發(fā)死鎖,并導(dǎo)致數(shù)據(jù)庫(kù)性能的急劇下降或進(jìn)程終止;而如果數(shù)據(jù)庫(kù)管理員能夠做出一個(gè)正確的判斷的話,那么可以使那些本來(lái)要運(yùn)行幾個(gè)小時(shí)甚至一天的進(jìn)程在幾分鐘之內(nèi)就能夠完成。所以這兩個(gè)差距是一個(gè)天上、一個(gè)地下。故筆者希望通過(guò)這篇文章能夠讓各位讀者了解索引在使用過(guò)程中的限制,了解索引并不是萬(wàn)能的。
一、索引對(duì)數(shù)據(jù)庫(kù)性能的影響跟數(shù)據(jù)選擇性直接掛鉤。
當(dāng)用戶從數(shù)據(jù)表中查詢數(shù)據(jù)時(shí),Oracle數(shù)據(jù)庫(kù)提供了兩種查詢的方式。一是從表中讀取每一行,就是大家常說(shuō)的全表掃描;二是通過(guò)ROWID一此讀取一行。當(dāng)表中記錄比較多的時(shí)候,很明顯第二種方式能夠更快的定位記錄內(nèi)容。而索引其實(shí)就是建立在這個(gè)查詢?cè)碇系?。如現(xiàn)在某個(gè)表中有300多萬(wàn)條記錄,而現(xiàn)在用戶可能只需要了解其中的10條記錄信息。此時(shí)如果使用索引標(biāo)識(shí)讀取的塊,則可以執(zhí)行比較少的I/O,數(shù)據(jù)庫(kù)系統(tǒng)會(huì)很快找到用戶所需要的內(nèi)容。而如果沒有使用索引的話,則需要讀取表中所有的塊。
如果在這個(gè)表中加入了索引,那么到底對(duì)數(shù)據(jù)庫(kù)的性能影響有多大呢?這個(gè)就不好說(shuō)了,因?yàn)槠涓芏嘁蛩叵嚓P(guān)。如跟數(shù)據(jù)選擇性直接相關(guān)。如果用戶的數(shù)據(jù)非常具有選擇性,則表中家功能只有很少的行匹配索引值,則Oracle將能夠快速查詢匹配所引值得ROWID的索引,并且可以快速查詢少量的相關(guān)表快。如還是上面這個(gè)表中,其如果存儲(chǔ)有某個(gè)市的所有常住人口信息,其中身份證號(hào)碼肯定是少不了的。如此時(shí)用戶想根據(jù)身份證號(hào)碼來(lái)查詢某個(gè)人的信息時(shí),那么數(shù)據(jù)庫(kù)能夠在很短的時(shí)間內(nèi)給出響應(yīng)。這主要是因?yàn)橛脩籼峁┑臄?shù)據(jù)非常具有選擇性,基本上跟數(shù)據(jù)庫(kù)中的索引值是一一對(duì)應(yīng)的。而如果用戶想通過(guò)出身年月信息來(lái)查詢信息的話,則其數(shù)據(jù)庫(kù)反映的速度就會(huì)比較慢了。
可見索引對(duì)數(shù)據(jù)庫(kù)性能的影響直接跟數(shù)據(jù)的選擇性掛鉤。這對(duì)于數(shù)據(jù)庫(kù)管理員設(shè)計(jì)索引時(shí)很有啟發(fā)性。如數(shù)據(jù)庫(kù)管理員在設(shè)計(jì)索引時(shí),最好能夠選擇哪些具有唯一性的字段或者重復(fù)性比較少的字段。如此的話,索引對(duì)于數(shù)據(jù)庫(kù)性能來(lái)說(shuō)才有比較大的價(jià)值。
二、索引效果跟數(shù)據(jù)庫(kù)中記錄的具體存儲(chǔ)位置相關(guān)。
還是上面這張表中,如果現(xiàn)在用戶想查找年齡超過(guò)100歲的老人,要對(duì)他們?nèi)ミM(jìn)行慰問。假設(shè)現(xiàn)在符合這個(gè)條件的人只有10人。那么此時(shí)索引對(duì)數(shù)據(jù)庫(kù)性能會(huì)有怎么樣的影響呢?此時(shí)顯然數(shù)據(jù)非常具有選擇性,但是并不一定索引能夠起到很好的效果。這還要看其具體存儲(chǔ)的位置。如果這十條記錄在硬盤中存儲(chǔ)的物理位置比較近,如可能在同一個(gè)扇區(qū)之內(nèi),則此時(shí)索引對(duì)于數(shù)據(jù)庫(kù)性能的影響就會(huì)比較大,能夠在最短時(shí)間內(nèi)找到符合條件的數(shù)據(jù)。但是如果相關(guān)的行在表中存儲(chǔ)的位置并不互相靠近,則這個(gè)索引的效果就會(huì)逐漸減少。因?yàn)槿绻ヅ渌饕档臄?shù)據(jù)分散在硬盤上的多個(gè)酷愛時(shí),則必須從表中選擇多個(gè)單獨(dú)的塊以滿足查詢。
數(shù)據(jù)庫(kù)管理員對(duì)于這一點(diǎn)要特別注意。因?yàn)榇藭r(shí)如果數(shù)據(jù)庫(kù)管理員查用了索引的話,那么很可能是畫蛇添足。筆者建議,當(dāng)數(shù)據(jù)庫(kù)管理員發(fā)現(xiàn)數(shù)據(jù)分散在表的多個(gè)塊的時(shí)候,最好是不要使用索引,而是執(zhí)行全表掃描。此時(shí)執(zhí)行掃描反而會(huì)比執(zhí)行索引的效率更高。因?yàn)樵趫?zhí)行全表掃描的時(shí)候,Oracle數(shù)據(jù)庫(kù)系統(tǒng)會(huì)使用多塊讀取以加速掃描表。而如果采用索引的話,則其讀取數(shù)據(jù)時(shí)是單塊讀取的。而由于數(shù)據(jù)存儲(chǔ)在多個(gè)塊中,所以其讀取的速度反而會(huì)更慢。
由此可見,Oracle數(shù)據(jù)庫(kù)管理員在數(shù)據(jù)庫(kù)設(shè)計(jì)與日常維護(hù)中,也要想辦法能夠讓數(shù)據(jù)盡量存儲(chǔ)在臨近的位置。如盡量減少在同一個(gè)服務(wù)器中不要部署不同的應(yīng)用服務(wù),防止硬盤產(chǎn)生過(guò)多的磁盤碎片;如需要采用多塊硬盤的話,則最好通過(guò)表空間把類似的表放在同一個(gè)表空間中,從而讓相關(guān)的行在表zhognd存儲(chǔ)位置盡量靠近,以提高索引的使用效果。也就是說(shuō),數(shù)據(jù)庫(kù)管理員在使用索引的時(shí)候,為表中的字段建立了索引這只是其工作的第一步。在后續(xù)數(shù)據(jù)庫(kù)維護(hù)與調(diào)整的過(guò)程中,仍然要注意數(shù)據(jù)存儲(chǔ)位置對(duì)索引的影響。
【編輯推薦】