MySQL技巧:結合相關參數(shù) 做好Limit優(yōu)化
我們在查詢數(shù)據(jù)時,往往需要指定返回幾行數(shù)據(jù)。如現(xiàn)在有一個B/S架構的應用程序,其每一頁可能只顯示30條記錄。此時為了提高顯示的效率,一般就要求數(shù)據(jù)庫一次只返回三十條紀錄。等用戶按下一頁的時候,再從數(shù)據(jù)庫中返回30條記錄,以此類推。這可以縮短數(shù)據(jù)顯示的時間。當查詢的基表比較大時,這個措施非常有效。此時可以使用Limit關鍵字來實現(xiàn)這個需求。Limit子句可以被用于強制Select查詢語句返回指定的記錄數(shù)量。
通常情況下,Limit關鍵字可以接受一個或者兩個數(shù)字參數(shù)。需要注意的是,這個參數(shù)必須是一個整數(shù)常量。如果用戶給定兩個參數(shù),則第一個參數(shù)表示第一個返回記錄行的偏移量,第二個參數(shù)則表示返回記錄行的最大數(shù)據(jù)。另外需要提醒的是,初始記錄行的偏移量是0,而不是1。不少用戶會在這里犯錯誤。
雖然使用了Limit語句來限制返回的記錄數(shù),從而可以提高應用程序的工作效率。但是其也會給系統(tǒng)的性能帶來一些負面影響。如可能會導致全表掃描等等。為此筆者給出一些Limit關鍵字的優(yōu)化的建議,以供大家參考。
建議一:靈活使用Limit 0子句
根據(jù)Limit關鍵字的定義,如果參數(shù)為0的話,則其返回的是空記錄。這看起來好像沒有多少的意義。其實不然。在實際工作中,靈活使用這個0參數(shù),能夠給我們帶來很大的收獲。
如現(xiàn)在數(shù)據(jù)庫工程師想要確認一下某個查詢語句的有效性,如果直接運行這個查詢語句,需要等待其返回的記錄。如果涉及的紀錄數(shù)量比較多,或者運算邏輯比較復雜,那么需要等到比較長的時間。此時就可以在Select查詢語句中,使用Limit 0子句。只要查詢語句沒有語法上的錯誤,這就可以讓數(shù)據(jù)庫快速的返回一個空集合。從而幫助數(shù)據(jù)庫設計人員迅速的判斷查詢語句的有效性。另外這個空集和中還會返回某個表的各個字段的數(shù)據(jù)類型。即通過這個Limit 0子句還可以查詢某個表的表結構。
可見靈活應用Limir 0子句,確實能夠給我們帶來不小的收益。不過需要注意的是,在某些特定的場合下,這個子句可能不會奏效。如通常情況下,在Monitor工作環(huán)境中不支持這個Limit 0子句。此時結果只會顯示Empty Set,而不是我們所需要的結果。
建議二:Limit與Group By結合使用
Group By關鍵字主要用來對數(shù)據(jù)進行分類匯總。不過在分類匯總之前,往往需要對數(shù)據(jù)先進性排序。而Limit語句用來指定顯示的結果數(shù)量時,往往也需要涉及到紀錄的分類匯總與排序的問題。如現(xiàn)在一個學校成績管理系統(tǒng)中,需要對學生的總分進行排序。即先對學生各科成績進行匯總,然后顯示其排名為前50的紀錄。此時就需要同時用到Group By子句和Limit子句。其實從這個案例中我們也可以看出,這兩個子句相互依賴的特性。正是因為這種特性(經常相互結合使用),為此結合Group By子句可以提高Limit的查詢效率。
這主要是因為兩者如果一起使用的話,Limit關鍵字將不會再重復計算任何不必要的Group By的值。換句話說,在某些情況下,Group By子句能夠通過順序來讀取鍵或者在鍵上做排序來解決分類匯總時的排序問題,然后再計算摘要直到關鍵字的值的改變?yōu)橹?。如此的話,兩個子句所需要做的一些共同性的工作,只要做一次即可。這就可以從另外一次角度用來提高應用系統(tǒng)的性能。相比先做一個視圖對數(shù)據(jù)進行分類匯總的運算,再使用一個查詢語句來抽取特定數(shù)量的記錄,效率就要高一點。因為后者是將兩個子句分開來使用,就無法享受到結合使用所體現(xiàn)的優(yōu)勢。
建議三:使用SQL_calc_found_rows來提高子句的靈活性
默認情況下,Limit子句返回用戶所指定的記錄行數(shù)。只要數(shù)據(jù)庫已經發(fā)送了用戶所需要的行數(shù),則數(shù)據(jù)庫系統(tǒng)會放棄剩余的查詢。即上面這個學生成績的案例中,如果用戶只需要返回總分成績排名前50的學生,則數(shù)據(jù)庫只返回50條記錄,然后終止查詢作業(yè)。
但是在某些特定的情況下,用戶可能仍然需要繼續(xù)后續(xù)的查詢呢?如用戶出了查詢某些特定的記錄,還需要知道總的記錄數(shù)量,此時該如何處理?如現(xiàn)在用戶需要知道排名前50的學生信息,同時需要知道總分在500分以上的總人數(shù)。此時單獨使用Limit子句可能無法滿足用戶的需求,因為其只關心前面50條記錄。如果要實現(xiàn)這個需求的話,往往需要結合SQL_calc_found_rows關鍵字。
這個關鍵字的主要用途就是能夠在查詢時為數(shù)據(jù)庫管理員事先準備好符合Where條件語句的記錄數(shù)目。然后用戶只要在隨后執(zhí)行一條Select Found_ROWS語句之后,就可以獲得符合條件的記錄總數(shù)。不過需要注意的是,使用這個關鍵字會帶來一定的副作用。即帶有這個關鍵字的查詢語句,是無法使用數(shù)據(jù)緩存的。故在某些情況下會降低數(shù)據(jù)查詢的性能。故一般情況下,這個關鍵字只用于Where條件語句比較復雜的情況。當然這只是一個出于性能考慮的建議,而并不是技術上的限制。即即使Where條件語句不復雜,也可以使用這個關鍵字,不會出現(xiàn)語法上的錯誤。只是其在性能上并不是很理想。
建議四:與Distinct關鍵字共同使用時的特殊現(xiàn)象
Distinct關鍵字主要用來過濾重復的記錄。而Limit關鍵字則主要用來指定記錄所返回的行數(shù)。如果這兩個關鍵字共同使用時,會出現(xiàn)什么樣的情況呢?如果從字面意思去理解,數(shù)據(jù)庫會返回指定的不重復的記錄數(shù)。如Limit的參數(shù)為50,則數(shù)據(jù)庫返回50條不重復的記錄數(shù)。然后后續(xù)的查詢就會停止。如果查詢的記錄中有重復記錄,則數(shù)據(jù)庫查詢的實際數(shù)量往往要比Limit關鍵字所指定的數(shù)量要多。
在實際工作中,這條語句的作用還是很大的。如現(xiàn)在有一張員工考勤信息的表格?,F(xiàn)在數(shù)據(jù)庫管理員需要統(tǒng)計缺勤次數(shù)排名前20的員工人數(shù)。此時為了防止有重復的記錄,就可以在查詢語句中加一個Distinct關鍵字,用來過濾重復的記錄數(shù)。從而可以避免采用多個查詢語句來完成這個需求。
建議五:Limit與索引之間的關系
如果數(shù)據(jù)庫管理員決定使用Limit子句來指定需要顯示的記錄數(shù),那么最好能夠最大限度的使用索引,以避免全表掃描,提高工作效率。即當數(shù)據(jù)庫選擇做完整的表掃描時,可以在某些情況下使用索引。
如現(xiàn)在數(shù)據(jù)庫管理員決定將Limit子句與Order BY子句一起使用。數(shù)據(jù)庫一旦找到了排序結果的第一個RowCount行,則系統(tǒng)將會結束排序,而并不會對整個表進行排序。如果單獨使用Order By子句的話,則會對整個表進行排序。雖然如此,但是排序必定要浪費一定的時間。此時數(shù)據(jù)庫管理員如果決定使用索引,則可以在很大程度上提高這個查詢的效率。
對于這個內容,筆者要強調一個問題。如果必須要進行文件排序,則必須選擇所有匹配查詢,并且在確定已經找到第一個行之前,必須對他們的大部分內容進行了排序。特別需要強調的是,在任何情況下,一旦找到了行,則就不需要再排序結果的其他部分,數(shù)據(jù)庫會自動結束排序。
可見Limit子句其本質的功能是限制用戶的紀錄數(shù)量。但是其還有很多別的用途。如快速判斷查詢語句的有效性、計算表所需要的空間等等。不過其也有一定的副作用,可能會帶系統(tǒng)的運行帶來一些負面的影響。此時最好能夠采取一些措施來提高系統(tǒng)運行的性能。
【編輯推薦】
- 詳解MySQL limit查詢優(yōu)化的實際操作步驟
- 使用Limit參數(shù)實現(xiàn)MySQL查詢優(yōu)化
- MySQL數(shù)據(jù)庫的優(yōu)化(上)單機MySQL數(shù)據(jù)庫的優(yōu)化
- MySQL數(shù)據(jù)庫的優(yōu)化(下)MySQL數(shù)據(jù)庫的高可用架構方案
- MySQL觸發(fā)器如何正確使用