Mysql LIMIT如何正確對其進行優(yōu)化
以下的文章主要是對Mysql LIMIT簡單介紹,我們大家都知道LIMIT子句一般是用來限制SELECT語句返回的實際行數(shù)。LIMIT取1個或是2個數(shù)字參數(shù),如果給定的是2個參數(shù),***個指定要返回的***行的偏移量,第二個指定返回行的***數(shù)目。
初始行的偏移
量是0(不是1)。
- mysql> select * from table LIMIT 6,10;
得到第7-16行
如果給定一個參數(shù),它指出返回行的***數(shù)目。
- mysql> select * from table LIMIT 5;
得到前5行
換句話說,LIMIT n等價于Mysql LIMIT 0,n。MYSQL的優(yōu)化是非常重要的。其他最常用也最需要優(yōu)化的就是limit。mysql的limit給分頁帶來了極大的方便,但數(shù)據(jù)量一大的時候,limit的性能就急劇下降。同樣是取10條數(shù)據(jù)
- select * from yanxue8_visit limit 10000,10
和
- select * from yanxue8_visit limit 0,10
就不是一個數(shù)量級別的。
網(wǎng)上也很多關于limit的五條優(yōu)化準則,都是翻譯自mysql手冊,雖然正確但不實用。今天發(fā)現(xiàn)一篇文章寫了些關于limit優(yōu)化的,很不錯。原文地址:http://www.zhenhua.org/article.asp?id=200(下面附有原文)
文中不是直接使用limit,而是首先獲取到offset的id然后直接使用Mysql limit size來獲取數(shù)據(jù)。根據(jù)他的數(shù)據(jù),明顯要好于直接使用limit。這里我具體使用數(shù)據(jù)分兩種情況進行測試。(測試環(huán)境win2033+p4雙核(3GHZ) +4G內(nèi)存 mysql 5.0.19)
1、offset比較小的時候。
- select * from yanxue8_visit limit 10,10
多次運行,時間保持在0.0004-0.0005之間
- Select * From yanxue8_visit Where vid >=(
- Select vid From yanxue8_visit Order By vid limit 10,1
- ) limit 10
多次運行,時間保持在0.0005-0.0006之間,主要是0.0006結論:偏移offset較小的時候,直接使用limit較優(yōu)。這個顯然是子查詢的原因。
2、offset大的時候
- select * from yanxue8_visit limit 10000,10
多次運行,時間保持在0.0187左右
- Select * From yanxue8_visit Where vid >=(
- Select vid From yanxue8_visit Order By vid limit 10000,1
- ) limit 10
多次運行,時間保持在0.0061左右,只有前者的1/3。可以預計offset越大,后者越優(yōu)。
附上原文:
select * from table LIMIT 5,10; #返回第6-15行數(shù)據(jù)
select * from table LIMIT 5; #返回前5行
select * from table LIMIT 0,5; #返回前5行
性能優(yōu)化:
基于MySQL5.0中Mysql limit的高性能,我對數(shù)據(jù)分頁也重新有了新的認識.
- Select * From cyclopedia Where ID>=(
- Select Max(ID) From (
- Select ID From cyclopedia Order By ID limit 90001
- ) As tmp
- ) limit 100;
- Select * From cyclopedia Where ID>=(
- Select Max(ID) From (
- Select ID From cyclopedia Order By ID limit 90000,1
- ) As tmp
- ) limit 100;
同樣是取90000條后100條記錄,第1句快還是第2句快?
第1句是先取了前90001條記錄,取其中***一個ID值作為起始標識,然后利用它可以快速定位下100條記錄
第2句擇是僅僅取90000條記錄后1條,然后取ID值作起始標識定位下100條記錄
第1句執(zhí)行結果.100 rows in set (0.23) sec
第2句執(zhí)行結果.100 rows in set (0.19) sec
很明顯第2句勝出.看來limit好像并不完全像我之前想象的那樣做全表掃描返回limit offset+length條記錄,這樣看來limit比起MS-SQL的Top性能還是要提高不少的.
其實第2句完全可以簡化成
- Select * From cyclopedia Where ID>=(
- Select ID From cyclopedia limit 90000,1
- )limit 100;
直接利用第90000條記錄的ID,不用經(jīng)過Max運算,這樣做理論上效率因該高一些,但在實際使用中幾乎看不到效果,因為本身定位ID返回的就是1條記錄,Max幾乎不用運作就能得到結果,但這樣寫更清淅明朗,省去了畫蛇那一足.
可是,既然MySQL有l(wèi)imit可以直接控制取出記錄的位置,為什么不干脆用Select * From cyclopedia limit 90000,1呢?豈不更簡潔?
這樣想就錯了,試了就知道,結果是:1 row in set (8.88) sec,怎么樣,夠嚇人的吧,讓我想起了昨天在4.1中比這還有過之的"高分".Select * ***不要隨便用,要本著用什么,選什么的原則, Select的字段越多,字段數(shù)據(jù)量越大,速度就越慢. 上面2種分頁方式哪種都比單寫這1句強多了,雖然看起來好像查詢的次數(shù)更多一些,但實際上是以較小的代價換取了高效的性能,是非常值得的.
第1種方案同樣可用于MS-SQL,而且可能是***的.因為靠主鍵ID來定位起始段總是最快的.
- Select Top 100 * From cyclopedia Where ID>=(
- Select Top 90001 Max(ID) From (
- Select ID From cyclopedia Order By ID
- ) As tmp
- )
但不管是實現(xiàn)方式是存貯過程還是直接代碼中,瓶頸始終在于MS-SQL的TOP總是要返回前N個記錄,這種情況在數(shù)據(jù)量不大時感受不深,但如果成百上千萬,效率肯定會低下的.相比之下MySQL的Mysql limit就有優(yōu)勢的多,執(zhí)行:
- Select ID From cyclopedia limit 90000
- Select ID From cyclopedia limit 90000,1
而MS-SQL只能用Select Top 90000 ID From cyclopedia 執(zhí)行時間是390ms,執(zhí)行同樣的操作時間也不及MySQL的360ms.
【編輯推薦】