本文簡(jiǎn)單講述了PHP數(shù)據(jù)庫(kù)編程之MySQL優(yōu)化策略。分享給大家供大家參考,具體如下:
前些天看到一篇文章說(shuō)到PHP的瓶頸很多情況下不在PHP自身,而在于數(shù)據(jù)庫(kù)。我們都知道,PHP開(kāi)發(fā)中,數(shù)據(jù)的增刪改查是核心。為了提升PHP的運(yùn)行效率,程序員不光需要寫(xiě)出邏輯清晰,效率很高的代碼,還要能對(duì)query語(yǔ)句進(jìn)行優(yōu)化。雖然我們對(duì)數(shù)據(jù)庫(kù)的讀取寫(xiě)入速度上卻是無(wú)能為力,但在一些數(shù)據(jù)庫(kù)類擴(kuò)展像memcache、mongodb、redis這樣的數(shù)據(jù)存儲(chǔ)服務(wù)器的幫助下,PHP也能達(dá)到更快的存取速度,所以了解學(xué)習(xí)這些擴(kuò)展也是非常必要,這一篇先說(shuō)一下MySQL常見(jiàn)的優(yōu)化策略。
幾條MySQL小技巧
1、SQL語(yǔ)句中的關(guān)鍵詞最好用大寫(xiě)來(lái)書(shū)寫(xiě),第一易于區(qū)分關(guān)鍵詞和操作對(duì)象,第二,SQL語(yǔ)句在執(zhí)行時(shí),MySQL會(huì)將其轉(zhuǎn)換為大寫(xiě),手動(dòng)寫(xiě)大寫(xiě)能增加查詢效率(雖然很小)。
2、如果我們們經(jīng)對(duì)數(shù)據(jù)庫(kù)中的數(shù)據(jù)行進(jìn)行增刪,那么會(huì)出現(xiàn)數(shù)據(jù)ID過(guò)大的情況,用ALTER TABLE tablename AUTO_INCREMENT=N,使自增ID從N開(kāi)始計(jì)數(shù)。
3、對(duì)int類型添加 ZEROFILL 屬性可以對(duì)數(shù)據(jù)進(jìn)行自動(dòng)補(bǔ)0
4、導(dǎo)入大量數(shù)據(jù)時(shí)最好先刪除索引再插入數(shù)據(jù),再加入索引,不然,mysql會(huì)花費(fèi)大量時(shí)間在更新索引上。
5、創(chuàng)建數(shù)據(jù)庫(kù)書(shū)寫(xiě)sql語(yǔ)句時(shí) ,我們可以在IDE里創(chuàng)建一個(gè)后綴為.sql的文件,IDE會(huì)識(shí)別sql語(yǔ)法,更易于書(shū)寫(xiě)。更重要的是,如果你的數(shù)據(jù)庫(kù)丟失了,你還可以找到這個(gè)文件,在當(dāng)前目錄下使用/path/mysql -uusername -ppassword databasename < filename.sql來(lái)執(zhí)行整個(gè)文件的sql語(yǔ)句(注意-u和-p后緊跟用戶名密碼,無(wú)空格)。
數(shù)據(jù)庫(kù)設(shè)計(jì)方面優(yōu)化
1、數(shù)據(jù)庫(kù)設(shè)計(jì)符合第三范式,為了查詢方便可以有一定的數(shù)據(jù)冗余。
2、選擇數(shù)據(jù)類型優(yōu)先級(jí) int > date,time > enum,char>varchar > blob,選擇數(shù)據(jù)類型時(shí),可以考慮替換,如ip地址可以用ip2long()函數(shù)轉(zhuǎn)換為unsign int型來(lái)進(jìn)行存儲(chǔ)。
3、對(duì)于char(n)類型,在數(shù)據(jù)完整的情況下盡量較小的的n值。
4、在建表時(shí)用partition命令對(duì)單個(gè)表分區(qū)可以大大提升查詢效率,MySQL支持RANGE,LIST,HASH,KEY分區(qū)類型,其中以RANGE最為常用,分區(qū)方式為:
1.CREATE TABLE tablename{
2.}ENGINE innodb/myisam CHARSET utf8 //選擇數(shù)據(jù)庫(kù)引擎和編碼
3.PARTITION BY RANGE/LIST(column),//按范圍和預(yù)定義列表進(jìn)行分區(qū)
4.PARTITION partname VALUES LESS THAN /IN(n),//命名分區(qū)并詳細(xì)限定分區(qū)的范圍
5.選擇數(shù)據(jù)庫(kù)引擎時(shí)要注意innodb 和 myisam的區(qū)別。
存儲(chǔ)結(jié)構(gòu):MyISAM在磁盤上存儲(chǔ)成三個(gè)文件。而InnoDB所有的表都保存在同一個(gè)數(shù)據(jù)文件中,一般為2GB
事務(wù)支持:MyISAM不提供事務(wù)支持。InnoDB提供事務(wù)支持事務(wù)。
表鎖差異:MyISAM只支持表級(jí)鎖。InnoDB支持事務(wù)和行級(jí)鎖。
全文索引:MyISAM支持 FULLTEXT類型的全文索引(不適用中文,所以要用sphinx全文索引引擎)。InnoDB不支持。
表的具體行數(shù):MyISAM保存有表的總行數(shù),查詢count(*)很快。InnoDB沒(méi)有保存表的總行數(shù),需要重新計(jì)算。
外鍵:MyISAM不支持。InnoDB支持
索引方面優(yōu)化
1、innodb是聚簇索引,存儲(chǔ)索引時(shí)必須有主鍵,如果沒(méi)有指定,引擎會(huì)自動(dòng)生成一個(gè)隱藏的主鍵,生成一個(gè)主索引,索引內(nèi)存放的是主鍵的物理地址,數(shù)據(jù)靠主鍵存放,每次使用索引時(shí)要先找到主索引,然后找到主索引下的數(shù)據(jù)。
優(yōu)點(diǎn)通過(guò)主鍵查找特別快,缺點(diǎn)是次級(jí)索引會(huì)變慢,因?yàn)樾枰韧ㄟ^(guò)次級(jí)索引(次級(jí)索引里是主索引的位置。)找到主索引,然后通過(guò)主索引找數(shù)據(jù)。并且如果主鍵無(wú)規(guī)律,插入新值時(shí)需要移動(dòng)較多數(shù)據(jù)塊,會(huì)影響效率,所以要盡量使用有規(guī)律遞增的int型做主鍵。還有因?yàn)閿?shù)據(jù)緊跟著主鍵放,所以如果數(shù)據(jù)中有數(shù)據(jù)量特別大的列(text/blob),innodb查詢時(shí)會(huì)跳過(guò)很多數(shù)據(jù)塊,也會(huì)導(dǎo)致慢。
2、myisam的索引各個(gè)索引都相同統(tǒng)一指向磁盤上各個(gè)行的地址,都是輕量級(jí)的指針數(shù)據(jù)。缺點(diǎn)是各個(gè)索引的建立不是通過(guò)主鍵,查詢沒(méi)有聚簇索引查找主鍵快。但其因?yàn)榇鎯?chǔ)的是地址,所以在插入新值時(shí)比較方面移動(dòng)改變。
3、進(jìn)行多條件查詢時(shí),對(duì)多條件分別建立索引時(shí),執(zhí)行sql查詢時(shí),MySQL只會(huì)選擇一個(gè)最貼近的索引來(lái)使用,所以如果需要多條件查詢,要建立聯(lián)合索引,即使會(huì)造成數(shù)據(jù)冗余。
聯(lián)合索引的BTREE建立方法:對(duì)第一個(gè)條件建立索引,在第一個(gè)索引的BTREE區(qū)域?qū)Φ诙€(gè)條件建立索引,以此類推,所以,在使用索引時(shí),不用第一個(gè)條件用第二個(gè)條件也不會(huì)用到聯(lián)合索引。使用索引時(shí)要條件要有順序,有序列的使用。
4、索引長(zhǎng)度對(duì)查詢也有很大影響,我們應(yīng)該盡量建立短的索引長(zhǎng)度,我們可以使用查詢列
SELECT COUNT(DISTINCT LEFT(column)) / COUNT(*) FROM tablename 來(lái)測(cè)試對(duì)column列建立索引時(shí)選取不同的長(zhǎng)度,索引的覆蓋率有多大,我們選擇一下接近飽和的n個(gè)長(zhǎng)度來(lái)建立索引
ALTER TABLE tablename ADD INDEX (column(n)); 來(lái)對(duì)某一列的前n個(gè)字符建立索引。若前n個(gè)字符相同,我們甚至可以對(duì)字符串進(jìn)行反轉(zhuǎn)存儲(chǔ),然后建立索引。
5、對(duì)于經(jīng)常修改導(dǎo)致的索引碎片的維護(hù)方式:ALTER TABLE tablename ENGINE oldengine;即再次應(yīng)用一下表存儲(chǔ)引擎,使其自動(dòng)維護(hù);也可以用 OPTIMIZE tablename 命令來(lái)進(jìn)行維護(hù)。
數(shù)據(jù)查詢方面優(yōu)化
數(shù)據(jù)庫(kù)操作盡量少查詢,有查詢時(shí)盡量不在數(shù)據(jù)庫(kù)層面上進(jìn)行數(shù)據(jù)操作,而是返回到PHP腳本中操作數(shù)據(jù),減輕數(shù)據(jù)庫(kù)壓力。
一旦發(fā)現(xiàn)有數(shù)據(jù)庫(kù)性能問(wèn)題,要及時(shí)解決,一般用慢查詢?nèi)罩居涗洸樵兒?quot;慢"的語(yǔ)句,用EXPLAIN分析查詢和索引使用情況,用PROFILE分析語(yǔ)句執(zhí)行時(shí)的具體資源消耗。
慢查詢?nèi)罩荆?/strong>
1、在my.ini或my.cnf的[mysqld]下添加
slow_query_log_file=/path //設(shè)置日志存儲(chǔ)路徑
long_query_time=n //設(shè)置如果語(yǔ)句執(zhí)行時(shí)間達(dá)到n秒,就會(huì)被記錄下來(lái)
2、然后在MySQL里設(shè)置SET slow_query_log='ON'來(lái)開(kāi)啟慢查詢。
3、記錄下日志后,我們用/bin/目錄下的mysqldumpslow filename來(lái)查看日志,其常用參數(shù)如下:
-g pattern 使用正則表達(dá)式
-t n返回前n條數(shù)據(jù)
-s c/t/l/r 以記錄次數(shù)/時(shí)間/查詢時(shí)間/返回記錄數(shù)來(lái)排序
EXPLAIN語(yǔ)句
使用方法,在要執(zhí)行的查詢語(yǔ)句前面加EXPLAIN
1.EXPLAIN SELECT * FROM user;
得到形如下圖的結(jié)果:
下面是對(duì)每一項(xiàng)的解釋:
id 查詢語(yǔ)句的id,簡(jiǎn)單查詢無(wú)意義,多重查詢時(shí)可以看出執(zhí)行查詢的順序
select-type 執(zhí)行的查詢語(yǔ)句的類型,對(duì)應(yīng)多重查詢,有simple/primary/union等。
tabel 查詢語(yǔ)句查詢的數(shù)據(jù)表
type 獲得數(shù)據(jù)的類型 常見(jiàn)的類型效率從高到低為 null>const>eq_ref>ref>range>index>all
possible-keys:可能使用到的索引
key 使用到的索引
key_len索引長(zhǎng)度
ref 使用哪個(gè)列與索引一起從表中選擇。
rows 查找到數(shù)據(jù)要掃描的大概行數(shù),可看出索引的優(yōu)劣
extra 常見(jiàn)的有
using filesort 查詢到數(shù)據(jù)后進(jìn)行文件排序,較慢,需要優(yōu)化索引
using where 讀取整行數(shù)據(jù)后進(jìn)行判斷過(guò)濾,是否符合where條件
using index 索引覆蓋,即在牽引中已經(jīng)有這存儲(chǔ)了目標(biāo)數(shù)據(jù),直接讀取索引,很快。
PROFILE
用SELECT @@frofiling來(lái)查看PROFILE的開(kāi)啟狀態(tài)。
如果未開(kāi)啟,用SET profiling=1來(lái)開(kāi)啟。
開(kāi)啟之后,再執(zhí)行查詢語(yǔ)句,MySQL會(huì)自動(dòng)記錄profile信息。
應(yīng)用show profiles查看所有的sql信息,結(jié)果為 Query_ID Duration Query三列結(jié)果,分別是查詢ID,用時(shí)和所用的sql語(yǔ)句。
我們可以使用
1.SHOW PFROFILE [type[,type]][FOR QUREY Query_ID][Limit rwo_count [OFFSET offset]]
type常見(jiàn)有ALL(全部) BLOCK IO(顯示IO相關(guān)開(kāi)銷) CPU(CPU開(kāi)銷) MEMORY(內(nèi)存開(kāi)銷)等
大型存儲(chǔ)方面優(yōu)化
數(shù)據(jù)庫(kù)主從復(fù)制和讀寫(xiě)分離
1、master將改變記錄到二進(jìn)制日志中,slave將master的二進(jìn)制拷貝到它的中繼日志中,重新將數(shù)據(jù)返回到它自己的數(shù)據(jù)中,達(dá)到復(fù)制主服務(wù)器數(shù)據(jù)的目的。
主從復(fù)制可以用作:數(shù)據(jù)庫(kù)負(fù)載均衡、數(shù)據(jù)庫(kù)備份、讀寫(xiě)分離等功能。
2、配置主服務(wù)器master
修改my.ini/my.conf
[mysqld]
log-bin=mysql-bin //啟用二進(jìn)制日志
server-id=102 //服務(wù)器唯一ID
3、配置從服務(wù)器slave
log-bin=mysql-bin //啟用二進(jìn)制日志
server-id=226 //服務(wù)器唯一ID
4、在主服務(wù)器上授權(quán)從服務(wù)器
1. GRANT REPLICATION SLAVE ON *.* to 'slavename'@'IP' identified by 'root'
5、在從服務(wù)器上使用
change master to
master_host="masterip",
master_user="masteruser",
master_password="masterpasswd";
6、然后使用start slave命令開(kāi)始進(jìn)行主從復(fù)制。
不要忘記在每次修改配置后重啟服務(wù)器,然后可以在主從服務(wù)器上用show master/slave status查看主/從狀態(tài)。
實(shí)現(xiàn)數(shù)據(jù)庫(kù)的讀寫(xiě)分離要依賴MySQL的中間件,如mysql_proxy,atlas等。通過(guò)配置這些中間件來(lái)對(duì)主從服務(wù)器進(jìn)行讀寫(xiě)分離,使從服務(wù)器承擔(dān)被讀取的責(zé)任,從而減輕主服務(wù)器的負(fù)擔(dān)。
數(shù)據(jù)庫(kù)的sharding
在數(shù)據(jù)庫(kù)中數(shù)據(jù)表中的數(shù)據(jù)量非常龐大的時(shí)候,無(wú)論是索引還是緩存等壓力都很大,對(duì)數(shù)據(jù)庫(kù)進(jìn)行sharding,使之分別以多個(gè)數(shù)據(jù)庫(kù)服務(wù)器或多個(gè)表存儲(chǔ),以減輕查詢壓力。
方式有垂直切分、水平切分和聯(lián)合切分。
垂直切分:在數(shù)據(jù)表非常多的時(shí)候,把數(shù)據(jù)庫(kù)中關(guān)系緊密(如同一模塊,經(jīng)常連接查詢)的表切分出來(lái)分別放到不同的主從server上。
水平切分:在表不多,而表里的數(shù)據(jù)量非常大的時(shí)候,為了加快查詢,可以用哈希等算法,將一個(gè)數(shù)據(jù)表分為幾個(gè),分別放到不同的服務(wù)器上,加快查詢。水平切分和數(shù)據(jù)表分區(qū)的區(qū)別在于其存儲(chǔ)介質(zhì)上的不同。
聯(lián)合切分:更多的情況是數(shù)據(jù)表和表中的數(shù)據(jù)量都非常大,則要進(jìn)行聯(lián)合切分,即同時(shí)進(jìn)行垂直和水平分表,將數(shù)據(jù)庫(kù)切分為一個(gè)分布式的矩陣來(lái)存儲(chǔ)。