MySQL優(yōu)化: Slave延遲很大的優(yōu)化方法總結(jié)
一般而言,slave相對master延遲較大,其根本原因就是slave上的復(fù)制線程沒辦法真正做到并發(fā)。簡單說,在master上是并發(fā)模式(以InnoDB引擎為主)完成事務(wù)提交的,而在slave上,復(fù)制線程只有一個sql thread用于binlog的apply,所以難怪slave在高并發(fā)時會遠落后master。
ORACLE MySQL 5.6版本開始支持多線程復(fù)制,配置選項 slave_parallel_workers 即可實現(xiàn)在slave上多線程并發(fā)復(fù)制。不過,它只能支持一個實例下多個 database 間的并發(fā)復(fù)制,并不能真正做到多表并發(fā)復(fù)制。因此在較大并發(fā)負載時,slave還是沒有辦法及時追上master,需要想辦法進行優(yōu)化。
另一個重要原因是,傳統(tǒng)的MySQL復(fù)制是異步(asynchronous)的,也就是說在master提交完后,才在slave上再應(yīng)用一遍,并不是真正意義上的同步。哪怕是后來的Semi-sync Repication(半同步復(fù)制),也不是真同步,因為它只保證事務(wù)傳送到slave,但沒要求等到確認事務(wù)提交成功。既然是異步,那肯定多少會有延遲。因此,嚴格意義上講,MySQL復(fù)制不能叫做MySQL同步(處女座的面試官有可能會在面試時把說成MySQL同步的一律刷掉哦)。
另外,不少人的觀念里,slave相對沒那么重要,因此就不會提供和master相同配置級別的服務(wù)器。有的甚至不但使用更差的服務(wù)器,而且還在上面跑多實例。
綜合這兩個主要原因,slave想要盡可能及時跟上master的進度,可以嘗試采用以下幾種方法:
- 采用MariaDB發(fā)行版,它實現(xiàn)了相對真正意義上的并行復(fù)制,其效果遠比ORACLE MySQL好的很多。在我的場景中,采用MariaDB作為slave的實例,幾乎總是能及時跟上master。如果不想用這個版本的話,那就老實等待官方5.7大版本發(fā)布吧;關(guān)于MariaDB的Parallel Replication具體請參考:Replication and Binary Log Server System Variables#slave_parallel_threads - MariaDB Knowledge Base
- 每個表都要顯式指定主鍵,如果沒有指定主鍵的話,會導(dǎo)致在row模式下,每次修改都要全表掃描,尤其是大表就非??膳铝?,延遲會更嚴重,甚至導(dǎo)致整個slave庫都被掛起,可參考案例:mysql主鍵的缺少導(dǎo)致備庫hang;
- 應(yīng)用程序端多做些事,讓MySQL端少做事,尤其是和IO相關(guān)的活動,例如:前端通過內(nèi)存CACHE或者本地寫隊列等,合并多次讀寫為一次,甚至消除一些寫請求;
- 進行合適的分庫、分表策略,減小單庫單表復(fù)制壓力,避免由于單庫單表的的壓力導(dǎo)致整個實例的復(fù)制延遲;
- 其他提高IOPS性能的幾種方法,根據(jù)效果優(yōu)劣,我做了個簡單排序:
- 更換成SSD,或者PCIe SSD等IO設(shè)備,其IOPS能力的提升是普通15K SAS盤的數(shù)以百倍、萬倍,甚至幾十萬倍計;
- 加大物理內(nèi)存,相應(yīng)提高InnoDB Buffer Pool大小,讓更多熱數(shù)據(jù)放在內(nèi)存中,降低發(fā)生物理IO的頻率;
- 調(diào)整文件系統(tǒng)為 XFS 或 ReiserFS,相比ext3可以極大程度提高IOPS能力。在高IOPS壓力下,相比ext4有更穩(wěn)健的IOPS表現(xiàn)(有人認為 XFS 在特別的場景下會有很大的問題,但我們除了剩余磁盤空間少于10%時引發(fā)丟數(shù)據(jù)外,其他的尚未遇到);
- 調(diào)整RAID級別為raid 1+0,它相比raid1、raid5等更能提高IOPS性能。如果已經(jīng)全部是SSD設(shè)備了,可以2塊盤做成RAID 1,或者多快盤做成RAID 5(并且可以設(shè)置全局熱備盤,提高陣列容錯性),甚至有些土豪用戶直接將多塊SSD盤組成RAID 50;
- 調(diào)整RAID的寫cache策略為WB或FORCE WB,詳情請參考:常用PC服務(wù)器陣列卡、硬盤健康監(jiān)控 以及 PC服務(wù)器陣列卡管理簡易手冊;
- 調(diào)整內(nèi)核的io scheduler,優(yōu)先使用deadline,如果是SSD,則可以使用noop策略,相比默認的cfq,個別請客下對IOPS的性能提升至少是數(shù)倍的。