MySQL主從延時這么長,要怎么優(yōu)化?
MySQL主從復制,讀寫分離是互聯(lián)網常見的數(shù)據(jù)庫架構,該架構最令人詬病的地方就是,在數(shù)據(jù)量較大并發(fā)量較大的場景下,主從延時會比較嚴重。
為什么主從延時這么大?
答:MySQL使用單線程重放RelayLog。
應該怎么優(yōu)化,縮短重放時間?
答:多線程并行重放RelayLog可以縮短時間。
多線程并行重放RelayLog有什么問題?
答:需要考慮如何分割RelayLog,才能夠讓多個數(shù)據(jù)庫實例,多個線程并行重放RelayLog,不會出現(xiàn)不一致。
為什么會出現(xiàn)不一致?
答:如果RelayLog隨機的分配給不同的重放線程,假設RelayLog中有這樣三條串行的修改記錄:
- update account set money=100 where uid=58;
- update account set money=150 where uid=58;
- update account set money=200 where uid=58;
如果單線程串行重放:能保證所有從庫與主庫的執(zhí)行序列一致。
畫外音:***money都將為200。
如果多線程隨機分配重放:多重放線程并發(fā)執(zhí)行這3個語句,誰***執(zhí)行是不確定的,最終從庫數(shù)據(jù)可能與主庫不同。
畫外音:多個從庫可能money為100,150,200不確定。
如何分配,多個從庫多線程重放,也能得到一致的數(shù)據(jù)呢?
答:相同庫上的寫操作,用相同的線程來重放RelayLog;不同庫上的寫操作,可以并發(fā)用多個線程并發(fā)來重放RelayLog。
如何做到呢?
答:設計一個哈希算法,hash(db-name) % thread-num,庫名hash之后再模上線程數(shù),就能很輕易做到,同一個庫上的寫操作,被同一個重放線程串行執(zhí)行。
畫外音:不同庫上的重放,是并行的,就起到了加速做用。
這個方案有什么不足?
答:很多公司對MySQL的使用是“單庫多表”,如果是這樣的話,仍然只有一個庫,還是不能提高RelayLog的重放速度。
啟示:將“單庫多表”的DB架構模式升級為“多庫多表”的DB架構模式。
畫外音:數(shù)據(jù)量大并發(fā)量大的互聯(lián)網業(yè)務場景,“多庫”模式還具備著其他很多優(yōu)勢,例如:
- 非常方便的實例擴展:DBA很容易將不同的庫擴展到不同的實例上;
- 按照業(yè)務進行庫隔離:業(yè)務解耦,進行業(yè)務隔離,減少耦合與相互影響;
- 非常方便微服務拆分:每個服務擁有自己的實例就方便了;
“單庫多表”的場景,多線程并行重放RelayLog還能怎么優(yōu)化?
答:即使只有一個庫,事務在主庫上也是并發(fā)執(zhí)行的,既然在主庫上可以并行執(zhí)行,在從庫上也應該能夠并行執(zhí)行呀?
新思路:將主庫上同時并行執(zhí)行的事務,分為一組,編一個號,這些事務在從庫上的回放可以并行執(zhí)行(事務在主庫上的執(zhí)行都進入到prepare階段,說明事務之間沒有沖突,否則就不可能提交),沒錯,MySQL正是這么做的。
解法:基于GTID的并行復制。
從MySQL5.7開始,將組提交的信息存放在GTID中,使用mysqlbinlog工具,可以看到組提交內部的信息:
- 從MySQL5.7開始,將組提交的信息存放在GTID中,使用mysqlbinlog工具,可以看到組提交內部的信息:
- 20181014 23:52 server_id 58 XXX GTID last_committed=0 sequence_numer=1
- 20181014 23:52 server_id 58 XXX GTID last_committed=0 sequence_numer=2
- 20181014 23:52 server_id 58 XXX GTID last_committed=0 sequence_numer=3
- 20181014 23:52 server_id 58 XXX GTID last_committed=0 sequence_numer=4
和原來的日志相比,多了last_committed和sequence_number。
什么是last_committed?
答:它是事務提交時,上次事務提交的編號,如果具備相同的last_committed,說明它們在一個組內,可以并發(fā)回放執(zhí)行。
總結
MySQL并行復制,縮短主從同步時延的方法,體現(xiàn)著這樣的一些架構思想:
- 多線程是一種常見的縮短執(zhí)行時間的方法;畫外音:例如,很多crontab可以用多線程,切分數(shù)據(jù),并行執(zhí)行。
- 多線程并發(fā)分派任務時,必須保證冪等性:MySQL提供了“按照庫冪等”,“按照commit_id冪等”兩種方式,很值得借鑒;畫外音:例如,群消息,可以按照group_id冪等;用戶消息,可以按照user_id冪等。
具體到MySQL主從同步延時:
- mysql5.5:不支持并行復制,大伙快升級MySQL版本;
- mysql5.6:按照庫并行復制,建議使用“多庫”架構;
- mysql5.7:按照GTID并行復制;
【本文為51CTO專欄作者“58沈劍”原創(chuàng)稿件,轉載請聯(lián)系原作者】