MySQL主從復(fù)制的常用拓?fù)浣Y(jié)構(gòu)
1、復(fù)制的常用拓?fù)浣Y(jié)構(gòu)
復(fù)制的體系結(jié)構(gòu)有以下一些基本原則:
(1) 每個(gè)slave只能有一個(gè)master;
(2) 每個(gè)slave只能有一個(gè)唯一的服務(wù)器ID;
(3) 每個(gè)master可以有很多slave;
(4) 如果你設(shè)置log_slave_updates,slave可以是其它slave的master,從而擴(kuò)散master的更新。
MySQL不支持多主服務(wù)器復(fù)制(Multimaster Replication)——即一個(gè)slave可以有多個(gè)master。但是,通過一些簡單的組合,我們卻可以建立靈活而強(qiáng)大的復(fù)制體系結(jié)構(gòu)。
1.1、單一master和多slave
由一個(gè)master和一個(gè)slave組成復(fù)制系統(tǒng)是最簡單的情況。Slave之間并不相互通信,只能與master進(jìn)行通信。
在實(shí)際應(yīng)用場景中,MySQL復(fù)制90%以上都是一個(gè)Master復(fù)制到一個(gè)或者多個(gè)Slave的架構(gòu)模式,主要用于讀壓力比較大的應(yīng)用的數(shù)據(jù)庫端廉價(jià)擴(kuò)展解決方案。因?yàn)橹灰狹aster和Slave的壓力不是太大(尤其是Slave端壓力)的話,異步復(fù)制的延時(shí)一般都很少很少。尤其是自從Slave端的復(fù)制方式改成兩個(gè)線程處理之后,更是減小了Slave端的延時(shí)問題。而帶來的效益是,對(duì)于數(shù)據(jù)實(shí)時(shí)性要求不是特別Critical的應(yīng)用,只需要通過廉價(jià)的pcserver來擴(kuò)展Slave的數(shù)量,將讀壓力分散到多臺(tái)Slave的機(jī)器上面,即可通過分散單臺(tái)數(shù)據(jù)庫服務(wù)器的讀壓力來解決數(shù)據(jù)庫端的讀性能瓶頸,畢竟在大多數(shù)數(shù)據(jù)庫應(yīng)用系統(tǒng)中的讀壓力還是要比寫壓力大很多。這在很大程度上解決了目前很多中小型網(wǎng)站的數(shù)據(jù)庫壓力瓶頸問題,甚至有些大型網(wǎng)站也在使用類似方案解決數(shù)據(jù)庫瓶頸。
如下:
如果寫操作較少,而讀操作很時(shí),可以采取這種結(jié)構(gòu)。你可以將讀操作分布到其它的slave,從而減小master的壓力。但是,當(dāng)slave增加到一定數(shù)量時(shí),slave對(duì)master的負(fù)載以及網(wǎng)絡(luò)帶寬都會(huì)成為一個(gè)嚴(yán)重的問題。
這種結(jié)構(gòu)雖然簡單,但是,它卻非常靈活,足夠滿足大多數(shù)應(yīng)用需求。一些建議:
(1) 不同的slave扮演不同的作用(例如使用不同的索引,或者不同的存儲(chǔ)引擎);
(2) 用一個(gè)slave作為備用master,只進(jìn)行復(fù)制;
(3) 用一個(gè)遠(yuǎn)程的slave,用于災(zāi)難恢復(fù);
大家應(yīng)該都比較清楚,從一個(gè)Master節(jié)點(diǎn)可以復(fù)制出多個(gè)Slave節(jié)點(diǎn),可能有人會(huì)想,那一個(gè)Slave節(jié)點(diǎn)是否可以從多個(gè)Master節(jié)點(diǎn)上面進(jìn)行復(fù)制呢?至少在目前來看,MySQL是做不到的,以后是否會(huì)支持就不清楚了。
MySQL不支持一個(gè)Slave節(jié)點(diǎn)從多個(gè)Master節(jié)點(diǎn)來進(jìn)行復(fù)制的架構(gòu),主要是為了避免沖突的問題,防止多個(gè)數(shù)據(jù)源之間的數(shù)據(jù)出現(xiàn)沖突,而造成***數(shù)據(jù)的不一致性。不過聽說已經(jīng)有人開發(fā)了相關(guān)的patch,讓MySQL支持一個(gè)Slave節(jié)點(diǎn)從多個(gè)Master結(jié)點(diǎn)作為數(shù)據(jù)源來進(jìn)行復(fù)制,這也正是MySQL開源的性質(zhì)所帶來的好處。
1.2、主動(dòng)模式的Master-Master(Master-Master in Active-Active Mode)
Master-Master復(fù)制的兩臺(tái)服務(wù)器,既是master,又是另一臺(tái)服務(wù)器的slave。這樣,任何一方所做的變更,都會(huì)通過復(fù)制應(yīng)用到另外一方的數(shù)據(jù)庫中。
可能有些讀者朋友會(huì)有一個(gè)擔(dān)心,這樣搭建復(fù)制環(huán)境之后,難道不會(huì)造成兩臺(tái)MySQL之間的循環(huán)復(fù)制么?實(shí)際上MySQL自己早就想到了這一點(diǎn),所以在MySQL的BinaryLog中記錄了當(dāng)前MySQL的server-id,而且這個(gè)參數(shù)也是我們搭建MySQLReplication的時(shí)候必須明確指定,而且Master和Slave的server-id參數(shù)值比需要不一致才能使MySQLReplication搭建成功。一旦有了server-id的值之后,MySQL就很容易判斷某個(gè)變更是從哪一個(gè)MySQLServer最初產(chǎn)生的,所以就很容易避免出現(xiàn)循環(huán)復(fù)制的情況。而且,如果我們不打開記錄Slave的BinaryLog的選項(xiàng)(--log-slave-update)的時(shí)候,MySQL根本就不會(huì)記錄復(fù)制過程中的變更到BinaryLog中,就更不用擔(dān)心可能會(huì)出現(xiàn)循環(huán)復(fù)制的情形了。
如圖:
主動(dòng)的Master-Master復(fù)制有一些特殊的用處。例如,地理上分布的兩個(gè)部分都需要自己的可寫的數(shù)據(jù)副本。這種結(jié)構(gòu)***的問題就是更新沖突。假設(shè)一個(gè)表只有一行(一列)的數(shù)據(jù),其值為1,如果兩個(gè)服務(wù)器分別同時(shí)執(zhí)行如下語句:
在***個(gè)服務(wù)器上執(zhí)行:
- mysql> UPDATE tbl SET col=col + 1;
在第二個(gè)服務(wù)器上執(zhí)行:
- mysql> UPDATE tbl SET col=col * 2;
那么結(jié)果是多少呢?一臺(tái)服務(wù)器是4,另一個(gè)服務(wù)器是3,但是,這并不會(huì)產(chǎn)生錯(cuò)誤。
實(shí)際上,MySQL并不支持其它一些DBMS支持的多主服務(wù)器復(fù)制(Multimaster Replication),這是MySQL的復(fù)制功能很大的一個(gè)限制(多主服務(wù)器的難點(diǎn)在于解決更新沖突),但是,如果你實(shí)在有這種需求,你可以采用MySQL Cluster,以及將Cluster和Replication結(jié)合起來,可以建立強(qiáng)大的高性能的數(shù)據(jù)庫平臺(tái)。但是,可以通過其它一些方式來模擬這種多主服務(wù)器的復(fù)制。
1.3、主動(dòng)-被動(dòng)模式的Master-Master(Master-Master in Active-Passive Mode)
這是master-master結(jié)構(gòu)變化而來的,它避免了M-M的缺點(diǎn),實(shí)際上,這是一種具有容錯(cuò)和高可用性的系統(tǒng)。它的不同點(diǎn)在于其中一個(gè)服務(wù)只能進(jìn)行只讀操作。如圖:
1.4 級(jí)聯(lián)復(fù)制架構(gòu) Master –Slaves - Slaves
在有些應(yīng)用場景中,可能讀寫壓力差別比較大,讀壓力特別的大,一個(gè)Master可能需要上10臺(tái)甚至更多的Slave才能夠支撐注讀的壓力。這時(shí)候,Master就會(huì)比較吃力了,因?yàn)閮H僅連上來的SlaveIO線程就比較多了,這樣寫的壓力稍微大一點(diǎn)的時(shí)候,Master端因?yàn)閺?fù)制就會(huì)消耗較多的資源,很容易造成復(fù)制的延時(shí)。
遇到這種情況如何解決呢?這時(shí)候我們就可以利用MySQL可以在Slave端記錄復(fù)制所產(chǎn)生變更的BinaryLog信息的功能,也就是打開—log-slave-update選項(xiàng)。然后,通過二級(jí)(或者是更多級(jí)別)復(fù)制來減少M(fèi)aster端因?yàn)閺?fù)制所帶來的壓力。也就是說,我們首先通過少數(shù)幾臺(tái)MySQL從Master來進(jìn)行復(fù)制,這幾臺(tái)機(jī)器我們姑且稱之為***級(jí)Slave集群,然后其他的Slave再從***級(jí)Slave集群來進(jìn)行復(fù)制。從***級(jí)Slave進(jìn)行復(fù)制的Slave,我稱之為第二級(jí)Slave集群。如果有需要,我們可以繼續(xù)往下增加更多層次的復(fù)制。這樣,我們很容易就控制了每一臺(tái)MySQL上面所附屬Slave的數(shù)量。這種架構(gòu)我稱之為Master-Slaves-Slaves架構(gòu)
這種多層級(jí)聯(lián)復(fù)制的架構(gòu),很容易就解決了Master端因?yàn)楦綄賁lave太多而成為瓶頸的風(fēng)險(xiǎn)。下圖展示了多層級(jí)聯(lián)復(fù)制的Replication架構(gòu)。

當(dāng)然,如果條件允許,我更傾向于建議大家通過拆分成多個(gè)Replication集群來解決上述瓶頸問題。
畢竟Slave并沒有減少寫的量,所有Slave實(shí)際上仍然還是應(yīng)用了所有的數(shù)據(jù)變更操作,沒有減少任何寫IO。相反,Slave越多,整個(gè)集群的寫IO總量也就會(huì)越多,我們沒有非常明顯的感覺,僅僅只是因?yàn)榉稚⒌搅硕嗯_(tái)機(jī)器上面,所以不是很容易表現(xiàn)出來。
此外,增加復(fù)制的級(jí)聯(lián)層次,同一個(gè)變更傳到***層的Slave所需要經(jīng)過的MySQL也會(huì)更多,同樣可能造成延時(shí)較長的風(fēng)險(xiǎn)。
而如果我們通過分拆集群的方式來解決的話,可能就會(huì)要好很多了,當(dāng)然,分拆集群也需要更復(fù)雜的技術(shù)和更復(fù)雜的應(yīng)用系統(tǒng)架構(gòu)。
1.5、帶從服務(wù)器的Master-Master結(jié)構(gòu)(Master-Master with Slaves)
這種結(jié)構(gòu)的優(yōu)點(diǎn)就是提供了冗余。在地理上分布的復(fù)制結(jié)構(gòu),它不存在單一節(jié)點(diǎn)故障問題,而且還可以將讀密集型的請(qǐng)求放到slave上。
級(jí)聯(lián)復(fù)制在一定程度上面確實(shí)解決了Master因?yàn)樗綄俚腟lave過多而成為瓶頸的問題,但是他并不能解決人工維護(hù)和出現(xiàn)異常需要切換后可能存在重新搭建Replication的問題。這樣就很自然的引申出了DualMaster與級(jí)聯(lián)復(fù)制結(jié)合的Replication架構(gòu),我稱之為Master-Master-Slaves架構(gòu)
和Master-Slaves-Slaves架構(gòu)相比,區(qū)別僅僅只是將***級(jí)Slave集群換成了一臺(tái)單獨(dú)的Master,作為備用Master,然后再從這個(gè)備用的Master進(jìn)行復(fù)制到一個(gè)Slave集群。
這種DualMaster與級(jí)聯(lián)復(fù)制結(jié)合的架構(gòu),***的好處就是既可以避免主Master的寫入操作不會(huì)受到Slave集群的復(fù)制所帶來的影響,同時(shí)主Master需要切換的時(shí)候也基本上不會(huì)出現(xiàn)重搭Replication的情況。但是,這個(gè)架構(gòu)也有一個(gè)弊端,那就是備用的Master有可能成為瓶頸,因?yàn)槿绻竺娴腟lave集群比較大的話,備用Master可能會(huì)因?yàn)檫^多的SlaveIO線程請(qǐng)求而成為瓶頸。當(dāng)然,該備用Master不提供任何的讀服務(wù)的時(shí)候,瓶頸出現(xiàn)的可能性并不是特別高,如果出現(xiàn)瓶頸,也可以在備用Master后面再次進(jìn)行級(jí)聯(lián)復(fù)制,架設(shè)多層Slave集群。當(dāng)然,級(jí)聯(lián)復(fù)制的級(jí)別越多,Slave集群可能出現(xiàn)的數(shù)據(jù)延時(shí)也會(huì)更為明顯,所以考慮使用多層級(jí)聯(lián)復(fù)制之前,也需要評(píng)估數(shù)據(jù)延時(shí)對(duì)應(yīng)用系統(tǒng)的影響。