自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

MySQL 主從,六分鐘帶你掌握!

數(shù)據(jù)庫 MySQL
對于數(shù)據(jù)庫單機部署,在 4 核 8G 的機器上運行 MySQL 5.7 時,大概可以支撐 500 的 TPS 和 10000 的 QPS,當(dāng)遇到一些活動時,查詢流量驟然,就需要進行主從分離。

大家好,我是樓仔!

MySQL 主從一直是面試??停锩娴闹R點雖然基礎(chǔ),但是能回答全的同學(xué)不多。

比如我之前面試小米,就被問到過主從復(fù)制的原理,以及主從延遲的解決方案,你之前面試,有遇到過哪些 MySQL 主從的問題呢?

1. MySQL 主從

1.1 什么是 MySQL 主從 ?

所謂 MySQL 主從,就是建立兩個完全一樣的數(shù)據(jù)庫,一個是主庫,一個是從庫,主庫對外提供讀寫的操作,從庫對外提供讀的操作。

圖片

1.2 為什么使用 MySQL 主從 ?

對于數(shù)據(jù)庫單機部署,在 4 核 8G 的機器上運行 MySQL 5.7 時,大概可以支撐 500 的 TPS 和
10000 的 QPS,當(dāng)遇到一些活動時,查詢流量驟然,就需要進行主從分離。

大部分系統(tǒng)的訪問模型是讀多寫少,讀寫請求量的差距可能達到幾個數(shù)量級,所以我們可以通過一主多從的方式,主庫只負責(zé)寫入和部分核心邏輯的查詢,多個從庫只負責(zé)查詢,提升查詢性能,降低主庫壓力。

當(dāng)主庫宕機時,從庫可以切成主庫,保證服務(wù)的高可用,然后主庫也可以做數(shù)據(jù)的容災(zāi)備份,整體場景總結(jié)如下:

  • 讀寫分離:從庫提供查詢,減少主庫壓力,提升性能;
  • 高可用:故障時可切換從庫,保證服務(wù)高可用;
  • 數(shù)據(jù)備份:數(shù)據(jù)備份到從庫,防止服務(wù)器宕機導(dǎo)致數(shù)據(jù)丟失。

2. 主從復(fù)制

2.1 主從復(fù)制原理

MySQL 的主從復(fù)制是依賴于 binlog,也就是記錄 MySQL 上的所有變化并以二進制形式保存在磁盤上二進制日志文件。

主從復(fù)制就是將 binlog 中的數(shù)據(jù)從主庫傳輸?shù)綇膸焐?,一般這個過程是異步的,即主庫上的操作不會等待 binlog 同步地完成。

圖片

詳細流程如下:

  • 主庫寫 binlog:主庫的更新 SQL(update、insert、delete) 被寫到 binlog;
  • 主庫發(fā)送 binlog:主庫創(chuàng)建一個 log dump 線程來發(fā)送 binlog 給從庫;
  • 從庫寫 relay log:從庫在連接到主節(jié)點時會創(chuàng)建一個 IO 線程,以請求主庫更新的 binlog,并且把接收到的 binlog 信息寫入一個叫做
    relay log 的日志文件;
  • 從庫回放:從庫還會創(chuàng)建一個 SQL 線程讀取 relay log 中的內(nèi)容,并且在從庫中做回放,最終實現(xiàn)主從的一致性。

2.2 如何保證主從一致

當(dāng)主庫和從庫數(shù)據(jù)同步時,突然中斷怎么辦?因為主庫與從庫之間維持了一個長鏈接,主庫內(nèi)部有一個線程,專門服務(wù)于從庫的這個長鏈接。

對于下面的情況,假如主庫執(zhí)行如下 SQL,其中 a 和 create_time 都是索引:

delete from t where a > '666' and create_time<'2022-03-01' limit 1;

我們知道,數(shù)據(jù)選擇了 a 索引和選擇 create_time 索引,最后 limit 1 出來的數(shù)據(jù)一般是不一樣的。

所以就會存在這種情況:在 binlog = statement 格式時,主庫在執(zhí)行這條 SQL 時,使用的是索引 a,而從庫在執(zhí)行這條 SQL
時,使用了索引 create_time,最后主從數(shù)據(jù)不一致了。

那么我們該如何解決呢?

可以把 binlog 格式修改為 row,row 格式的 binlog 日志記錄的不是 SQL 原文,而是兩個 event:Table_map 和
Delete_rows。

Table_map event 說明要操作的表,Delete_rows event用于定義要刪除的行為,記錄刪除的具體行數(shù)。row 格式的 binlog
記錄的就是要刪除的主鍵 ID 信息,因此不會出現(xiàn)主從不一致的問題。

但是如果 SQL 刪除 10 萬行數(shù)據(jù),使用 row 格式就會很占空間,10 萬條數(shù)據(jù)都在 binlog 里面,寫 binlog 的時候也很耗 IO。但是
statement 格式的 binlog 可能會導(dǎo)致數(shù)據(jù)不一致。

設(shè)計 MySQL 的大叔想了一個折中的方案,mixed 格式的 binlog,其實就是 row 和 statement 格式混合使用,當(dāng) MySQL
判斷可能數(shù)據(jù)不一致時,就用 row 格式,否則使用就用 statement 格式。

3. 主從延遲

有時候我們遇到從數(shù)據(jù)庫中獲取不到信息的詭異問題時,會糾結(jié)于代碼中是否有一些邏輯會把之前寫入的內(nèi)容刪除,但是你又會發(fā)現(xiàn),過了一段時間再去查詢時又可以讀到數(shù)據(jù)了,這基本上就是主從延遲在作怪。

主從延遲,其實就是“從庫回放” 完成的時間,與 “主庫寫 binlog” 完成時間的差值,會導(dǎo)致從庫查詢的數(shù)據(jù),和主庫的不一致。

3.1 主從延遲原理

談到 MySQL 數(shù)據(jù)庫主從同步延遲原理,得從 MySQL 的主從復(fù)制原理說起:

  • MySQL 的主從復(fù)制都是單線程的操作,主庫對所有 DDL 和 DML 產(chǎn)生 binlog,binlog 是順序?qū)?,所以效率很?
  • Slave 的 Slave_IO_Running 線程會到主庫取日志,放入 relay log,效率會比較高;
  • Slave 的 Slave_SQL_Running 線程將主庫的 DDL 和 DML 操作都在 Slave 實施,DML 和 DDL 的 IO 操作是隨機的,不是順序的,因此成本會很高,還可能是 Slave 上的其他查詢產(chǎn)生 lock 爭用,由于 Slave_SQL_Running 也是單線程的,所以一個 DDL 卡主了,需要執(zhí)行 10 分鐘,那么所有之后的 DDL 會等待這個 DDL 執(zhí)行完才會繼續(xù)執(zhí)行,這就導(dǎo)致了延時。

總結(jié)一下主從延遲的主要原因:主從延遲主要是出現(xiàn)在 “relay log 回放” 這一步,當(dāng)主庫的 TPS 并發(fā)較高,產(chǎn)生的 DDL 數(shù)量超過從庫一個
SQL 線程所能承受的范圍,那么延時就產(chǎn)生了,當(dāng)然還有就是可能與從庫的大型 query 語句產(chǎn)生了鎖等待。

3.2 主從延遲情況

  • 從庫機器性能:從庫機器比主庫的機器性能差,只需選擇主從庫一樣規(guī)格的機器就好。
  • 從庫壓力大:可以搞了一主多從的架構(gòu),還可以把 binlog 接入到 Hadoop 這類系統(tǒng),讓它們提供查詢的能力。
  • 從庫過多:要避免復(fù)制的從節(jié)點數(shù)量過多,從庫數(shù)據(jù)一般以3-5個為宜。
  • 大事務(wù):如果一個事務(wù)執(zhí)行就要 10 分鐘,那么主庫執(zhí)行完后,給到從庫執(zhí)行,最后這個事務(wù)可能就會導(dǎo)致從庫延遲 10 分鐘啦。日常開發(fā)中,不要一次性
    delete 太多 SQL,需要分批進行,另外大表的 DDL 語句,也會導(dǎo)致大事務(wù)。
  • 網(wǎng)絡(luò)延遲:優(yōu)化網(wǎng)絡(luò),比如帶寬 20M 升級到 100M。
  • MySQL 版本低:低版本的 MySQL 只支持單線程復(fù)制,如果主庫并發(fā)高,來不及傳送到從庫,就會導(dǎo)致延遲,可以換用更高版本的
    MySQL,支持多線程復(fù)制。

3.3 主從延遲解決方案

我們一般會把從庫落后的時間作為一個重點的數(shù)據(jù)庫指標(biāo)做監(jiān)控和報警,正常的時間是在毫秒級別,一旦落后的時間達到了秒級別就需要告警了。

解決該問題的方法,除了縮短主從延遲的時間,還有一些其它的方法,基本原理都是盡量不查詢從庫,具體解決方案如下:

  • 使用緩存:我們在同步寫數(shù)據(jù)庫的同時,也把數(shù)據(jù)寫到緩存,查詢數(shù)據(jù)時,會先查詢緩存,不過這種情況會帶來 MySQL 和 Redis 數(shù)據(jù)一致性問題。
  • 查詢主庫:直接查詢主庫,這種情況會給主庫太大壓力,不建議這種方式。
  • 數(shù)據(jù)冗余:對于一些異步處理的場景,如果只扔數(shù)據(jù) ID,消費數(shù)據(jù)時,需要查詢從庫,我們可以把數(shù)據(jù)全部都扔給消息隊列,這樣消費者就無需再查詢從庫。(這種情況應(yīng)該不太能出現(xiàn),數(shù)據(jù)轉(zhuǎn)了一圈,MySQL 主從還沒有同步好,直接去撕 DBA 吧)

在實際應(yīng)用場景中,對于一些非常核心的場景,比如庫存,支付訂單等,需要直接查詢從庫,其它非核心場景,就不要去查主庫了。

4. 主從切換

4.1 一主一從

兩臺機器 A 和 B,A 為主庫,負責(zé)讀寫,B 為從庫,負責(zé)讀數(shù)據(jù)。

如果 A 庫發(fā)生故障,B 庫成為主庫負責(zé)讀寫,修復(fù)故障后,A 成為從庫,主庫 B 同步數(shù)據(jù)到從庫 A。

圖片

優(yōu)點:從庫支持讀,分擔(dān)了主庫的壓力,提升了并發(fā)度,且一個機器故障了可以自動切換,操作比較簡單,公司從庫還可以充當(dāng)數(shù)據(jù)備份的角色;

缺點:一臺從庫,并發(fā)支持還是不夠,并且一共兩臺機器,還是存在同時故障的機率,不夠高可用。

對于一主一從的模式,一般小公司會這么用,不過該模式下,主從分離的意義其實并不大,因為小公司的流量不高,更多是為了數(shù)據(jù)庫的可用性,以及數(shù)據(jù)備份。

4.2 一主多從一臺主庫多臺從庫,A 為主庫,負責(zé)讀寫,B、C、D為從庫,負責(zé)讀數(shù)據(jù)。

如果 A 庫發(fā)生故障,B 庫成為主庫負責(zé)讀寫,C、D 負責(zé)讀,修復(fù)故障后,A 也成為從庫,主庫 B 同步數(shù)據(jù)到從庫 A。

圖片

  • 優(yōu)點:多個從庫支持讀,分擔(dān)了主庫的壓力,明顯提升了讀的并發(fā)度。
  • 缺點:只有臺主機寫,因此寫的并發(fā)度不高。

基本上大公司,比如百度、滴滴,都是這種一主多從的模式,因為查詢流量太高,一定需要進行讀寫分離,同時也需要支持服務(wù)的高可用、數(shù)據(jù)容災(zāi)。

責(zé)任編輯:武曉燕 來源: 樓仔
相關(guān)推薦

2022-07-04 08:01:16

OSPFRIPBGP

2009-11-10 17:27:01

Oracle全表掃描

2009-10-27 17:22:27

2025-01-24 08:38:47

2024-04-18 08:19:22

數(shù)據(jù)庫運維工具

2021-01-13 09:23:23

優(yōu)先隊列React二叉堆

2017-01-10 09:07:53

tcpdumpGET請求

2024-10-25 15:56:20

2015-09-21 10:16:37

阿里云心電數(shù)據(jù)大數(shù)據(jù)

2025-03-13 06:22:59

2022-06-17 08:05:28

Grafana監(jiān)控儀表盤系統(tǒng)

2021-06-07 09:51:22

原型模式序列化

2009-11-17 14:50:50

Oracle調(diào)優(yōu)

2021-10-19 07:27:08

HTTP代理網(wǎng)絡(luò)

2019-12-23 16:42:44

JavaScript前端開發(fā)

2020-09-14 11:30:26

HTTP3運維互聯(lián)網(wǎng)

2021-06-18 07:34:12

Kafka中間件微服務(wù)

2020-10-13 18:22:58

DevOps工具開發(fā)

2019-05-08 14:02:52

MySQL索引查詢優(yōu)化數(shù)據(jù)庫

2024-07-02 11:22:35

點贊
收藏

51CTO技術(shù)棧公眾號