自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

MySQL主從復(fù)制問題總結(jié)及排查過程分享

數(shù)據(jù)庫 MySQL
mysql主從是常用的高可用架構(gòu)之一,也是使用最廣泛的的系統(tǒng)架構(gòu)。在生產(chǎn)環(huán)境中mysql主從復(fù)制有時會出現(xiàn)復(fù)制錯誤問題。

一、概述

mysql主從是常用的高可用架構(gòu)之一,也是使用最廣泛的的系統(tǒng)架構(gòu)。在生產(chǎn)環(huán)境中mysql主從復(fù)制有時會出現(xiàn)復(fù)制錯誤問題。MySQL主從復(fù)制中的問題(Coordinator stopped beacause there were errors in the workers......)

二、mysql主從復(fù)制原理

mysql主從復(fù)制是一個異步復(fù)制過程(總體感覺是實(shí)時同步的),mysql主從復(fù)制整個過程是由三個線程完成。slave端有兩個線程(SQL線程和IO線程),Master端有另一個(IO線程)。

MYSQL主從復(fù)制過程

  • 在Slave服務(wù)器上執(zhí)行start slave,開啟主從復(fù)制開關(guān)。
  • 此時,Slave 服務(wù)器上的 IO 線程通過 Master 服務(wù)器上授權(quán)復(fù)制用戶的請求連接到 Master 服務(wù)器。它還請求從 binlog 日志文件的指定位置發(fā)送 binlog 日志內(nèi)容。 (配置主從復(fù)制任務(wù)時執(zhí)行change master命令時指定日志文件名和位置)
  • Master服務(wù)器收到Slave服務(wù)器IO線程的請求后,Master服務(wù)器上的IO線程是基于Slave的。 服務(wù)器的IO線程請求的信息在指定binlog日志文件的指定位置后讀取binlog日志信息,然后返回給Slave端IO線程。除了binlog日志內(nèi)容,在日志內(nèi)容返回后Master服務(wù)器端還有一個新的binlog。 binlog 中的文件名和下一個指定的更新位置。
  • 當(dāng) Slave 服務(wù)器的 IO 線程從 Master 服務(wù)器獲取 IO 線程發(fā)送的日志內(nèi)容、日志文件和位置點(diǎn)時,添加 binlog。日志內(nèi)容依次寫入Slave端自身的relay log文件(mysql-relay-bin.xxxxxx)的末尾。并將新的binlog文件名和位置記錄到master-info文件中,以便下次讀取Master端新的binlog日志時,可以告訴Master服務(wù)器從新的binlog日志中從哪個文件以及從哪里開始請求新的binlog日志內(nèi)容.
  • Slave server端的SQL線程實(shí)時檢測本地relay log中新增的日志內(nèi)容,及時relay log。 該文件的內(nèi)容被解析成在Master端執(zhí)行的SQL語句的內(nèi)容,在Slave服務(wù)器本身按照語句的順序執(zhí)行SQL的應(yīng)用。
  • 經(jīng)過上述過程,可以保證在Master和Slave端執(zhí)行相同的SQL語句。當(dāng)復(fù)制狀態(tài)正常時,Master 端和lave端的數(shù)據(jù)是完全一致的。

三、問題及解決方法

1、show slave status \G 顯示如下報錯信息:

Coordinator stopped because there were error(s) in the worker(s). The most recent failure being: Worker 1 failed executing transaction ...

2、根據(jù)提示信息定位報錯位置

情況一:"**Delete_rows"**

select * from performance_schema.replication_applier_status_by_worker \G

原因:在master上刪除一條記錄,而slave上找不到。

解決方法: 由于master要刪除一條記錄,而slave上找不到故報錯,這種情況主上都將其刪除了,那么從機(jī)可以直接跳過。

stop slave;
set global sql_slave_skip_counter=1;
start slave;

如上命令若報錯:ERROR 1858 (HY000): sql_slave_skip_counter can not be set when the server is running with @@GLOBAL.GTID_MODE = ON. Instead, for each transaction that you want to skip, generate an empty transaction with the same GTID as the transaction或者可以換用如下命令:

STOP SLAVE;
SET @@SESSION.GTID_NEXT= 'f396f867-d755-11xxx85-005xxxxxb5a:264261655' --在session里設(shè)置gtid_next,即跳過這個GTID
BEGIN; COMMIT; --設(shè)置空事物
SET SESSION GTID_NEXT = AUTOMATIC; -- 恢復(fù)GTID
START SLAVE;xxxx

情況二:"Duplicate "

Last_SQL_Error: Could not execute Write_rows event on table xxx;
Duplicate entry 'xxx' for key 'PRIMARY',

原因:在slave已經(jīng)有該記錄,又在master上插入了同一條記錄

解決方法:在從庫上刪除該記錄,或者跳過該記錄。然后在master上和slave上再分別確認(rèn)一下。

情況三:"Update_rows" (還未碰到 待驗(yàn)證)

Last_SQL_Error: Could not execute Update_rows event on table xxx;
Can't find record in 'xxx',

參考原因:在master上更新一條記錄,而slave上找不到,丟失了數(shù)據(jù)。

參考方法:在master上,用mysqlbinlog 分析下出錯的binlog日志在干什么。

/usr/local/mysql/bin/mysqlbinlog --no-defaults -v -v --base64-output=DECODE-ROWS mysql-bin.000010 | grep -A '10' 794

#120302 12:08:36 server id 22 end_log_pos 794 Update_rows: table id 33 flags: STMT_END_F
### UPDATE hcy.t1
### WHERE
### @1=2 /* INT meta=0 nullable=0 is_null=0 */
### @2='bbc' /* STRING(4) meta=65028 nullable=1 is_null=0 */
### SET
### @1=2 /* INT meta=0 nullable=0 is_null=0 */
### @2='BTV' /* STRING(4) meta=65028 nullable=1 is_null=0 */
# at 794
#120302 12:08:36 server id 22 end_log_pos 821 Xid = 60
COMMIT/*!*/;
DELIMITER ;
# End of log file
ROLLBACK /* added by mysqlbinlog */;
/*!50003 SET COMPLETION_TYPE=@OLD_COMPLETION_TYPE*/;

在slave上,查找下更新后的那條記錄,應(yīng)該是不存在的。

mysql> select * from t1 where id=2; Empty set (0.00 sec)

然后再到master查看

ysql> select * from t1 where id=2;
+----+------+
| id | name |
+----+------+
| 2 | BTV |
+----+------+
1 row in set (0.00 sec)

把丟失的數(shù)據(jù)在slave上填補(bǔ),然后跳過報錯即可。

mysql> insert into t1 values (2,'BTV');
Query OK, 1 row affected (0.00 sec)

mysql> select * from t1 where id=2;
+----+------+
| id | name |
+----+------+
| 2 | BTV |
+----+------+
1 row in set (0.00 sec)

mysql> stop slave ;set global sql_slave_skip_counter=1;start slave;
Query OK, 0 rows affected (0.01 sec)
Query OK, 0 rows affected (0.00 sec)
Query OK, 0 rows affected (0.00 sec)

mysql> show slave status\G;
……
Slave_IO_Running: Yes
Slave_SQL_Running: Yes

四、通用解決方法

mysql主從復(fù)制,經(jīng)常會遇到錯誤而導(dǎo)致slave端復(fù)制中斷,這個時候一般就需要人工干預(yù),跳過錯誤才能繼續(xù) 跳過錯誤有兩種方式

4.1 跳過指定數(shù)量的事務(wù)

mysql>slave stop;
mysql>SET GLOBAL SQL_SLAVE_SKIP_COUNTER = 1 #跳過一個事務(wù)
mysql>slave start

4.2 跳所有錯誤或指定類型的錯誤

修改mysql的配置文件,通過slave_skip_errors參數(shù)來跳所有錯誤或指定類型的錯誤

vi /etc/my.cnf
[mysqld]
#slave-skip-errors=1062,1053,1146 #跳過指定error no類型的錯誤
#slave-skip-errors=all #跳過所有錯誤
責(zé)任編輯:姜華 來源: 今日頭條
相關(guān)推薦

2024-03-01 18:33:59

MySQL節(jié)點(diǎn)數(shù)據(jù)

2021-06-08 07:48:27

MySQL主從配置

2024-07-04 08:00:24

2025-02-10 10:55:16

2017-12-19 14:00:16

數(shù)據(jù)庫MySQL死鎖排查

2023-03-19 22:38:12

邏輯復(fù)制PostgreSQL

2023-03-19 11:53:27

2025-01-15 15:47:36

2022-12-20 08:46:41

MySQL主從復(fù)制

2023-07-03 08:57:45

Master服務(wù)TCP

2023-09-24 14:32:15

2021-11-23 21:21:07

線上排查服務(wù)

2017-09-05 16:00:49

MySQL主從復(fù)制備份

2017-10-11 15:40:20

MySQL主從復(fù)制拓?fù)浣Y(jié)構(gòu)

2023-02-27 07:33:14

MySQL數(shù)據(jù)庫服務(wù)器

2021-03-19 11:33:42

MySQL數(shù)據(jù)庫備份

2020-04-14 16:26:22

MySQL線程同步

2021-01-12 09:03:17

MySQL復(fù)制半同步

2024-07-04 17:22:23

2017-06-23 22:00:13

MySqlsslcentos
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號