mysql數(shù)據(jù)庫對binlog日志的處理
Binlog是mysql以二進制形式打印的日志,它默認不加密,不壓縮。每個正常的binlog文件頭部,有4個字節(jié)的標記,值為0xfe 0x62 0x69 0x6e。LOG_EVENT是binlog里的單位,即正常情況下binlog按照逐LOG_EVENT的形式增長。除去頭部的標記,binlog就是一個LOG_EVENT的序列。每個LOG_EVENT都獨立單元,沒有互相引用的關系,它也有自己的二進制頭部,主要是記錄了時間戳、類型標記等描述信息。
Mysql把磁盤操作的實現(xiàn)封裝在IO_CACHE結構里,這也方便了我們對binlog的研究和描述,后文如果沒有特別說明,讀寫binlog與讀寫IO_CACHE的含義相同。為了解mysql寫入binlog的過程,可以找一個sql語句的處理過程進行跟蹤。以update為例,在最簡單的情況下,mysql會先調用為存儲引擎開放的接口ha_update_row,然而執(zhí)行binlog_query對binlog進行寫操作。
這樣處理的原因是,在主從備份的場景下,如果主庫先寫入binlog成功、在執(zhí)行update的過程中crash,從庫有可能執(zhí)行update成功,此時主庫重啟之后,與從庫的數(shù)據(jù)不一致。如果update操作發(fā)生在事務性的表上,在寫入binlog之后會執(zhí)行開放接口ha_autocommit_or_rollback,由存儲引擎判斷操作結果。
在主從備份的場景下,主庫相當于server,從庫相當于client,雙方采用tcp短連接。從庫發(fā)出讀取日志的請求,主庫接收請求、讀取本地binlog、然后發(fā)送給從庫。從庫接收日志,進行簡單校驗后寫本地日志,稱為relay log。此處從庫的流程專門由一個線程負責,稱為同步io線程。從庫還有一個線程,稱為同步sql線程。它的行為是,定期讀取relay log,解析并執(zhí)行同步過來的sql語句。
下面回答幾個問題:
1.binlog的格式?
二進制順序存儲,不加密,不壓縮。
2.binlog使用WAL嗎?
No。
3.主庫發(fā)送binlog,是使用內存里的copy嗎?
無法確定,很有可能是先從磁盤上讀一份,然后發(fā)送。
4.relaylog使用WAL嗎?
Yes。從庫接收到日志后,會先寫relay log。
5.binlog和relaylog的SQL是否一致?
在網(wǎng)絡傳輸正確性可靠的前提下,yes。
#p#
提一個問題:既然binlog不使用WAL,那么在主從場景下,mysql異常之后,主庫和從庫是否會不一致呢?
之前有個問題一直沒弄明白:既然mysql是先做數(shù)據(jù)操作、再寫binlog,如果寫binlog的時候失敗,mysql又crash,數(shù)據(jù)怎么辦?
答案是由存儲引擎決定數(shù)據(jù)??梢园裮ysql和它的存儲引擎分開看,因為mysql只是一個框架,而不是一個實現(xiàn)。binlog是mysql自己的日志,而事務是由存儲引擎本身保證的。
以update為例,mysql做的事情簡單分為:
1. 修改數(shù)據(jù)update。
2. 寫binlog。
3. 如果當前處理的表是一個事務性的表,則commit或rollback。
注意此處的update和commit/rollback都由存儲引擎實現(xiàn),mysql只是站在邏輯的高度上理解這些操作。
對于事務型的引擎innodb,它本身有日志保證數(shù)據(jù)的一致性。在innodb的實現(xiàn)中,update修改數(shù)據(jù)之前,會新建一個事務,并建立一個回滾點。而在innodb提供的commit/rollback接口會提交/回滾事務。
因此對innodb而言,每條SQL語句的事務,其實包含了binlog的寫操作。然而即使是這樣,innodb仍然無法保證binlog和數(shù)據(jù)的一致性,因為innodb在寫commit成功后crash,回滾操作不會回滾binlog。按照手冊上的說法,把--innodb-support-xa設置為1,同時保證sync_binlog=1,才能保證innodb的binlog和數(shù)據(jù)一致。
對于非事務型的引擎myisam,沒有commit/rollback的機會,因此在異常情況下,數(shù)據(jù)會和binlog不一致。
本文就介紹到這里,更多Mysql的操作就參考:http://database.51cto.com/col/484/,謝謝大家的支持!
【編輯推薦】