MySQL 中寫操作時(shí)保駕護(hù)航的三兄弟!
這期的文章主要是講述寫操作過程中涉及到的三個(gè)日志文件,看過前幾期的話可能你或多或少已經(jīng)有些了解了(或者從別的地方也了解過)。比如整個(gè)寫操作過程中用到的兩階段提交,又或者是操作過程中涉及到的日志文件,但是總體來說不是很系統(tǒng)更談不上全面。
今天我們就來會(huì)會(huì)這三兄弟。
- 思維導(dǎo)圖 -
兩階段提交
這個(gè)名詞你應(yīng)該聽到過很多次了,在這里再介紹下這位老朋友。
所謂的兩階段提交,從字面意思來看應(yīng)該是有兩個(gè)步驟來進(jìn)行約束的。事實(shí)上也是如此。這兩個(gè)步驟中的主角就是我們今天要講的重要角色中的兩位:binlog 和 redo log。
提到兩階段提交,SQL 語句的執(zhí)行流程就繞不過去了。沒轍,雖然提了很多遍,但還得再拉出來溜溜。只不過這次的側(cè)重點(diǎn)和前面的會(huì)有些不同。
具體到操作流程上是這樣的:
當(dāng)執(zhí)行某個(gè)寫操作的 SQL 時(shí),引擎將這行數(shù)據(jù)更新到內(nèi)存的同時(shí)把對(duì)應(yīng)的操作記錄到 redo log 里面,然后處于 prepare 狀態(tài)。并把完成信息告知給執(zhí)行器。
執(zhí)行器生成對(duì)應(yīng)操作的 binlog,并把 binlog 寫入磁盤里。然后調(diào)用引擎的提交事務(wù)接口,變更 redo log 狀態(tài)為 commit,這樣操作就算完成了。
好了,知道了兩階段提交后,我們接下來看看這些日志文件的真面目。
重做日志(redo log)
首先出場(chǎng)的是位于存儲(chǔ)引擎層的 redo log,它是用來記錄在"數(shù)據(jù)頁做了什么修改"的物理日志文件。
WAL 技術(shù)
提到 redo log,WAL 技術(shù)必然是繞不過去的,全稱是 Write-Ahead Logging。也就是在同步磁盤前先寫日志,然后系統(tǒng)再根據(jù)一定的策略將日志里的記錄同步到磁盤里。
存在的必要性
從上邊的兩階段提交的過程里,我們可以看到 WAL 技術(shù)的使用場(chǎng)景。不知道你有沒有疑惑,為什么中間非要寫 redo log,直接將更新結(jié)果同步到磁盤里不行嗎?傻孩子,同步到磁盤里就意味著每次寫操作就得產(chǎn)生隨機(jī)寫盤操作,速度得多慢啊。
機(jī)智的你可能會(huì)說了,那我能不能一定的時(shí)間后從內(nèi)存再同步到磁盤里,這種方式不行嗎?來,先給你個(gè)腦瓜崩,你想想,我服務(wù)重啟了,這些數(shù)據(jù)還在不?內(nèi)存是易失的,不知道什么異常情況就會(huì)導(dǎo)致數(shù)據(jù)丟失。所以這時(shí)候就需要一個(gè)能持久化的中間文件,起到"緩沖"的作用,并且寫入速度還不慢。
那么 redo log 就應(yīng)運(yùn)而生了。雖然同樣存儲(chǔ)在磁盤上,但是順序?qū)懭朐谒俣壬喜⒉皇苡绊?疑惑的同學(xué)可以了解下磁盤的隨機(jī)與順序讀寫的區(qū)別)。
當(dāng)然 redo log 除了能起到"延遲"同步磁盤文件的作用外,在數(shù)據(jù)庫服務(wù)器宕機(jī)時(shí),還可以用來恢復(fù)數(shù)據(jù)。
寫入時(shí)機(jī)
談到寫入時(shí)機(jī),是不是更疑惑了,難倒不是更新完內(nèi)存就寫入 redo log 文件嗎?答案確實(shí)不是,因?yàn)橹虚g還有一個(gè) redo log buffer(內(nèi)存中) 。Mysql 每執(zhí)行一條語句,會(huì)先將記錄寫入 redo log buffer,后續(xù)執(zhí)行 commit 操作時(shí)會(huì)以一定的時(shí)機(jī)寫入到 redo log 文件(磁盤上)中。
值得注意的是,redo log buffer 里的數(shù)據(jù)是在執(zhí)行 commit 操作時(shí)寫入到 redo log 文件中的。
至于寫入的時(shí)機(jī),則由下面的參數(shù)來控制的:
(圖片源自網(wǎng)絡(luò))
寫入方式
知道了寫入時(shí)機(jī),這里簡單介紹下寫入的方式吧。在 Innodb 中,redo log 的大小是固定的,那么就只能是以循環(huán)的方式進(jìn)行寫入了。假如當(dāng)前我有 4 個(gè)文件,從第一個(gè)文件開始寫入,直到最后一個(gè)文件寫滿為止,再回到開頭將數(shù)據(jù)同步至文件后擦除掉繼續(xù)寫。
圖中的 write pos 表示當(dāng)前記錄的位置,隨著不斷寫入逐漸后移。當(dāng)寫到 ib_logfile_3號(hào)文件時(shí),整個(gè) redo log 就被寫滿了。此時(shí)更新操作就會(huì)被阻塞。系統(tǒng)根據(jù) check point 標(biāo)記位來擦除掉一些記錄(當(dāng)然前提是把這些記錄同步至磁盤)。
總得來看 redo log 的寫入方式就是一個(gè)不斷寫入,寫滿后擦除,又寫入的過程。
二進(jìn)制日志(binlog)
說完了 redo log,我們?cè)賮砜纯戳硪粋€(gè)位于服務(wù)層的二進(jìn)制日志文件 binlog,這位大兄弟扮演的角色是存儲(chǔ)邏輯日志的,所謂的邏輯日志就是指修改了什么,都會(huì)記錄其中。
例如:對(duì) id = 1 的字段進(jìn)行更新操作。
當(dāng)然除了記錄操作過程外,它還有支持主從同步及數(shù)據(jù)異?;謴?fù)的能力。
寫入模式
binlog 中有三種寫入模式,我們分別來看下有什么不同及對(duì)應(yīng)的優(yōu)缺點(diǎn):
(圖片源自網(wǎng)絡(luò))
寫入方式
與 redo log 循環(huán)寫不同的是, binlog 采用追加的方式寫入,當(dāng)一個(gè)文件寫到一定大小后就會(huì)切換到另一個(gè)。
與 redo log 的關(guān)聯(lián)
在上面的兩階段提交里我們有提到過在寫入binlog 后會(huì)調(diào)用引擎的提交事務(wù)接口,變更 redo log 狀態(tài)為 commit。那么它是如何找到對(duì)應(yīng)的記錄,或者換句話說,它們兩者是怎么關(guān)聯(lián)起來的呢?
答案是通過一個(gè)共同的字段 XID,不僅在事務(wù)提交時(shí),在崩潰恢復(fù)的時(shí)候如果遇到僅寫入 prepare 而沒有 commit 的 redo log,也可以通過 XID 去尋找對(duì)應(yīng)的事務(wù)。
回顧下寫流程
到這里我們有必要回顧下寫流程的操作,以更新某個(gè)字段為例:
回滾日志(undo log)
到這里,你可能會(huì)疑惑了,通篇里哪有 undo log 的影子,你個(gè)渣男!
別急,來了!
根據(jù)字面意思,你應(yīng)該能猜出來它是干啥的?;貪L嘛,也就是給你一次后悔的機(jī)會(huì)。在進(jìn)行數(shù)據(jù)修改時(shí),同時(shí)記錄 undo log,即同時(shí)記錄相反操作的邏輯日志。你可以理解為操作 update 的時(shí)候,寫一條對(duì)應(yīng)相反的 update 記錄,操作 delete 的時(shí)候,寫一條對(duì)應(yīng)的 insert 記錄。
當(dāng)事務(wù)回滾時(shí)。從 undo log 中讀取到對(duì)應(yīng)的邏輯記錄就可以進(jìn)行回滾操作了。
總結(jié)
兩階段提交
- 兩階段提交過程中,更新內(nèi)存的同時(shí)把對(duì)應(yīng)操作記錄到 redo log 中,并把生成的binlog 寫入磁盤后提交事務(wù)。
重做日志
- redo log 是位于存儲(chǔ)引擎層的物理日志,用來記錄在“數(shù)據(jù)頁做了什么修改”的物理日志文件。采用循環(huán)寫的方式,記錄數(shù)據(jù)被修改后的樣子。同時(shí)還提供數(shù)據(jù)恢復(fù)的能力。
二進(jìn)制日志
- binlog是位于服務(wù)層的邏輯日志,用來記錄“對(duì)數(shù)據(jù)做了什么修改”的日志文件。與 redo log 不同的是,可以一直進(jìn)行追加寫入。同時(shí)還提供主從同步及數(shù)據(jù)異常恢復(fù)的能力。
回滾日志
- 在數(shù)據(jù)修改時(shí),同時(shí)記錄 undo log,可以確保在事務(wù)回滾操作時(shí)進(jìn)行數(shù)據(jù)還原。