面試官:說說MVCC的執(zhí)行原理?
MVCC(Multi-Version Concurrency Control)是一種并發(fā)控制機(jī)制,用于解決數(shù)據(jù)庫并發(fā)訪問中,數(shù)據(jù)一致性問題。它通過在讀寫操作期間保存多個(gè)數(shù)據(jù)版本,以提供并發(fā)事務(wù)間的隔離性,從而避免了傳統(tǒng)的鎖機(jī)制所帶來的資源爭(zhēng)用和阻塞問題。
所謂的一致性問題,就是在并發(fā)事務(wù)執(zhí)行時(shí),應(yīng)該看到那些數(shù)據(jù)和不應(yīng)該看到那些數(shù)據(jù)。
在 MVCC 機(jī)制中,每個(gè)事務(wù)的讀操作都能看到事務(wù)開始之前的一致性數(shù)據(jù)快照,而不受其他并發(fā)事務(wù)的修改的影響。核心思想是通過創(chuàng)建多個(gè)數(shù)據(jù)版本,保持事務(wù)的一致性和隔離性。
使用 MVCC 機(jī)制解決了 RR 隔離級(jí)別中,部分幻讀問題,但又沒把全部幻讀問題都解決。
- MVCC 解決了 RR 隔離級(jí)別中,快照讀的幻讀問題。多次查詢快照讀時(shí),因?yàn)?RR 級(jí)別是復(fù)用 Read View(讀視圖),所以沒有幻讀問題。
- 但 MVCC 解決不了 RR 隔離級(jí)別中,如果遇到快照讀和當(dāng)前讀(讀取當(dāng)前最新的數(shù)據(jù))中間發(fā)生過添加操作,那么 Read View 不能復(fù)用,就出現(xiàn)了幻讀的問題。
快照讀和當(dāng)前讀
快照讀:是指在一個(gè)事務(wù)中,讀取的數(shù)據(jù)版本是在事務(wù)開始時(shí)已經(jīng)存在的數(shù)據(jù)版本,而不是最新的數(shù)據(jù)版本。這種讀取方式提供了事務(wù)在執(zhí)行期間看到的數(shù)據(jù)視圖的一致性,select 查詢就是快照讀。當(dāng)前讀:是指在事務(wù)中讀取最新的數(shù)據(jù)版本,以下幾種操作都是快照讀:
- select ... for update;
- select ... lock in share mode;
- insert ...
- update ...
- delete ...
MVCC 實(shí)現(xiàn)原理
MVCC 主要是依靠以下兩部分實(shí)現(xiàn)的:
- Undo Log 鏈
- Read View(讀視圖或者叫一致性視圖)
Undo Log 鏈
我們知道 Undo Log 主要是用于數(shù)據(jù)庫中事務(wù)回滾的,但在 MVCC 機(jī)制中也發(fā)揮著重要的作用,那什么是 Undo Log 鏈呢?
Undo Log 鏈?zhǔn)侵冈诿總€(gè)數(shù)據(jù)對(duì)象上維護(hù)的 Undo Log 記錄鏈表。每張表都會(huì)有與之相對(duì)應(yīng)的 Undo Log 鏈,用于記錄修改前的數(shù)據(jù)信息(以方便數(shù)據(jù)進(jìn)行回滾)。
圖片
Read View
Read View(讀視圖)用于管理事務(wù)之間數(shù)據(jù)可見性的一種機(jī)制。Read View 在特定時(shí)刻為事務(wù)創(chuàng)建的一個(gè)快照,該快照包含了在該時(shí)刻所有未提交事務(wù)的事務(wù)標(biāo)識(shí)符,以及其他一些輔助信息。
在 Read View 中包含了以下 4 個(gè)主要的字段:
- m_ids:當(dāng)前活躍的事務(wù)編號(hào)集合。
- min_trx_id:最小活躍事務(wù)編號(hào)。
- max_trx_id:預(yù)分配事務(wù)編號(hào),當(dāng)前最大事務(wù)編號(hào)+1。
- creator_trx_id:ReadView 創(chuàng)建者的事務(wù)編號(hào)。
RC 級(jí)別中,每次快照讀都會(huì)生成一個(gè)全新的 Read View,而 RR 級(jí)別中同一個(gè)事務(wù)會(huì)復(fù)用一個(gè) Read View。
有了 Read View 和 Undo Log 鏈之后,并發(fā)事務(wù)在查詢時(shí)就知道要讀取那些數(shù)據(jù)了。
判斷方法
判斷方法是根據(jù) Read View 中的 4 個(gè)重要字段,先去 Undo Log 中最新的數(shù)據(jù)行進(jìn)行比對(duì),如果滿足下面 Read View 的判斷條件,則返回當(dāng)前行的數(shù)據(jù),如果不滿足則繼續(xù)查找 Undo Log 的下一行數(shù)據(jù),直到找到滿足的條件的數(shù)據(jù)為止,如果查詢完沒有滿足條件的數(shù)據(jù),則返回 NULL。
判斷規(guī)則
- trx_id==creator_trx_id:先將 Undo Log 最新數(shù)據(jù)行中的 trx_id 和 ReadView 中的 creator_trx_id 進(jìn)行對(duì)比,如果他們兩個(gè)值相同,則說明是在同一個(gè)事務(wù)中執(zhí)行,那么直接返回當(dāng)前 Undo Log 的數(shù)據(jù)行即可,如果不相等,則繼續(xù)下面流程。
- trx_id<min_trx_id:如果 trx_id 小于 min_trx_id,則說明在執(zhí)行查詢時(shí),其他事務(wù)已經(jīng)提交此行數(shù)據(jù)了,那么直接返回此行數(shù)據(jù)即可,如果大于等于,則繼續(xù)下面流程。
- trx_id>max_trx_id:如果 trx_id 如果大于等于 max_trx_id,則說明該行數(shù)據(jù)比當(dāng)前操作執(zhí)行的晚,當(dāng)前行數(shù)據(jù)不可見,繼續(xù)執(zhí)行后續(xù)流程。
- min_trx_id<=trx_id<max_trx_id:trx_id 在 min_trx_id 和 max_trx_id 之間還分為以下兩種情況:
- trx_id 在 m_ids 中:說明事務(wù)尚未執(zhí)行完,該行數(shù)據(jù)不可被訪問。
- trx_id 未在 m_ids 中:說明事務(wù)已經(jīng)執(zhí)行完,可以返回該行數(shù)據(jù)。
以上判斷規(guī)則從 Undo Log 最新的行數(shù)據(jù),逐行對(duì)比,直到找到匹配的數(shù)據(jù),否則查詢完未匹配上,則返回 NULL。
小結(jié)
MVCC 的實(shí)現(xiàn)主要依賴讀視圖 Read View 和 Undo Log 鏈,通過 Read View 中的 4 個(gè)字段,判斷要讀取 Undo Log 中數(shù)據(jù),從而解決了數(shù)據(jù)庫并發(fā)訪問中,數(shù)據(jù)一致性的問題。
MVCC 主要應(yīng)用于 InnoDB 引擎中的 RC 事務(wù)隔離級(jí)別和 RR 隔離級(jí)別,其中 RC 隔離級(jí)別每次快照讀都會(huì)生成一個(gè)新的 Read View,而 RR 隔離級(jí)別只在第一次快照讀時(shí)生成 Read View,之后會(huì)復(fù)用 Read View,從而解決了(部分)幻讀問題。