面試官:說說MVCC的執(zhí)行原理?
MVCC(Multi-Version Concurrency Control)是一種并發(fā)控制機制,用于解決數據庫并發(fā)訪問中,數據一致性問題。它通過在讀寫操作期間保存多個數據版本,以提供并發(fā)事務間的隔離性,從而避免了傳統(tǒng)的鎖機制所帶來的資源爭用和阻塞問題。
所謂的一致性問題,就是在并發(fā)事務執(zhí)行時,應該看到那些數據和不應該看到那些數據。
在 MVCC 機制中,每個事務的讀操作都能看到事務開始之前的一致性數據快照,而不受其他并發(fā)事務的修改的影響。核心思想是通過創(chuàng)建多個數據版本,保持事務的一致性和隔離性。
使用 MVCC 機制解決了 RR 隔離級別中,部分幻讀問題,但又沒把全部幻讀問題都解決。
- MVCC 解決了 RR 隔離級別中,快照讀的幻讀問題。多次查詢快照讀時,因為 RR 級別是復用 Read View(讀視圖),所以沒有幻讀問題。
- 但 MVCC 解決不了 RR 隔離級別中,如果遇到快照讀和當前讀(讀取當前最新的數據)中間發(fā)生過添加操作,那么 Read View 不能復用,就出現了幻讀的問題。
快照讀和當前讀
快照讀:是指在一個事務中,讀取的數據版本是在事務開始時已經存在的數據版本,而不是最新的數據版本。這種讀取方式提供了事務在執(zhí)行期間看到的數據視圖的一致性,select 查詢就是快照讀。當前讀:是指在事務中讀取最新的數據版本,以下幾種操作都是當前讀:
- select ... for update;
- select ... lock in share mode;
- insert ...
- update ...
- delete ...
MVCC 實現原理
MVCC 主要是依靠以下兩部分實現的:
- Undo Log 鏈
- Read View(讀視圖或者叫一致性視圖)
Undo Log 鏈
我們知道 Undo Log 主要是用于數據庫中事務回滾的,但在 MVCC 機制中也發(fā)揮著重要的作用,那什么是 Undo Log 鏈呢?
Undo Log 鏈是指在每個數據對象上維護的 Undo Log 記錄鏈表。每張表都會有與之相對應的 Undo Log 鏈,用于記錄修改前的數據信息(以方便數據進行回滾)。
Read View
Read View(讀視圖)用于管理事務之間數據可見性的一種機制。Read View 在特定時刻為事務創(chuàng)建的一個快照,該快照包含了在該時刻所有未提交事務的事務標識符,以及其他一些輔助信息。
在 Read View 中包含了以下 4 個主要的字段:
- m_ids:當前活躍的事務編號集合。
- min_trx_id:最小活躍事務編號。
- max_trx_id:預分配事務編號,當前最大事務編號+1。
- creator_trx_id:ReadView 創(chuàng)建者的事務編號。
RC 級別中,每次快照讀都會生成一個全新的 Read View,而 RR 級別中同一個事務會復用一個 Read View。
有了 Read View 和 Undo Log 鏈之后,并發(fā)事務在查詢時就知道要讀取那些數據了。
判斷方法
判斷方法是根據 Read View 中的 4 個重要字段,先去 Undo Log 中最新的數據行進行比對,如果滿足下面 Read View 的判斷條件,則返回當前行的數據,如果不滿足則繼續(xù)查找 Undo Log 的下一行數據,直到找到滿足的條件的數據為止,如果查詢完沒有滿足條件的數據,則返回 NULL。
判斷規(guī)則
- trx_id==creator_trx_id:先將 Undo Log 最新數據行中的 trx_id 和 ReadView 中的 creator_trx_id 進行對比,如果他們兩個值相同,則說明是在同一個事務中執(zhí)行,那么直接返回當前 Undo Log 的數據行即可,如果不相等,則繼續(xù)下面流程。
- trx_id<min_trx_id:如果 trx_id 小于 min_trx_id,則說明在執(zhí)行查詢時,其他事務已經提交此行數據了,那么直接返回此行數據即可,如果大于等于,則繼續(xù)下面流程。
- trx_id>max_trx_id:如果 trx_id 如果大于等于 max_trx_id,則說明該行數據比當前操作執(zhí)行的晚,當前行數據不可見,繼續(xù)執(zhí)行后續(xù)流程。
- min_trx_id<=trx_id<max_trx_id:trx_id 在 min_trx_id 和 max_trx_id 之間還分為以下兩種情況:
- trx_id 在 m_ids 中:說明事務尚未執(zhí)行完,該行數據不可被訪問。
- trx_id 未在 m_ids 中:說明事務已經執(zhí)行完,可以返回該行數據。
以上判斷規(guī)則從 Undo Log 最新的行數據,逐行對比,直到找到匹配的數據,否則查詢完未匹配上,則返回 NULL。
小結
MVCC 的實現主要依賴讀視圖 Read View 和 Undo Log 鏈,通過 Read View 中的 4 個字段,判斷要讀取 Undo Log 中數據,從而解決了數據庫并發(fā)訪問中,數據一致性的問題。
MVCC 主要應用于 InnoDB 引擎中的 RC 事務隔離級別和 RR 隔離級別,其中 RC 隔離級別每次快照讀都會生成一個新的 Read View,而 RR 隔離級別只在第一次快照讀時生成 Read View,之后會復用 Read View,從而解決了(部分)幻讀問題。