自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<sub id="palky"></sub>

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓

鴻蒙開發(fā)者社區(qū)

WOT技術大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設置退出

六種常用事務解決方案沒有最好只有更好

2022-07-06 12:03:55

開發(fā) 新聞

? 任何事務機制在實現(xiàn)時，都應該考慮事務的ACID特性，包括：本地事務、分布式事務，及時不能都很好的滿足，也要考慮支持到什么程度。

1 事務概念

在分布式系統(tǒng)中，為了保證數(shù)據(jù)的高可用，通常，我們會將數(shù)據(jù)保留多個副本(replica)，這些副本會放置在不同的物理的機器上。為了對用戶提供正確的 CRUD 等語義，我們需要保證這些放置在不同物理機器上的副本是一致的。分布式事務在現(xiàn)在遍地都是分布式部署的系統(tǒng)中幾乎是必要的。

我們的項目用到了數(shù)據(jù)庫，也和事務有關，我們先分析一下項目的問題，再描述一下事務。

如上圖，如果用戶打車成功，需要修改司機狀態(tài)、下單、記錄支付日志，而每個操作都是調(diào)用了不同的服務，比如此時 hailtaxi-driver? 服務執(zhí)行成功了，但是 hailtaxi-order 有可能執(zhí)行失敗了，這時候如何實現(xiàn)跨服務事務回滾呢？這就要用到分布式事務。

1.1 事務簡介

事務(Transaction)是訪問并可能更新數(shù)據(jù)庫中各種數(shù)據(jù)項的一個程序執(zhí)行單元(unit)。在關系數(shù)據(jù)庫中，一個事務由一組SQL語句組成。事務應該具有4個屬性：原子性、一致性、隔離性、持久性。這四個屬性通常稱為ACID特性。

原子性（atomicity）：事務是一個不可分割的工作單位，事務中包括的諸操作要么都做，要么都不做。

一致性（consistency）：事務必須是使數(shù)據(jù)庫從一個一致性狀態(tài)變到另一個一致性狀態(tài)，事務的中間狀態(tài)不能被觀察到的。

隔離性（isolation）：一個事務的執(zhí)行不能被其他事務干擾。即一個事務內(nèi)部的操作及使用的數(shù)據(jù)對并發(fā)的其他事務是隔離的，并發(fā)執(zhí)行的各個事務之間不能互相干擾。隔離性又分為四個級別：讀未提交(read uncommitted)、讀已提交(read committed，解決臟讀)、可重復讀(repeatable read，解決虛讀)、串行化(serializable，解決幻讀)。

持久性（durability）：持久性也稱永久性（permanence），指一個事務一旦提交，它對數(shù)據(jù)庫中數(shù)據(jù)的改變就應該是永久性的。接下來的其他操作或故障不應該對其有任何影響。

任何事務機制在實現(xiàn)時，都應該考慮事務的ACID特性，包括：本地事務、分布式事務，及時不能都很好的滿足，也要考慮支持到什么程度。

1.2 本地事務

大多數(shù)場景下，我們的應用都只需要操作單一的數(shù)據(jù)庫，這種情況下的事務稱之為本地事務( Local Transaction )。本地事務的ACID特性是數(shù)據(jù)庫直接提供支持。本地事務應用架構如下所示：

很多java應用都整合了spring，并使用其聲明式事務管理功能來完成事務功能。一般使用的步驟如下：

? 1、配置事務管理器。spring提供了一個 PlatformTransactionManager 接口，其有2個重要的實現(xiàn)類：

DataSourceTransactionManager? :用于支持本地事務,事實上,其內(nèi)部也是通過操作 java.sql.Connection 來開啟、提交和回滾事務。

JtaTransactionManager ：用于支持分布式事務，其實現(xiàn)了JTA規(guī)范，使用XA協(xié)議進行兩階段提交。需要注意的是，這只是一個代理，我們需要為其提供一個JTA provider，一般是Java EE容器提供的事務協(xié)調(diào)器(Java EE server's transaction coordinator)，也可以不依賴容器，配置一個本地的JTA provider。

? 2、在需要開啟的事務的bean的方法上添加 @Transitional 注解

可以看到，spring除了支持本地事務，也支持分布式事務，下面我們先對分布式事務的典型應用場景進行介紹。

1.3 分布式事務

當下互聯(lián)網(wǎng)發(fā)展如火如荼，絕大部分公司都進行了數(shù)據(jù)庫拆分和服務化(SOA)。在這種情況下，完成某一個業(yè)務功能可能需要橫跨多個服務，操作多個數(shù)據(jù)庫。這就涉及到到了分布式事務，用需要操作的資源位于多個資源服務器上，而應用需要保證對于多個資源服務器的數(shù)據(jù)的操作，要么全部成功，要么全部失敗。本質(zhì)上來說，分布式事務就是為了保證不同資源服務器的數(shù)據(jù)一致性。

1.3.1 跨庫事務

跨庫事務指的是，一個應用某個功能需要操作多個庫，不同的庫中存儲不同的業(yè)務數(shù)據(jù)。下圖演示了一個服務同時操作2個庫的情況：

1.3.2 分庫分表事務

通常一個庫數(shù)據(jù)量比較大或者預期未來的數(shù)據(jù)量比較大，都會進行水平拆分，也就是分庫分表。如下圖，將數(shù)據(jù)庫B拆分成了2個庫：

? 對于分庫分表的情況，一般開發(fā)人員都會使用一些數(shù)據(jù)庫中間件來降低sql操作的復雜性。如，對于sql： insert into user(id,name) values (1,"gupaoedu"),(2,"gpvp") 。這條sql是操作單庫的語法，單庫情況下，可以保證事務的一致性。

但是由于現(xiàn)在進行了分庫分表，開發(fā)人員希望將1號記錄插入分庫1，2號記錄插入分庫2。所以數(shù)據(jù)庫中間件要將其改寫為2條sql，分別插入兩個不同的分庫，此時要保證兩個庫要不都成功，要不都失敗，因此基本上所有的數(shù)據(jù)庫中間件都面臨著分布式事務的問題。

1.3.3 跨應用事務

微服務架構是目前一個比較一個比較火的概念。例如上面提到的一個案例，某個應用同時操作了9個庫，這樣的應用業(yè)務邏輯必然非常復雜，對于開發(fā)人員是極大的挑戰(zhàn)，應該拆分成不同的獨立服務，以簡化業(yè)務邏輯。拆分后，獨立服務之間通過RPC框架來進行遠程調(diào)用，實現(xiàn)彼此的通信。下圖演示了一個3個服務之間彼此調(diào)用的架構：

Service A完成某個功能需要直接操作數(shù)據(jù)庫，同時需要調(diào)用Service B和Service C，而Service B又同時操作了2個數(shù)據(jù)庫，Service C也操作了一個庫。需要保證這些跨服務的對多個數(shù)據(jù)庫的操作要不都成功，要不都失敗，實際上這可能是最典型的分布式事務場景。

上述討論的分布式事務場景中，無一例外的都直接或者間接的操作了多個數(shù)據(jù)庫。如何保證事務的ACID特性，對于分布式事務實現(xiàn)方案而言，是非常大的挑戰(zhàn)。同時，分布式事務實現(xiàn)方案還必須要考慮性能的問題，如果為了嚴格保證ACID特性，導致性能嚴重下降，那么對于一些要求快速響應的業(yè)務，是無法接受的。

2 分布式理論

分布式事務可以有多種分類，比如柔性事務和強一致性事務，這些事務操作會遵循一定的定理，比如CAP原理、BASE理論。

2.1 CAP原理

CAP 定理又被稱作布魯爾定理，是加州大學的計算機科學家布魯爾在 2000 年提出的一個猜想。2002 年，麻省理工學院的賽斯·吉爾伯特和南?！ち制姘l(fā)表了布魯爾猜想的證明，使之成為分布式計算領域公認的一個定理。

布魯爾在提出CAP猜想時并沒有具體定義 Consistency、Availability、Partition Tolerance 這3個詞的含義，不同資料的具體定義也有差別，為了更好地解釋，下面選擇Robert Greiner的文章《CAP Theorem》作為參考基礎。

CAP定理是這樣描述的：在一個分布式系統(tǒng)（指互相連接并共享數(shù)據(jù)的節(jié)點的集合）中，當涉及讀寫操作時，只能保證一致性（Consistence）、可用性（Availability）、分區(qū)容錯性（PartitionTolerance）三者中的兩個，另外一個必須被犧牲。

Consistency、Availability、Partition Tolerance具體解釋如下：

C-Consistency 一致性

A read is guaranteed to return the most recent write for a given client.

這里并不是強調(diào)同一時刻擁有相同的數(shù)據(jù)，對于系統(tǒng)執(zhí)行事務來說，在事務執(zhí)行過程中，系統(tǒng)其實處于一個不一致的狀態(tài)，不同的節(jié)點的數(shù)據(jù)并不完全一致。

一致性強調(diào)客戶端讀操作能夠獲取最新的寫操作結果，是因為事務在執(zhí)行過程中，客戶端是無法讀取到未提交的數(shù)據(jù)的，只有等到事務提交后，客戶端才能讀取到事務寫入的數(shù)據(jù)，而如果事務失敗則會進行回滾，客戶端也不會讀取到事務中間寫入的數(shù)據(jù)。

A-Availability 可用性

A non-failing node will return a reasonable response within a reasonable amount of time (no error or timeout).

這里強調(diào)的是合理的響應，不能超時，不能出錯。注意并沒有說“正確”的結果，例如，應該返回 100 但實際上返回了 90，肯定是不正確的結果，但可以是一個合理的結果。

P-Partition Tolerance 分區(qū)容忍性

The system will continue to function when network partitions occur.

當出現(xiàn) 網(wǎng)絡分區(qū) 后，系統(tǒng)能夠繼續(xù)“履行職責”。

這里網(wǎng)絡分區(qū) 是指：

一個分布式系統(tǒng)里面，節(jié)點組成的網(wǎng)絡本來應該是連通的。然而可能因為一些故障（節(jié)點間網(wǎng)絡連接斷開、節(jié)點宕機），使得有些節(jié)點之間不連通了，整個網(wǎng)絡就分成了幾塊區(qū)域，數(shù)據(jù)就散布在了這些不連通的區(qū)域中。

CAP 的選擇

雖然 CAP 理論定義是三個要素中只能取兩個，但放到分布式環(huán)境下來思考，我們會發(fā)現(xiàn)必須選擇 P（分區(qū)容忍）要素，因為網(wǎng)絡本身無法做到 100% 可靠，有可能出故障，所以分區(qū)是一個必然的現(xiàn)象。

為什么必須要選擇P:

如果我們選擇了 CA（一致性 + 可用性）而放棄了 P（分區(qū)容忍性），那么當發(fā)生分區(qū)現(xiàn)象時，為了保證 C（一致性），系統(tǒng)需要禁止寫入，當有寫入請求時，系統(tǒng)返回 error（例如，當前系統(tǒng)不允許寫入），這又和 A(可用性) 沖突了，因為 A（可用性）要求返回 no error 和 no timeout。

因此，分布式系統(tǒng)理論上不可能選擇 CA （一致性 + 可用性）架構，只能選擇 CP（一致性 + 分區(qū)容忍性）或者 AP （可用性 + 分區(qū)容忍性）架構，在一致性和可用性做折中選擇。

針對這兩種選擇再來看一下：

1、CP - Consistency + Partition Tolerance （一致性 + 分區(qū)容忍性）

如上圖所示，因為Node1節(jié)點和Node2節(jié)點連接中斷導致分區(qū)現(xiàn)象，Node1節(jié)點的數(shù)據(jù)已經(jīng)更新到y(tǒng)，但是Node1 和 Node2 之間的復制通道中斷，數(shù)據(jù) y 無法同步到 Node2，Node2 節(jié)點上的數(shù)據(jù)還是舊數(shù)據(jù)x。

這時客戶端C 訪問 Node2 時，Node2 需要返回 Error，提示客戶端 “系統(tǒng)現(xiàn)在發(fā)生了錯誤”，這種處理方式違

背了可用性（Availability）的要求，因此 CAP 三者只能滿足 CP。

2、AP - Availability + Partition Tolerance （可用性 + 分區(qū)容忍性）

同樣是Node2 節(jié)點上的數(shù)據(jù)還是舊數(shù)據(jù)x，這時客戶端C 訪問 Node2 時，Node2 將當前自己擁有的數(shù)據(jù) x 返回給客戶端了，而實際上當前最新的數(shù)據(jù)已經(jīng)是 y 了，這就不滿足一致性（Consistency）的要求了，因此 CAP 三者只能滿足 AP。

注意：這里 Node2 節(jié)點返回 x，雖然不是一個“正確”的結果，但是一個“合理”的結果，因為 x 是舊的數(shù)據(jù)，并不是一個錯亂的值，只是不是最新的數(shù)據(jù)。

值得補充的是：，CAP理論告訴我們分布式系統(tǒng)只能選擇AP或者CP ，但實際上并不是說整個系統(tǒng)只能選擇AP或者CP，在 CAP 理論落地實踐時，我們需要將系統(tǒng)內(nèi)的數(shù)據(jù)按照不同的應用場景和要求進行分類，每類數(shù)據(jù)選擇不同的策略（CP 還是 AP），而不是直接限定整個系統(tǒng)所有數(shù)據(jù)都是同一策略。

另外，只能選擇CP或者AP是指系統(tǒng)發(fā)生分區(qū)現(xiàn)象時無法同時保證C（一致性）和A（可用性），但不是意味著什么都不做，當分區(qū)故障解決后，系統(tǒng)還是要保持保證CA。也就是說選了AP不意味著放棄了C，選了CP不意味著放棄了A

2.2 BASE理論

BASE 是指基本可用（Basically Available）、軟狀態(tài)（ Soft State）、最終一致性（ Eventual Consistency），是基于CAP定理演化而來，是對CAP中一致性和可用性權衡的結果；核心思想是即使無法做到強一致性（CAP 的一致性就是強一致性），但應用可以采用適合的方式達到最終一致性。

BA-Basically Available基本可用

分布式系統(tǒng)在出現(xiàn)故障時，允許損失部分可用性，即保證核心可用。

這里的關鍵詞是“ 部分 ”和“ 核心 ”，實際實踐上，哪些是核心需要根據(jù)具體業(yè)務來權衡。例如登錄功能相對注冊功能更加核心，注冊不了最多影響流失一部分用戶，如果用戶已經(jīng)注冊但無法登錄，那就意味用戶無法使用系統(tǒng)，造成的影響范圍更大。

S-Soft State 軟狀態(tài)

允許系統(tǒng)存在中間狀態(tài)，而該中間狀態(tài)不會影響系統(tǒng)整體可用性。這里的中間狀態(tài)就是 CAP 理論中的數(shù)據(jù)不一致。

E-Eventual Consistency 最終一致性

系統(tǒng)中的所有數(shù)據(jù)副本經(jīng)過一定時間后，最終能夠達到一致的狀態(tài)。

這里的關鍵詞是“一定時間” 和 “最終”，“ 一定時間 ”和數(shù)據(jù)的特性是強關聯(lián)的，不同業(yè)務不同數(shù)據(jù)能夠容忍的不一致時間是不同的。例如支付類業(yè)務是要求秒級別內(nèi)達到一致，因為用戶時時關注；用戶發(fā)的最新微博，可以容忍30分鐘內(nèi)達到一致的狀態(tài)，因為用戶短時間看不到明星發(fā)的微博是無感知的。而“ 最終 ”的含義就是不管多長時間，最終還是要達到一致性的狀態(tài)。

BASE 理論本質(zhì)上是對 CAP 的延伸和補充，更具體地說，是對 CAP 中 AP 方案的一個補充：

CP 理論是忽略延時的，而實際應用中延時是無法避免的。

這一點就意味著完美的 CP 場景是不存在的，即使是幾毫秒的數(shù)據(jù)復制延遲，在這幾毫秒時間間隔內(nèi)，系統(tǒng)是不符合 CP 要求的。因此 CAP 中的 CP 方案，實際上也是實現(xiàn)了最終一致性，只是“一定時間”是指幾毫秒而已。

AP 方案中犧牲一致性只是指發(fā)生分區(qū)故障期間，而不是永遠放棄一致性。

這一點其實就是 BASE 理論延伸的地方，分區(qū)期間犧牲一致性，但分區(qū)故障恢復后，系統(tǒng)應該達到最終一致性。

2.3 剛柔事務

何謂剛柔事務？剛性事務它的事務是原子的，要么都成功要么都失敗，也就是需要保障ACID理論，而柔性事務只需要保障數(shù)據(jù)最終一致即可，需要遵循BASE理論。

剛性事務滿足ACID理論

柔性事務滿足BASE理論（基本可用，最終一致）

基于BASE理論的設計思想，柔性事務下，在不影響系統(tǒng)整體可用性的情況下(Basically Available 基本可用)，允許系統(tǒng)存在數(shù)據(jù)不一致的中間狀態(tài)(Soft State 軟狀態(tài))，在經(jīng)過數(shù)據(jù)同步的延時之后，最終數(shù)據(jù)能夠達到一致。并不是完全放棄了ACID，而是通過放寬一致性要求，借助本地事務來實現(xiàn)最終分布式事務一致性的同時也保證系統(tǒng)的吞吐。

3 常用事務解決方案模型

分布式事務解決方案幾乎都是柔性事務，分布式事務的實現(xiàn)有許多種，其中較經(jīng)典是由Tuxedo提出的XA分布式事務協(xié)議，XA協(xié)議包含二階段提交（2PC）和三階段提交（3PC）兩種實現(xiàn)。

其他還有 TCC、MQ 等最終一致性解決方案，至于工作中用哪種方案，需要根據(jù)業(yè)務場景選取， 2PC/3PC、TCC 數(shù)據(jù)強一致性高，而MQ是最終數(shù)據(jù)一致。

3.1 DTP模型

X/Open DTP(X/Open Distributed Transaction Processing Reference Model) 是X/Open 這個組織定義的一套分布式事務的標準，也就是了定義了規(guī)范和API接口，由廠商進行具體的實現(xiàn)

X/Open DTP中的角色

AP(Application Program)：應用程序，主要是定義事務邊界以及那些組成事務的特定于應用程序的操作。

RM(Resouces Manager)：資源管理器，管理一些共享資源的自治域，如提供對諸如數(shù)據(jù)庫之類的共享資源的訪問。譬如：數(shù)據(jù)庫、文件系統(tǒng)等，并且提供了這些資源的訪問方式。

TM(Transaction Manager)：事務管理器，管理全局事務，協(xié)調(diào)事務的提交或者回滾，并協(xié)調(diào)故障恢復。

DTP模型里面定義了XA協(xié)議接口，TM 和 RM 通過XA接口進行雙向通信

3.2 2PC

2PC? 、 3PC? ，都是基于 XA 協(xié)議的

方案簡介

二階段提交協(xié)議（Two-phase Commit，即2PC）是常用的分布式事務解決方案，即將事務的提交過程分為兩個階段來進行處理：準備階段和提交階段。事務的發(fā)起者稱協(xié)調(diào)者，事務的執(zhí)行者稱參與者。

在分布式系統(tǒng)里，每個節(jié)點都可以知曉自己操作的成功或者失敗，卻無法知道其他節(jié)點操作的成功或失敗。當一個事務跨多個節(jié)點時，為了保持事務的原子性與一致性，而引入一個協(xié)調(diào)者來統(tǒng)一掌控所有參與者的操作結果，并指示它們是否要把操作結果進行真正的提交或者回滾（rollback）。

二階段提交的算法思路可以概括為：參與者將操作成敗通知協(xié)調(diào)者，再由協(xié)調(diào)者根據(jù)所有參與者的反饋情報決定各參與者是否要提交操作還是中止操作。

核心思想就是對每一個事務都采用先嘗試后提交的處理方式，處理后所有的讀操作都要能獲得最新的數(shù)據(jù)，因此也可以將二階段提交看作是一個強一致性算法。

處理流程

簡單一點理解，可以把協(xié)調(diào)者節(jié)點比喻為帶頭大哥，參與者理解比喻為跟班小弟，帶頭大哥統(tǒng)一協(xié)調(diào)跟班小弟的任務執(zhí)行。

階段1：準備階段

1、協(xié)調(diào)者向所有參與者發(fā)送事務內(nèi)容，詢問是否可以提交事務，并等待所有參與者答復。

2、各參與者執(zhí)行事務操作，將undo和redo信息記入事務日志中（但不提交事務）。

3、如參與者執(zhí)行成功，給協(xié)調(diào)者反饋yes，即可以提交；如執(zhí)行失敗，給協(xié)調(diào)者反饋no，即不可提交。

階段2：提交階段

如果協(xié)調(diào)者收到了參與者的失敗消息或者超時，直接給每個參與者發(fā)送回滾(rollback)消息；否則，發(fā)送提交(commit)消息；參與者根據(jù)協(xié)調(diào)者的指令執(zhí)行提交或者回滾操作，釋放所有事務處理過程中使用的鎖資源。(注意:必須在最后階段釋放鎖資源)

接下來分兩種情況分別討論提交階段的過程。

情況1，當所有參與者均反饋yes，提交事務：

1、協(xié)調(diào)者向所有參與者發(fā)出正式提交事務的請求（即commit請求）。
2、參與者執(zhí)行commit請求，并釋放整個事務期間占用的資源。
3、各參與者向協(xié)調(diào)者反饋ack(應答)完成的消息。
4、協(xié)調(diào)者收到所有參與者反饋的ack消息后，即完成事務提交。

情況2，當任何階段1一個參與者反饋no，中斷事務：

1、協(xié)調(diào)者向所有參與者發(fā)出回滾請求（即rollback請求）。
2、參與者使用階段1中的undo信息執(zhí)行回滾操作，并釋放整個事務期間占用的資源。
3、各參與者向協(xié)調(diào)者反饋ack完成的消息。
4、協(xié)調(diào)者收到所有參與者反饋的ack消息后，即完成事務中斷。

方案總結

2PC是一個強一致性的同步阻塞協(xié)議，事務執(zhí)?過程中需要將所需資源全部鎖定，也就是俗稱的剛性事務

2PC方案實現(xiàn)起來簡單，實際項目中使用比較少，主要因為以下問題：

性能問題所有參與者在事務提交階段處于同步阻塞狀態(tài)，占用系統(tǒng)資源，容易導致性能瓶頸。
可靠性問題如果協(xié)調(diào)者存在單點故障問題，如果協(xié)調(diào)者出現(xiàn)故障，參與者將一直處于鎖定狀態(tài)。
數(shù)據(jù)一致性問題在階段2中，如果發(fā)生局部網(wǎng)絡問題，一部分事務參與者收到了提交消息，另一部分事務參與者沒收到提交消息，那么就導致了節(jié)點之間數(shù)據(jù)的不一致。
只適用于單個服務中因為使用了XA規(guī)范，只支持單體服務的跨庫分布式事務，不支持跨服務間的分布式事務

3.3 3PC

方案簡介

三階段提交協(xié)議，是二階段提交協(xié)議的改進版本，與二階段提交不同的是，引入超時機制。同時在協(xié)調(diào)者和參與者中都引入超時機制（ 2PC 中只有協(xié)調(diào)者有超時機制）。

三階段提交將二階段的準備階段拆分為2個階段，插入了一個preCommit階段，使得原先在二階段提交中，參與者在準備之后，由于協(xié)調(diào)者發(fā)生崩潰或錯誤，而導致參與者處于無法知曉是否提交或者中止的“不確定狀態(tài)”所產(chǎn)生的可能相當長的延時的問題得以解決。

處理流程

階段1：canCommit

協(xié)調(diào)者向參與者發(fā)送commit請求，參與者如果可以提交就返回yes響應(參與者不執(zhí)行事務操作)，否則返回no響應：

1、協(xié)調(diào)者向所有參與者發(fā)出包含事務內(nèi)容的canCommit請求，詢問是否可以提交事務，并等待所有參與者答復。
2、參與者收到canCommit請求后，如果認為可以執(zhí)行事務操作，則反饋yes并進入預備狀態(tài)，否則反饋no。

階段2：preCommit

協(xié)調(diào)者根據(jù)階段1 canCommit參與者的反應情況來決定是否可以基于事務的preCommit操作。根據(jù)響應情況，有以下兩種可能。

情況1，階段1所有參與者均反饋yes，參與者預執(zhí)行事務：

1、協(xié)調(diào)者向所有參與者發(fā)出preCommit請求，進入準備階段。
2、參與者收到preCommit請求后，執(zhí)行事務操作，將undo和redo信息記入事務日志中（但不提交事務）。
3、各參與者向協(xié)調(diào)者反饋ack響應或no響應，并等待最終指令。

情況2，階段1任何一個參與者反饋no，或者等待超時后協(xié)調(diào)者尚無法收到所有參與者的反饋，即中斷事務:

1、協(xié)調(diào)者向所有參與者發(fā)出abort請求。
2、無論收到協(xié)調(diào)者發(fā)出的abort請求，或者在等待協(xié)調(diào)者請求過程中出現(xiàn)超時，參與者均會中斷事務。

?階段3：do Commit

該階段進行真正的事務提交，也可以分為以下兩種情況：

情況1：階段2所有參與者均反饋ack響應，執(zhí)行真正的事務提交：

1、如果協(xié)調(diào)者處于工作狀態(tài)，則向所有參與者發(fā)出do Commit請求。
2、參與者收到do Commit請求后，會正式執(zhí)行事務提交，并釋放整個事務期間占用的資源。
3、各參與者向協(xié)調(diào)者反饋ack完成的消息。
4、協(xié)調(diào)者收到所有參與者反饋的ack消息后，即完成事務提交。

階段2任何一個參與者反饋no，或者等待超時后協(xié)調(diào)者尚無法收到所有參與者的反饋，即中斷事務：

1、如果協(xié)調(diào)者處于工作狀態(tài)，向所有參與者發(fā)出abort請求。
2、參與者使用階段1中的undo信息執(zhí)行回滾操作，并釋放整個事務期間占用的資源。
3、各參與者向協(xié)調(diào)者反饋ack完成的消息。
4、協(xié)調(diào)者收到所有參與者反饋的ack消息后，即完成事務中斷

注意：進入階段3后，無論協(xié)調(diào)者出現(xiàn)問題，或者協(xié)調(diào)者與參與者網(wǎng)絡出現(xiàn)問題，都會導致參與者無法接收到協(xié)調(diào)者發(fā)出的do Commit請求或abort請求。此時，參與者都會在等待超時之后，繼續(xù)執(zhí)行事務提交。

階段三只允許成功不允許失敗，如果服務器宕機或者停電，因為記錄的階段二的數(shù)據(jù)，重啟服務后在提交事務，所以，到了階段三，失敗了也不進行回滾，只允許成功。

方案總結

優(yōu)點

相比二階段提交，三階段提交降低了阻塞范圍，在等待超時后協(xié)調(diào)者或參與者會中斷事務。避免了協(xié)調(diào)者單點問題，階段3中協(xié)調(diào)者出現(xiàn)問題時，參與者會繼續(xù)提交事務。

缺點

數(shù)據(jù)不一致問題依然存在，當在參與者收到preCommit請求后等待do commite指令時，此時如果協(xié)調(diào)者請求中斷事務，而協(xié)調(diào)者無法與參與者正常通信，會導致參與者繼續(xù)提交事務，造成數(shù)據(jù)不一致。

3.4 TCC

方案簡介

TCC（Try-Confirm-Cancel）的概念，最早是由Pat Helland于2007年發(fā)表的一篇名為《Life beyond Distributed Transactions:an Apostate’s Opinion》的論文提出。

TCC是服務化的二階段編程模型，其Try、Confirm、Cancel 3個方法均由業(yè)務編碼實現(xiàn)；

Try操作作為一階段，負責資源的檢查和預留。
Confirm操作作為二階段提交操作，執(zhí)行真正的業(yè)務。
Cancel是預留資源的取消。

TCC事務的Try、Confirm、Cancel可以理解為SQL事務中的Lock、Commit、Rollback。

TCC? 為在業(yè)務層編寫代碼實現(xiàn)的兩階段提交。 TCC? 分別指 Try? 、 Confirm? 、 Cancel ，一個業(yè)務操作要對應的寫這三個方法。

處理流程

為了方便理解，下面以電商下單為例進行方案解析，這里把整個過程簡單分為扣減庫存，訂單創(chuàng)建2個步驟，庫存服務和訂單服務分別在不同的服務器節(jié)點上。

階段1：Try 階段

從執(zhí)行階段來看，與傳統(tǒng)事務機制中業(yè)務邏輯相同。但從業(yè)務角度來看，卻不一樣。TCC機制中的Try僅是一個初步操作，它和后續(xù)的確認一起才能真正構成一個完整的業(yè)務邏輯，這個階段主要完成：

完成所有業(yè)務檢查( 一致性 )
預留必須業(yè)務資源( 準隔離性 )
Try 嘗試執(zhí)行業(yè)務TCC事務機制以初步操作（Try）為中心的，確認操作（Confirm）和取消操作（Cancel）都是圍繞初步操作（Try）而展開。因此，Try階段中的操作，其保障性是最好的，即使失敗，仍然有取消操作（Cancel）可以將其執(zhí)行結果撤銷。

假設商品庫存為100，購買數(shù)量為2，這里檢查和更新庫存的同時，凍結用戶購買數(shù)量的庫存，同時創(chuàng)建訂單，訂單狀態(tài)為待確認。

階段2：Confirm / Cancel 階段

根據(jù)Try階段服務是否全部正常執(zhí)行，繼續(xù)執(zhí)行確認操作（Confirm）或取消操作（Cancel）。

Confirm：確認

當Try階段服務全部正常執(zhí)行，執(zhí)行確認業(yè)務邏輯操作

這里使用的資源一定是Try階段預留的業(yè)務資源。在TCC事務機制中認為，如果在Try階段能正常的預留資源，那Confirm一定能完整正確的提交。Confirm階段也可以看成是對Try階段的一個補充，Try+Confirm一起組成了一個完整的業(yè)務邏輯。

Cancel：取消

當Try階段存在服務執(zhí)行失敗，進入Cancel階段

Cancel取消執(zhí)行，釋放Try階段預留的業(yè)務資源，上面的例子中，Cancel操作會把凍結的庫存釋放，并更新訂單狀態(tài)為取消。

方案總結

TCC事務機制相對于傳統(tǒng)事務機制（X/Open XA），TCC事務機制相比于上面介紹的XA事務機制，有以下優(yōu)點:

性能提升具體業(yè)務來實現(xiàn)控制資源鎖的粒度變小，不會鎖定整個資源。
數(shù)據(jù)最終一致性基于Confirm和Cancel的冪等性，保證事務最終完成確認或者取消，保證數(shù)據(jù)的一致性。
可靠性解決了XA協(xié)議的協(xié)調(diào)者單點故障問題，由主業(yè)務方發(fā)起并控制整個業(yè)務活動，業(yè)務活動管理器也變成多點，引入集群。

缺點：

TCC的Try、Confirm和Cancel操作功能要按具體業(yè)務來實現(xiàn)，業(yè)務耦合度較高，提高了開發(fā)成本。

3.5 本地消息表

方案簡介

本地消息表的方案最初是由ebay提出，核心思路是將分布式事務拆分成本地事務進行處理。

方案通過在事務主動發(fā)起方額外新建事務消息表，事務發(fā)起方處理業(yè)務和記錄事務消息在本地事務中完成，輪詢事務消息表的數(shù)據(jù)發(fā)送事務消息，事務被動方基于消息中間件消費事務消息表中的事務。

這樣設計可以避免” 業(yè)務處理成功 + 事務消息發(fā)送失敗 “，或” 業(yè)務處理失敗 + 事務消息發(fā)送成功 “的棘手情況出現(xiàn)，保證2個系統(tǒng)事務的數(shù)據(jù)一致性。

處理流程

下面把分布式事務最先開始處理的事務方成為事務主動方，在事務主動方之后處理的業(yè)務內(nèi)的其他事務成為事務被動方。

為了方便理解，下面繼續(xù)以電商下單為例進行方案解析，這里把整個過程簡單分為扣減庫存，訂單創(chuàng)建2個步驟，庫存服務和訂單服務分別在不同的服務器節(jié)點上，其中庫存服務是事務主動方，訂單服務是事務被動方。

事務的主動方需要額外新建事務消息表，用于記錄分布式事務的消息的發(fā)生、處理狀態(tài)。

整個業(yè)務處理流程如下：

步驟1 事務主動方處理本地事務。

事務主動方在本地事務中處理業(yè)務更新操作和寫消息表操作。

上面例子中庫存服務階段在本地事務中完成扣減庫存和寫消息表(圖中1、2)。

步驟2 事務主動方通過消息中間件，通知事務被動方處理事務通知事務待消息。

消息中間件可以基于Kafka、RocketMQ消息隊列，事務主動方法主動寫消息到消息隊列，事務消費方消費并處理消息隊列中的消息。

上面例子中，庫存服務把事務待處理消息寫到消息中間件，訂單服務消費消息中間件的消息，完成新增訂單（圖中3 - 5）。

步驟3 事務被動方通過消息中間件，通知事務主動方事務已處理的消息。

上面例子中，訂單服務把事務已處理消息寫到消息中間件，庫存服務消費中間件的消息，并將事務消息的狀態(tài)更新為已完成(圖中6 - 8)

為了數(shù)據(jù)的一致性，當處理錯誤需要重試，事務發(fā)送方和事務接收方相關業(yè)務處理需要支持冪等。具體保存一致性的容錯處理如下：

1、當步驟1處理出錯，事務回滾，相當于什么都沒發(fā)生。

2、當步驟2、步驟3處理出錯，由于未處理的事務消息還是保存在事務發(fā)送方，事務發(fā)送方可以定時輪詢?yōu)槌瑫r消息數(shù)據(jù)，再次發(fā)送的消息中間件進行處理。事務被動方消費事務消息重試處理。

3、如果是業(yè)務上的失敗，事務被動方可以發(fā)消息給事務主動方進行回滾。

4、如果多個事務被動方已經(jīng)消費消息，事務主動方需要回滾事務時需要通知事務被動方回滾。

方案總結

方案的優(yōu)點如下：

從應用設計開發(fā)的角度實現(xiàn)了消息數(shù)據(jù)的可靠性，消息數(shù)據(jù)的可靠性不依賴于消息中間件，弱化了對MQ中間件特性的依賴。
方案輕量，容易實現(xiàn)。

缺點如下：

與具體的業(yè)務場景綁定，耦合性強，不可公用。
消息數(shù)據(jù)與業(yè)務數(shù)據(jù)同庫，占用業(yè)務系統(tǒng)資源。
業(yè)務系統(tǒng)在使用關系型數(shù)據(jù)庫的情況下，消息服務性能會受到關系型數(shù)據(jù)庫并發(fā)性能的局限

3.6 MQ事務

MQ事務保證最終一致性。

方案簡介

基于MQ的分布式事務方案其實是對本地消息表的封裝，將本地消息表存于MQ 內(nèi)部，其他方面的協(xié)議基本與本地消息表一致。

處理流程

下面主要基于RocketMQ4.3之后的版本介紹MQ的分布式事務方案。

在本地消息表方案中，保證事務主動方發(fā)寫業(yè)務表數(shù)據(jù)和寫消息表數(shù)據(jù)的一致性是基于數(shù)據(jù)庫事務，RocketMQ的事務消息相對于普通MQ，相對于提供了2PC的提交接口，方案如下：

正常情況——事務主動方發(fā)消息

這種情況下，事務主動方服務正常，沒有發(fā)生故障，發(fā)消息流程如下：

1、發(fā)送方向 MQ服務端(MQ Server)發(fā)送half消息。

2、MQ Server 將消息持久化成功之后，向發(fā)送方 ACK 確認消息已經(jīng)發(fā)送成功。

3、發(fā)送方開始執(zhí)行本地事務邏輯。

4、發(fā)送方根據(jù)本地事務執(zhí)行結果向 MQ Server 提交二次確認（commit 或是 rollback）。

5、MQ Server 收到 commit 狀態(tài)則將半消息標記為可投遞，訂閱方最終將收到該消息；MQ Server 收到 rollback 狀態(tài)則刪除半消息，訂閱方將不會接受該消息。

異常情況——事務主動方消息恢復

在斷網(wǎng)或者應用重啟等異常情況下，圖中第4步提交的二次確認超時未到達 MQ Server，此時處理邏輯如下：

5、MQ Server 對該消息發(fā)起消息回查。
6、發(fā)送方收到消息回查后，需要檢查對應消息的本地事務執(zhí)行的最終結果。
7、發(fā)送方根據(jù)檢查得到的本地事務的最終狀態(tài)再次提交二次確認
8、MQ Server基于commit / rollback 對消息進行投遞或者刪除

介紹完RocketMQ的事務消息方案后，由于前面已經(jīng)介紹過本地消息表方案，這里就簡單介紹RocketMQ分布式事務：

事務主動方基于MQ通信通知事務被動方處理事務，事務被動方基于MQ返回處理結果。

如果事務被動方消費消息異常，需要不斷重試，業(yè)務處理邏輯需要保證冪等。

如果是事務被動方業(yè)務上的處理失敗，可以通過MQ通知事務主動方進行補償或者事務回滾。

方案總結

相比本地消息表方案，MQ事務方案優(yōu)點是：

消息數(shù)據(jù)獨立存儲，降低業(yè)務系統(tǒng)與消息系統(tǒng)之間的耦合。
吞吐量優(yōu)于使用本地消息表方案。

缺點是：

一次消息發(fā)送需要兩次網(wǎng)絡請求(half消息 + commit/rollback消息)
業(yè)務處理服務需要實現(xiàn)消息狀態(tài)回查接口

責任編輯：張燕妮來源：傳智教育博學谷 - 狂野架構師

事務解決方案

51CTO技術棧公眾號

業(yè)務
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學堂精培企業(yè)培訓 CTO訓練營

^{<sub id="fj6kz"></sub>}

<legend id="fj6kz"><track id="fj6kz"></track></legend>