用 Node 輕松完成一個分布式事務(wù) TCC,保姆級教程
什么是TCC,TCC是Try、Confirm、Cancel三個詞語的縮寫,最早是由 Pat Helland 于 2007 年發(fā)表的一篇名為《Life beyond Distributed Transactions:an Apostate’s Opinion》的論文提出。
TCC組成
TCC分為3個階段
-
Try 階段:嘗試執(zhí)行,完成所有業(yè)務(wù)檢查(一致性), 預(yù)留必須業(yè)務(wù)資源(準(zhǔn)隔離性)
-
Confirm 階段:如果所有分支的Try都成功了,則走到Confirm階段。Confirm真正執(zhí)行業(yè)務(wù),不作任何業(yè)務(wù)檢查,只使用 Try 階段預(yù)留的業(yè)務(wù)資源
-
Cancel 階段:如果所有分支的Try有一個失敗了,則走到Cancel階段。Cancel釋放 Try 階段預(yù)留的業(yè)務(wù)資源。
TCC分布式事務(wù)里,有3個角色,與經(jīng)典的XA分布式事務(wù)一樣:
-
AP/應(yīng)用程序,發(fā)起全局事務(wù),定義全局事務(wù)包含哪些事務(wù)分支
-
RM/資源管理器,負(fù)責(zé)分支事務(wù)各項資源的管理
-
TM/事務(wù)管理器,負(fù)責(zé)協(xié)調(diào)全局事務(wù)的正確執(zhí)行,包括Confirm,Cancel的執(zhí)行,并處理網(wǎng)絡(luò)異常
如果我們要進行一個類似于銀行跨行轉(zhuǎn)賬的業(yè)務(wù),轉(zhuǎn)出(TransOut)和轉(zhuǎn)入(TransIn)分別在不同的微服務(wù)里,一個成功完成的TCC事務(wù)典型的時序圖如下:
TCC網(wǎng)絡(luò)異常
TCC在整個全局事務(wù)的過程中,可能發(fā)生各類網(wǎng)絡(luò)異常情況,典型的是空回滾、冪等、懸掛,由于TCC的異常情況,和SAGA、可靠消息等事務(wù)模式有相近的地方,因此我們把所有異常的解決方案統(tǒng)統(tǒng)放在這篇文章《分布式事務(wù)最經(jīng)典的七種解決方案》的子事務(wù)屏障環(huán)節(jié)進行講解
TCC實踐
下面我們進行一個TCC事務(wù)的具體開發(fā)
目前可用于TCC的開源框架,主要為Java語言,其中以seata為代表。我們的例子采用nodejs,使用的分布式事務(wù)框架為dtm,它對分布式事務(wù)的支持非常優(yōu)雅。下面來詳細(xì)講解TCC的組成
下面我們來編寫具體的Try/Confirm/Cancel的處理函數(shù)
- router.post('/api/TransOutTry', (ctx, next) => {
- console.log("TransOutTry")
- ctx.body = { result: "SUCCESS" }
- }).post('/api/TransOutConfirm', (ctx, next) => {
- console.log("TransOutConfirm")
- ctx.body = { result: "SUCCESS" }
- }).post('/api/TransOutCancel', (ctx, next) => {
- console.log("TransOutCancel")
- ctx.body = { result: "SUCCESS" }
- }).post('/api/TransInTry', (ctx, next) => {
- console.log("TransInTry")
- ctx.body = { result: "SUCCESS" }
- }).post('/api/TransInConfirm', (ctx, next) => {
- console.log("TransInConfirm")
- ctx.body = { result: "SUCCESS" }
- }).post('/api/TransInCancel', (ctx, next) => {
- console.log("TransInCancel")
- ctx.body = { result: "SUCCESS" }
- })
到此各個子事務(wù)的處理函數(shù)已經(jīng)OK了,然后是開啟TCC事務(wù),進行分支調(diào)用
- async function FireTcc() {
- let dtm = "http://localhost:8080/api/dtmsvr" // dtm服務(wù)地址
- let svc = "http://localhost:4005/api" // 本地服務(wù)前綴
- // 開啟一個tcc事務(wù),第二個參數(shù)里面,寫全局事務(wù)的邏輯
- await dtmcli.tccGlobalTransaction(dtm, async (t) => {
- let req = { amount: 30 } // 子事務(wù)需要的負(fù)荷
- console.log("calling trans out")
- // 注冊事務(wù)分支,并調(diào)用分支中的Try
- await t.callBranch(req, svc + "/TransOutTry", svc + "/TransOutConfirm", svc + "/TransOutCancel")
- console.log("calling trans in")
- // 注冊事務(wù)分支,并調(diào)用分支中的Try
- await t.callBranch(req, svc + "/TransInTry", svc + "/TransInConfirm", svc + "/TransInCancel")
- })
- }
至此,一個完整的TCC分布式事務(wù)編寫完成。
如果您想要完整運行一個成功的示例,那么參考這個例子yedf/dtmcli-node-sample,將它運行起來非常簡單
- # 部署啟動dtm
- # 需要docker版本18以上
- git clone https://github.com/yedf/dtm
- cd dtm
- docker-compose up
- # 另起一個命令行
- git clone https://github.com/yedf/dtmcli-node-sample
- cd dtmcli-node-sample
- npm install
- node .
TCC的回滾
假如銀行將金額準(zhǔn)備轉(zhuǎn)入用戶2時,發(fā)現(xiàn)用戶2的賬戶異常,返回失敗,會怎么樣?我們給出事務(wù)失敗交互的時序圖
這個跟成功的TCC差別就在于,當(dāng)某個子事務(wù)返回失敗后,后續(xù)就回滾全局事務(wù),調(diào)用各個子事務(wù)的Cancel操作,保證全局事務(wù)全部回滾。
小結(jié)
在這篇文章里,我們介紹了TCC的理論知識,也通過一個例子,完整給出了編寫一個TCC事務(wù)的過程,涵蓋了正常成功完成,以及成功回滾的情況。相信讀者通過這邊文章,對TCC已經(jīng)有了深入的理解。
關(guān)于分布式事務(wù)更多更全面的知識,請參考《分布式事務(wù)最經(jīng)典的七種解決方案》
文中使用的例子節(jié)選自yedf/dtm,支持多種事務(wù)模式:TCC、SAGA、XA、事務(wù)消息 跨語言支持,已支持 golang、python、Java、PHP、nodejs等語言的客戶端,參考各語言SDK。提供子事務(wù)屏障功能,優(yōu)雅解決冪等、懸掛、空補償?shù)葐栴}。
閱讀完此篇干貨,歡迎大家訪問https://github.com/yedf/dtm項目,給顆星星支持!