干貨:電商支付系統(tǒng)的對賬處理與設(shè)計
可以說,對賬是支付系統(tǒng)最頭疼的事情。每一筆交易,都要做到各參與者的記錄能夠吻合,沒有偏差。對賬系統(tǒng)的工作,是發(fā)現(xiàn)有差異的記錄,即軋帳;然后通過人工或者自動的方式,解決這些差異,即平帳。
對電商系統(tǒng)來說,每一筆交易,在所有相關(guān)主體側(cè)都要能對得上:
- 交易主體,如果發(fā)起人是個人,必須能夠從個人交易歷史記錄中找到這筆交易。但大部分人不會保留電子記錄,所以一般是提供可以下載的賬單或交易記錄,讓用戶自己對去。
- 交易對手,一般是商戶。商戶側(cè)對賬處理同用戶側(cè),也僅僅提供對賬單。
- 交易渠道側(cè),這是對賬的重點,一是核實交易流水,二是核實交易傭金,畢竟是租用人家通道做結(jié)算的。
那有哪些記錄需要對賬? 目前主要是兩個:一個是交易記錄;一個是退款記錄。 這里以交易記錄的處理為例,退款記錄可以類似處理。
一、對賬處理流程
一般來說,對賬流程涉及到如下步驟: 渠道對賬單下載、本地交易記錄準(zhǔn)備、軋賬、平賬。
1.1 渠道對賬單下載
銀行,第三方支付,銀聯(lián)等,基本都會提供對賬單下載的功能。不過也有少數(shù)工作做不到位或者太到位的銀行,只提供賬單查詢后臺,不提供對賬單下載功能。 對開發(fā)人員來說,這里有幾個坑:
- 對賬單格式不一。文本,XML,csv的都有。為了后續(xù)能夠統(tǒng)一處理,在賬單下載完成后,需要進(jìn)行標(biāo)準(zhǔn)化處理。
- 下載方式不一,HTTP,HTTPS,F(xiàn)TP的,都有。下載程序需要按照渠道的協(xié)議來處理。
- 下載時間不一,一般是凌晨1點后,到中午12才能用的也有。如果在預(yù)定的時間取不到數(shù)據(jù),需要注意重試讀取。
- 穩(wěn)定性差。FTP服務(wù)器出問題那是常有的事。渠道側(cè)解決方案往往就是重啟。所以重試機制是必要的。
看一下第三方支付的對賬單情況:
銀行直連的對賬情況
1.2 渠道對賬單標(biāo)準(zhǔn)化
找個例子大家看看, 比如微信的對賬單,他是csv格式的,包括如下信息:
- 交易時間:這是在微信側(cè)的支付完成的時間。 這個時間會成為一個陷阱。
- 公眾賬號ID,商戶號,子商戶號,設(shè)備號: 這些信息需要做驗證,確保是自己的單子,不要讓微信把老王家的單子也給發(fā)過來了;
- 微信訂單號,商戶訂單號: 這兩個是對單的核心。前者是微信側(cè)產(chǎn)生的訂單號,在微信支付接口返回值中有。但是萬一收不到這個返回值,那在本地記錄中可能就空了。 后者是我們發(fā)送給微信的訂單號,一般用這個來做對單依據(jù)。兩邊的數(shù)據(jù)中都會有這個值。
- 用戶標(biāo)識,交易類型,交易狀態(tài),付款銀行,貨幣種類,總金額,企業(yè)紅包金額: 這幾個就是對單的核心字段,必須確保雙方是一致的。
- 商品名稱,商戶數(shù)據(jù)包,手續(xù)費,費率:這些是可選驗證。
而某寶的對賬單,是文本格式的,用空格隔開。他們家的就簡單很多,只有商戶訂單號,交易流水號,交易時間,支付時間,付款方,交易金額,交易類型,交易狀態(tài)這些字段。
由于每個渠道的賬單格式都不盡相同, 在得到賬單后,下一步是對賬單做標(biāo)準(zhǔn)化處理,這樣軋帳以及后續(xù)工作就可以統(tǒng)一處理了。 標(biāo)準(zhǔn)化后的賬單數(shù)據(jù)可以放在文件系統(tǒng)或者數(shù)據(jù)庫中。這取決于交易數(shù)據(jù)量。每天百萬以上的量,還是使用文件系統(tǒng),比較合適。數(shù)據(jù)庫操作相對比較慢,也浪費資源。 基于文件系統(tǒng)的標(biāo)準(zhǔn)化涉及如下內(nèi)容:
文件格式標(biāo)準(zhǔn)化 統(tǒng)一使用csv或者json或者xml格式。如果是使用hadoop或者spark來對賬,使用csv是個不錯的選擇。
文件存儲統(tǒng)一化 文件目錄,文件名都需要遵循統(tǒng)一命名規(guī)范。
為了加快處理速度,我們使用hdfs作為文件系統(tǒng),有利于后續(xù)的對賬的處理。
1.3 本地交易記錄準(zhǔn)備
本地交易記錄的準(zhǔn)備,總的來說有如下方法:
- 啥都不做,直接用原始數(shù)據(jù)。鑒于大部分系統(tǒng)使用的是mysql,這也意味著在MySQL上做對賬。對賬時需要大量的數(shù)據(jù)查找工作,必然會影響線上業(yè)務(wù)。在數(shù)據(jù)規(guī)模較大,比如超過100萬時,就不太合適了。
- 當(dāng)然,還有一個選擇是使用備庫來執(zhí)行對賬,這樣既簡單,也不影響線上業(yè)務(wù)。這是典型的空間換時間的做法。
- 如果業(yè)務(wù)大到需要分表分庫才能處理,那對賬數(shù)據(jù)準(zhǔn)備也不一樣。使用分庫也不現(xiàn)實,因為分庫一般是按照主體id,而不是渠道id,來分庫,這樣對賬就需要在多個庫上進(jìn)行,效率反而降低了。而對分表分庫建立從庫也非常耗費資源。這種情況下,需要同步一份數(shù)據(jù)到(hdfs)文件系統(tǒng)中,或者NOSQL數(shù)據(jù)庫上。
由于交易記錄是支付系統(tǒng)核心數(shù)據(jù),有大量的應(yīng)用,如信用、風(fēng)控等,都需要交易記錄數(shù)據(jù)。這些應(yīng)用對交易記錄的需求還不完全一致,為了提升性能, 交易記錄會使用異步的方式來將數(shù)據(jù)投遞給使用方。 交易記錄在入庫時,投遞消息到消息系統(tǒng)中。使用方監(jiān)聽這個消息,一旦收到新消息,則從交易記錄庫中查詢數(shù)據(jù),獲取數(shù)據(jù)并更新到庫中。關(guān)于此類數(shù)據(jù)同步的文章不少,這里就不詳細(xì)介紹。
1.4 軋帳
軋帳是按照客戶訂單號來比較本地交易記錄和渠道交易記錄是否一致。從算法角度,是計算兩個數(shù)組的差異。在單機運行時,可以采用的算法不少,這里不詳細(xì)介紹。 我們推薦采用mapreduce來軋帳,這有個優(yōu)勢,可以按照訂單號將渠道提供的記錄和本地記錄shuffle到同一個reduce處理上,這樣就可以很容易進(jìn)行數(shù)據(jù)比對。 軋帳中***的坑,莫過于切分點的問題。比如以整0點為切分點,那存在一個問題,本地23:59發(fā)起的交易,到了渠道側(cè),可能會在00:01處理,這一筆交易變成第二天的帳了。實際處理中,一筆交易在渠道側(cè)處理,花上幾分鐘都有可能。 對于切分點附近無法確認(rèn)的帳,做一個時間窗,在時間窗內(nèi)的數(shù)據(jù),留待第二天對賬時繼續(xù)處理。
1.5 平帳
發(fā)現(xiàn)兩邊不一致的數(shù)據(jù),那應(yīng)該如何處理?數(shù)據(jù)量不大時,記錄起來,人工甄別就行。但如果數(shù)據(jù)量很大,每天上千條,人工處理就成本太高了。這個沒有統(tǒng)一的處理方法,需要根據(jù)有問題的數(shù)據(jù),做個分析,然后做自動處理。 針對交易記錄的對賬的處理,主要有如下情況:
- 長款: 本地未支付,支付渠道已支付。這主要是本地未正確接收到渠道下發(fā)的異步通知導(dǎo)致。 一般處理是將本地狀態(tài)修改為已支付,并做響應(yīng)的后續(xù)處理,比如通知業(yè)務(wù)方等。
- 短款:本地已支付,但是支付渠道中無記錄;或者本地?zé)o記錄,支付渠道有記錄。在排除跨日因素外,這種情況非常少見,需要了解具體原因后做處理。
- 金額不一致: 本地已支付,支付渠道已支付,但是金額不同,這個需要人工核查。
針對退款的對賬處理,主要有如下情況:
- 本地未退款,支付渠道已退款,則以支付渠道為準(zhǔn),修改本地為已退款狀態(tài),并出發(fā)后續(xù)處理。
- 本地已退款、支付渠道已退款,但是金額不同,需要人工核查;
- 本地已退款,但是支付渠道無記錄;或者支付渠道有記錄,但是本地沒有。 在排除跨日因素外, 這種情況非常少見,需要了解具體原因后做處理。
二、對賬架構(gòu)
基于微服務(wù)的對賬系統(tǒng)實現(xiàn)的一個參考架構(gòu)如下:
2.1 對賬單下載
對賬單下載組件每天定時觸發(fā),從支付通道服務(wù)器上下載對賬單。 目前主要有HTTP(S)和FTP兩種對賬單下載方式。 技術(shù)選型上,HTTP(S)用apache httpclient即可實現(xiàn)鏈接池和斷點續(xù)傳, FTP也可以使用Apache Commons Net API。 不管是哪一個,都需要設(shè)置重試次數(shù)和鏈接超時間。重試次數(shù)和間隔的設(shè)置需要小心,重試太頻繁,容易把服務(wù)器打死.;時間間隔太大,又會阻塞后續(xù)處理步驟。5~10分鐘是一個合適的重試間隔區(qū)間。鏈接超時指在服務(wù)器出現(xiàn)問題時,連接在指定時間內(nèi)獲取不到數(shù)據(jù)即自動斷開。這個很容易被忽略。我們有一次系統(tǒng)出問題,是渠道側(cè)的FTP假死后重啟,導(dǎo)致我們的客戶端掛住,一直在等待重新鏈接。此外,注意,有些對賬單下載是支持分頁下載的。
2.2 對賬單轉(zhuǎn)換
將對賬單轉(zhuǎn)換為標(biāo)準(zhǔn)格式的賬單,為對賬Mapreduce任務(wù)執(zhí)行提供支持。每個渠道的對賬單格式不一,需要分別開發(fā)轉(zhuǎn)換程序。 轉(zhuǎn)換程序主要就兩個操作: 解析源文件、轉(zhuǎn)換成標(biāo)準(zhǔn)格式并輸出。
2.3 軋賬MR
如上所述,軋賬MapReduce程序在Hadoop上運行,以交易號為Key,核對渠道訂單和本地交易記錄之間的差異,輸出差異記錄。***將差異記錄導(dǎo)入到差異表中。
總之,對賬工作,即復(fù)雜也不復(fù)雜。需要細(xì)心,對業(yè)務(wù)要有深入的了解,并選擇合適的架構(gòu)。
【本文為51CTO專欄作者“鳳凰牌老熊”的原創(chuàng)稿件,轉(zhuǎn)載請通過微信公眾號“鳳凰牌老熊”聯(lián)系作者本人】