自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

京東到家訂單派發(fā)的技術(shù)實戰(zhàn)

開發(fā) 開發(fā)工具 前端
本文將描述訂單派發(fā)系統(tǒng)從無到有的系統(tǒng)演進以及方案設計與關(guān)鍵要點,為大家在解決相關(guān)業(yè)務場景上提供一個案例參考。

達達-京東到家作為優(yōu)秀的即時配送物流平臺,實現(xiàn)了多渠道的訂單配送,包括外賣平臺的餐飲訂單、新零售的生鮮訂單、知名商戶的優(yōu)質(zhì)訂單等。為了提升平臺的用戶粘性,我們需要兼顧商戶和騎士的各自愿景:商戶希望訂單能夠準時送達,騎士希望可以高效搶單。那么在合適的時候提升訂單定制化的曝光率,是及時送物流平臺的核心競爭力之一。

本文將描述訂單派發(fā)系統(tǒng)從無到有的系統(tǒng)演進以及方案設計與關(guān)鍵要點,為大家在解決相關(guān)業(yè)務場景上提供一個案例參考。

訂單派發(fā)架構(gòu)演進

在公司發(fā)展的初期,我們的外賣訂單從商戶發(fā)單之后直接出現(xiàn)在搶單池中,3公里之內(nèi)的騎士能夠看到訂單,并且從訂單卡片中獲取配送地址、配送時效等關(guān)鍵信息。這種暴力的顯示模式,很容易造成騎士挑選有利于自身的訂單進行配送,從而導致部分訂單超時未被配送。這樣的模式,在一定程度上導致了商戶的流失,同時也浪費了騎士的配送時間。

從上面的場景可以看出來,我們系統(tǒng)中缺少一個訂單核心調(diào)度者。有一種方案是選擇區(qū)域訂單的訂單調(diào)度員,由調(diào)度員根據(jù)騎士的接單情況、配送時間、訂單擠壓等實時情況來進行訂單調(diào)度。這種模式,看似可行,但是人力成本投入太高,且比較依賴個人的經(jīng)驗總結(jié)。

核心問題已經(jīng)出來了:個人的經(jīng)驗總結(jié)會是什么呢?

  • 騎士正在配送的訂單的數(shù)量,是否已經(jīng)飽和
  • 騎士的配送習慣是什么
  • 某一階段的訂單是否順路,騎士是否可以一起配送
  • 騎士到店駐留時間的預估
  •  ...

理清核心問題的答案,我們的系統(tǒng)派單便成為了可能?;谝陨系脑恚唵闻砂l(fā)模式就可以逐漸從搶單池的訂單顯示演變成系統(tǒng)派單。

我們將會記錄商戶發(fā)單行為、騎士配送日志及運行軌跡等信息,并且經(jīng)過數(shù)據(jù)挖掘和數(shù)據(jù)分析,獲取騎士的畫像、騎士配送時間的預估、騎士到店駐留時間的預估等基礎信息;使用遺傳算法規(guī)劃出最優(yōu)的配送路徑...經(jīng)過上述一系列算法,我們將在騎士池中匹配出最合適的騎士,進而使用長連接(Netty)不間斷的通知到騎士。

隨著達達業(yè)務的不斷迭代,訂單配送逐漸孵化出基于大商戶的駐店模式:基于商戶維護一批固定的專屬騎士,訂單只會在運力不足的時候才會外發(fā)到搶單池中,正常情況使用派單模式通知騎士。

訂單派發(fā)模型

訂單派發(fā)可以淺顯的認為是一種信息流的推薦。在訂單進入搶單池之前,我們會根據(jù)每個城市的調(diào)度情況,先進行輪詢N次的派單。大概的表現(xiàn)形式如下圖:

舉例有筆訂單需要進行推送,在推送過程中,我們暫且假設一直沒有騎士接單,那么這筆訂單會每間隔N秒便會進行一次普通推薦,然后進入搶單池。

從訂單派發(fā)的流程周期上可以看出來,派發(fā)模型充斥著大量的延遲任務,只要能解決訂單在什么時候可以進行派發(fā),那么整個系統(tǒng) 50% 的功能點就能迎刃而解。

我們先了解一下經(jīng)典的延遲方案:

1. 數(shù)據(jù)庫輪詢

通過一個線程定時的掃描數(shù)據(jù)庫,獲取到需要派單的訂單信息

  • 優(yōu)點:開發(fā)簡單,結(jié)合quartz即可以滿足分布式掃描
  • 缺點:對數(shù)據(jù)庫服務器壓力大,不利于項目后續(xù)發(fā)展

2. JDK的延遲隊列 - DelayQueue

DelayQueue是Delayed元素的一個無界阻塞隊列,只有在延遲期滿時才能從中提取元素。隊列中對象的順序按到期時間進行排序。

  • 優(yōu)點:開發(fā)簡單,效率高,任務觸發(fā)時間延遲低
  • 缺點:服務器重啟后,數(shù)據(jù)會丟失,要滿足高可用場景,需要hook線程二次開發(fā);宕機的擔憂;如果數(shù)據(jù)量暴增,也會引起OOM的情況產(chǎn)生

3. 時間輪 - TimingWheel

時間輪的結(jié)構(gòu)原理很簡單,它是一個存儲定時任務的環(huán)形隊列,底層是由數(shù)組實現(xiàn),而數(shù)組中的每個元素都可以存放一個定時任務列表,列表中的每一項都表示一個事件操作單元,當時間指針指向?qū)臅r間格的時候,該列表中的所有任務都會被執(zhí)行。 時間輪由多個時間格組成,每個時間格代表著當前實踐論的跨度,用tickMs代表;時間輪的個數(shù)是固定的,用wheelSize代表;整個時間輪的跨度用interval代表,那么指針轉(zhuǎn)了一圈的時間為:

  1. interval = tickMs * wheelSize 

如果tickMs=1ms,wheelSize=20,那么便能計算出此時的時間是以20ms為一轉(zhuǎn)動周期,時間指針(currentTime)指向wheelSize=0的數(shù)據(jù)槽,此時有5ms延遲的任務插入了wheelSize=5的時間格,隨著時間的不斷推移,指針currentTime不斷向前推進,過了5ms之后,當?shù)竭_時間格5時,就需要將時間格5所對應的任務做相應的到期操作。

如果此時有個定時為180ms的任務該如何處理?很直觀的思路是直接擴充wheelSize?這樣會導致wheelSize的擴充會隨著業(yè)務的發(fā)展而不斷擴張,這樣會使時間輪占用很大的內(nèi)存空間,導致效率低下,因此便衍生出了層級時間輪的數(shù)據(jù)結(jié)構(gòu)。

180ms的任務會升級到第二層時間輪中,最終被插入到第二層時間輪中時間格#8所對應的TimerTaskList中。如果此時又有一個定時為600ms的任務,那么顯然第二層時間輪也無法滿足條件,所以又升級到第三層時間輪中,最終被插入到第三層時間輪中時間格#1的TimerTaskList中。注意到在到期時間在[400ms,800ms)區(qū)間的多個任務(比如446ms、455ms以及473ms的定時任務)都會被放入到第三層時間輪的時間格#1中,時間格#1對應的TimerTaskList的超時時間為400ms。

隨著時間輪的轉(zhuǎn)動,當TimerTaskList到期時,原本定時為450ms的任務還剩下50ms的時間,還不能執(zhí)行這個任務的到期操作。便會有個時間輪降級的操作,會將這個剩余時間50ms的定時任務重新提交到下一層級的時間輪中,所以該任務被放到第二層時間輪到期時間為 [40ms,60ms) 的時間格中。再經(jīng)歷了40ms之后,此時這個任務又被觸發(fā)到,不過還剩余10ms,還是不能立即執(zhí)行到期操作。所以還要再一次的降級,此任務會被添加到第一層時間輪到期時間為[10ms,11ms)的時間格中,之后再經(jīng)歷10ms后,此任務真正到期,最終執(zhí)行相應的到期操作。

  • 優(yōu)點:效率高,可靠性高(Netty,Kafka,Akka均有使用),便于開發(fā)
  • 缺點:數(shù)據(jù)存儲在內(nèi)存中,需要自己實現(xiàn)持久化的方案來實現(xiàn)高可用

訂單派發(fā)實現(xiàn)方案

結(jié)合了上述的三種方案,最后決定使用redis作為數(shù)據(jù)存儲,使用timingWhell作為時間的推動者。這樣便可以將定時任務的存儲和時間推動進行解耦,依賴Redis的AOF機制,也不用過于擔心訂單數(shù)據(jù)的丟失。

kafka中為了處理成千上萬的延時任務選擇了多層時間輪的設計,我們從業(yè)務角度和開發(fā)難度上做了取舍,只選擇設計單層的時間輪便可以滿足需求。

1. 時間格和緩存的映射維護

假設當前時間currentTime為11:49:50,訂單派發(fā)時間dispatchTime為11:49:57,那么時間輪的時間格#7中會設置一個哨兵節(jié)點(作為是否有數(shù)據(jù)存儲在redis的依據(jù) )用來表示該時間段是否會時間事件觸發(fā),同時會將這份數(shù)據(jù)放入到緩存中(key=dispatchTime+ip), 當7秒過后,觸發(fā)了該時間段的數(shù)據(jù),便會從redis中獲取數(shù)據(jù),異步執(zhí)行相應的業(yè)務邏輯。最后,防止由于重啟等一些操作導致數(shù)據(jù)的丟失,哨兵節(jié)點的維護也會在緩存中維護一份數(shù)據(jù),在重啟的時候重新讀取

2. 緩存的key統(tǒng)一加上IP標識

由于我們的時間調(diào)度器是依附于自身系統(tǒng)的,通過將緩存的key統(tǒng)一加上IP的標識,這樣就可以保證各臺服務器消費屬于自身的數(shù)據(jù),從而防止分布式環(huán)境下的并發(fā)問題,也可以減輕遍歷整個列表帶來的時間損耗(時間復雜度為O(N))

3. 使用異步線程處理時間格中對應的數(shù)據(jù)

使用異步線程,是考慮到如果上一個節(jié)點發(fā)生異常或者超時等情況,會延誤下一秒的操作,如果使用異常可以改善調(diào)度的即時性問題。

我們在設計系統(tǒng)的時候,系統(tǒng)的完善度和業(yè)務的滿足度是互相關(guān)聯(lián)影響的,單從上述的設計看,是會有些問題的,比如使用IP作為緩存的key,如果集群發(fā)生變更便會導致數(shù)據(jù)不會被消費;使用線程池異步處理也有概率導致數(shù)據(jù)不會被消費。這些不會被消費的數(shù)據(jù)會進入到搶單池中。從派單場景的需求來看,這些場景是可以被接受的,當然了,我們系統(tǒng)會有腳本來進行定期的篩選,將那些進入搶單池的訂單進行再次派單。

為什么不使用ScheduledThreadPoolExecutor來定時輪詢redis? 即便這樣可以完成業(yè)務上的需求,獲取定時觸發(fā)的任務,但是帶來的空查詢不但會拉高服務的CPU,redis的QPS也會被拉高,可能會導致redis的慢查詢會顯著增多。

結(jié)語

我們在完成一個功能的時候,往往需要一些可視化的數(shù)據(jù)來確定業(yè)務發(fā)展的正確性。因此我們在開發(fā)的時候,也相應的記錄了一些訂單與騎士的交互動作。從每天的報表數(shù)據(jù)可以看出來,90% 以上的訂單是通過派單發(fā)出并且被騎士認可接單。

訂單派發(fā)的模式是提升訂單曝光率有效的技術(shù)手段,我們一直結(jié)合大數(shù)據(jù)、人工智能等技術(shù)手段希望能更好的做好訂單派發(fā),能提供更加多元化的功能,將達達打造成更加一流的配送平臺。

作者:季炳坤,任職Java工程師,負責訂單派發(fā),訂單權(quán)限,合并訂單等相關(guān)工作。

【本文來自51CTO專欄作者張開濤的微信公眾號(開濤的博客),公眾號id: kaitao-1234567】

戳這里,看該作者更多好文

責任編輯:趙寧寧 來源: 51CTO專欄
相關(guān)推薦

2019-08-30 12:30:25

京東到家訂單查詢數(shù)據(jù)存儲

2018-12-20 06:04:02

京東到家訂單中心Elasticsear

2019-01-17 09:50:55

京東ES架構(gòu)

2018-04-20 09:36:23

NettyWebSocket京東

2017-12-12 08:40:00

2019-01-02 14:55:54

MySQLES數(shù)據(jù)庫

2019-01-14 09:06:40

LBS定位系統(tǒng)架構(gòu)

2022-02-12 20:51:23

京東程序員代碼

2021-03-18 14:34:34

達達集團京東云電商

2014-11-28 13:53:28

2022-02-14 08:13:33

刪庫MySQL備份

2019-11-01 15:50:06

MySQLES搜索引擎

2020-05-12 11:25:50

MySQLES數(shù)據(jù)庫

2015-07-17 07:47:51

京東618訂

2022-02-11 15:01:07

程序員刪庫計算機

2025-01-02 09:02:09

Go項目Token

2015-12-02 11:30:37

京東搜索京東推薦

2021-07-27 22:42:20

人工智能無人機快遞

2017-07-06 00:27:17

虛擬訂單中心京東數(shù)據(jù)

2016-06-15 14:38:52

京東
點贊
收藏

51CTO技術(shù)棧公眾號