高效整數(shù)規(guī)劃求解,快手提出多元因果森林模型,智能營銷效果顯著
在智能營銷場(chǎng)景下,比如美團(tuán)的滿減優(yōu)惠券,淘寶的購物紅包等,需要形成系統(tǒng)化的營銷決策。基于此類場(chǎng)景,快手為了實(shí)施更細(xì)粒度的營銷決策,提出了一種新的多元因果森林模型。基于快手億級(jí)別的用戶量,快手社區(qū)科學(xué)部設(shè)計(jì)了資源分配并行算法,高效產(chǎn)出智能營銷決策。為了解決多元因果模型的評(píng)估問題,該研究利用隨機(jī)匹配的思想,提供了一個(gè)供業(yè)界參考的方法。最后,通過線下仿真實(shí)驗(yàn)和線上真實(shí) A/B 實(shí)驗(yàn),驗(yàn)證了 LBCF 算法的有效性,該技術(shù)已經(jīng)申請(qǐng)中國發(fā)明專利,并在快手智能營銷業(yè)務(wù)中獲得廣泛應(yīng)用。
異質(zhì)性因果效應(yīng) (HTE) 是因果推斷理論需要解決的核心問題,其概念最初來源于醫(yī)療領(lǐng)域。HTE 是指對(duì)于同一種干預(yù)手段,對(duì)不同受眾的影響因人而異,在計(jì)算廣告、個(gè)性化治療、個(gè)性化教育以及公共政策等領(lǐng)域都有廣泛的應(yīng)用。為理解其概念,舉個(gè)智能營銷領(lǐng)域的例子,對(duì)于同一補(bǔ)貼力度的營銷手段,某些受眾會(huì)立即轉(zhuǎn)化,而某些受眾可能根本不會(huì)轉(zhuǎn)化,如何準(zhǔn)確區(qū)分出這些受眾便是 HTE 需要解決的問題。近年來,學(xué)術(shù)界不斷涌現(xiàn)新的 HTE 方法,其中斯坦福大學(xué)經(jīng)濟(jì)學(xué)教授 Susan Athey 等人提出的因果森林模型【1】因其良好的可解釋性和出色的效果在業(yè)界獲得逐步認(rèn)可。
- 論文鏈接:https://arxiv.org/abs/2201.12585
- 論文代碼:https://github.com/www2022paper/WWW-2022-PAPER-SUPPLEMENTARY-MATERIALS
大規(guī)模智能營銷算法
多元因果森林模型
智能營銷要研究的核心問題是,用戶對(duì)不同補(bǔ)貼額度的轉(zhuǎn)化效果差異有多大?這些不同的補(bǔ)貼額度可以被看作是因果推斷中的 treatments,所以場(chǎng)景驅(qū)使研究者去研究用戶在不同 treatments 下的轉(zhuǎn)化效果,即需要多元因果模型。以樹為基礎(chǔ)的模型具有良好的解釋性并且在機(jī)器學(xué)習(xí)中展現(xiàn)了很好的效果,在本文中,該研究主要考慮以樹模型為基礎(chǔ)的 HTE 預(yù)估方法。該方法可以應(yīng)用于任何需要預(yù)估 HTE 的領(lǐng)域,本文僅以智能營銷場(chǎng)景為例進(jìn)行闡釋。
本文提出的多元因果森林模型,模型結(jié)構(gòu)如圖 2(示意的例子),該模型結(jié)構(gòu)有兩個(gè)優(yōu)點(diǎn):第一,單一一個(gè)模型能夠同時(shí)處理任意種干預(yù)手段,否則,幾種干預(yù)手段就需要維護(hù)相應(yīng)數(shù)量的二元因果森林模型;第二,HTE 的定義要求各干預(yù)手段對(duì)應(yīng)一致的特征子空間,該模型結(jié)構(gòu)保證了這一點(diǎn),這對(duì)準(zhǔn)確估計(jì) HTE 至關(guān)重要。
圖 2 多元因果森林模型 (注:圖 2 中的 Age,Inc. 等數(shù)據(jù)僅為了示意說明)
為此,該研究重新設(shè)計(jì)了因果森林的分裂準(zhǔn)則,在每一次對(duì)樹節(jié)點(diǎn)進(jìn)行分裂時(shí),不但強(qiáng)調(diào)不同節(jié)點(diǎn)間的異質(zhì)性,即節(jié)點(diǎn)間分裂(Inter Split),同時(shí)也強(qiáng)調(diào)節(jié)點(diǎn)內(nèi)不同干預(yù)手段的異質(zhì)性,即節(jié)點(diǎn)內(nèi)分裂(Intra Split)。從計(jì)算復(fù)雜度來說,在尋找一個(gè)樹節(jié)點(diǎn)的特征分裂點(diǎn)時(shí),Inter Split 可以快速一次性預(yù)先計(jì)算出分裂所需數(shù)據(jù),而 Intra Split 依賴于樹節(jié)點(diǎn)間分裂的結(jié)果,因此 Intra Split 每次都需要重新計(jì)算分裂數(shù)據(jù),極其低效。為了平衡算法的效率和效果,該研究采用了兩步走的分裂算法:
- 第一步通過 Inter Split 選擇 top N 個(gè)備選特征分裂點(diǎn);
- 第二步通過 Intra Split 從 N 個(gè)備選中選擇一個(gè)最終的特征分裂點(diǎn)。
資源分配并行算法
解決了用戶彈性的預(yù)估問題之后,在智能營銷領(lǐng)域輸出營銷決策時(shí),我們經(jīng)常需要去回答,在有限的資源約束下如何去實(shí)現(xiàn)最優(yōu)分配。為此,該研究把智能營銷中的資源分配問題建模成了有約束的整數(shù)規(guī)劃數(shù)學(xué)模型,如圖 3。但是,快手億級(jí)別的用戶量導(dǎo)致決策變量數(shù)目巨大,很多目前開源的求解器不能滿足性能的需求,會(huì)存在內(nèi)存溢出等問題。
圖 3 整數(shù)規(guī)劃數(shù)學(xué)模型
為此,該研究設(shè)計(jì)了可并行的 Dual Gradient Bisection(DGB)算法,如圖 4。該算法在不損失解質(zhì)量的情況下,實(shí)現(xiàn)了億級(jí)用戶量的分鐘級(jí)求解。限于篇幅,這里簡(jiǎn)單描述下求解思路,詳細(xì)的可以參閱論文和附錄 code。
- 第一步,利用線性松弛技術(shù),把圖 3 的整數(shù)規(guī)劃數(shù)學(xué)模型簡(jiǎn)化成易于求解的線性規(guī)劃問題,可以證明松弛后的線性規(guī)劃問題的解集至多只在預(yù)算臨界處有一個(gè)非整數(shù)解。
- 第二步,通過拉格朗日乘子把有約束問題轉(zhuǎn)化為無約束問題。
- 第三步, 由于該問題滿足強(qiáng)對(duì)偶條件,研究者對(duì)該問題進(jìn)行對(duì)偶轉(zhuǎn)化,由此得到了一個(gè)關(guān)于拉格朗日乘子的單變量分段函數(shù),并且可以證明該分段函數(shù)為閉區(qū)間上的凸函數(shù)。
- 第四步,通過圖 4 的 DGB 算法,研究者可以在并行系統(tǒng)上高效求出。
- 第五步,代回對(duì)偶問題,便可依次求解出所有決策變量的值。
圖 4 可并行的 DGB 算法
多元因果模型評(píng)估
因?yàn)闊o法觀測(cè)到因果模型的反事實(shí)結(jié)果(Counterfactual Outcome),因此,如何評(píng)估因果模型的線下效果成了業(yè)界亟待解決的問題,常用的評(píng)估方法有 AUUC/Qini Curve 等,但這些更適合評(píng)估二元因果模型;對(duì)于多元因果模型的預(yù)估結(jié)果,也只能是先把多元結(jié)果拆解成許多二元結(jié)果,之后再進(jìn)行分別評(píng)估。
本文利用隨機(jī)控制實(shí)驗(yàn) (RCT) 數(shù)據(jù),基于 Treatment Matching 的思想,提供了整體收益對(duì)比的方法。核心方法是:在 RCT 數(shù)據(jù)中找出 Policy Treatment 和 RCT Treatment 匹配的那些樣本,需要指出的是,對(duì)于這些匹配樣本,我們是可以觀測(cè)到其真實(shí)結(jié)果的。其次,可以證明這些匹配樣本的均值是其各列期望的好的估計(jì)。最后,利用各列的期望值,我們可以計(jì)算出多元因果模型的整體收益,收益越高,模型越好。
效果展示
為了公平的對(duì)比算法效果,首先,該研究利用 Ye Tu 等人在 WWW 2021 公開的仿真數(shù)據(jù)集【2】,與業(yè)界主流的以樹為基礎(chǔ)的因果模型進(jìn)行了線下對(duì)比,如圖 5,橫軸是數(shù)據(jù)集噪聲的強(qiáng)弱,縱軸是研究者關(guān)注的核心指標(biāo)的收益,可以看出,LBCF 效果最好,CT.ST 和 CF.DT 次之。
圖 5 線下仿真實(shí)驗(yàn)
進(jìn)一步,該研究在快手的真實(shí)智能營銷場(chǎng)景下部署了 LBCF 算法,進(jìn)行了兩周的 A/B 實(shí)驗(yàn),如圖 6,結(jié)果也證明了該算法的有效性,與 CT.ST 和 CF.DT 算法相比,收益分別提高了 0.92 和 2.48 個(gè)百分點(diǎn)。
圖 6 線上 A/B 實(shí)驗(yàn)
總結(jié)
在本文中,快手的研究者們提出了一種新的 HTE 預(yù)估方法——多元因果森林模型,并且結(jié)合高效的整數(shù)規(guī)劃求解算法,效果顯著優(yōu)于業(yè)界常用的幾種樹模型方法。同時(shí),對(duì)于業(yè)界棘手的因果效應(yīng)離線評(píng)估問題,研究者們也創(chuàng)新地給出了一個(gè)可行的解決方案。研究者們希望本文的工作能夠引起機(jī)器學(xué)習(xí)愛好者們的關(guān)注,以更廣泛地應(yīng)用因果推斷技術(shù)在各自的實(shí)際業(yè)務(wù)中。