基于概率隱層模型的購(gòu)物搭配推送:阿里巴巴提出新型用戶偏好預(yù)測(cè)模型
論文鏈接:https://arxiv.org/abs/1707.08113
這篇文章中,阿里研究者們對(duì)電商領(lǐng)域營(yíng)銷推送場(chǎng)景進(jìn)行了點(diǎn)擊率的優(yōu)化。營(yíng)銷推送場(chǎng)景和傳統(tǒng)電商推薦場(chǎng)景有很多類似的地方,但也有所不同。首先,營(yíng)銷推送的點(diǎn)擊率受文案影響很大,和用戶直接相關(guān)的文案的點(diǎn)擊率會(huì)明顯高于通用的推送文案;其次,每次營(yíng)銷推送只有一個(gè)展示坑位,因?yàn)閷?duì)推送商品的準(zhǔn)確度要求更高。
為解決***個(gè)問(wèn)題,我們進(jìn)行「購(gòu)物搭配」場(chǎng)景的推薦。購(gòu)物搭配場(chǎng)景推送一個(gè)和用戶已購(gòu)買商品的搭配商品,比如當(dāng)用戶買了高級(jí)茶壺后對(duì)上好茶葉進(jìn)行推送(下圖第二個(gè)推送信息)。購(gòu)物搭配的好處是文案中可以透出用戶已購(gòu)商品,消息可以和用戶建立強(qiáng)烈的 attachment,提升消息打開率。
為尋找搭配商品對(duì),我們定義如下兩個(gè)指標(biāo):
1)同時(shí)購(gòu)買分?jǐn)?shù)(Co-Purchase Graph)
2) 看了又買分?jǐn)?shù)(View-and-then-Purchase Graph)
***個(gè)指標(biāo)衡量了兩個(gè)商品之間的互補(bǔ)性(complementarity),第二個(gè)指標(biāo)衡量了兩個(gè)商品的替代性(substitutivity)。購(gòu)物搭配場(chǎng)景下,我們希望尋找高互補(bǔ)性、低替代性的商品對(duì)進(jìn)行推薦。因此,我們把商品對(duì)「搭配性」的得分定義為:
這個(gè)分?jǐn)?shù)是我們推薦模型中的一個(gè)重要特征。
為了解決推薦準(zhǔn)確性的問(wèn)題。我們對(duì)用戶分層進(jìn)行更細(xì)致的刻畫。我們的主要思想是基于用戶行為對(duì)用戶的向量表示(Embeddings)進(jìn)行學(xué)習(xí),然后我們用這些向量表示對(duì)用戶的行為進(jìn)行預(yù)測(cè)。向量表示可以理解為對(duì)用戶在高維度的一個(gè)量化的抽象表示。
向量表示的好處是可以更精準(zhǔn),更靈活的對(duì)目標(biāo)進(jìn)行表達(dá)。舉個(gè)例子,我們對(duì)用戶的描述不僅僅局限于年齡、消費(fèi)能力等人可以 Intuitively 容易想到的維度,人工智能可以自動(dòng)從消費(fèi)者數(shù)據(jù)中學(xué)習(xí)到更全面更抽象的維度,比如用戶對(duì)推薦平臺(tái)的依賴程度,用戶對(duì)選擇商品的創(chuàng)新性等。
用戶向量的學(xué)習(xí)我們采用的是概率隱層模型(Probabilistic Latent Class Modeling)。首先我們定義用戶點(diǎn)擊模型如下:
這個(gè)模型分為兩層,***層是隱層用來(lái)刻畫用戶在高維度下的分層,采用多維邏輯回歸分類的形式。
第二層是點(diǎn)擊率預(yù)測(cè)模型。我們這里選擇了一個(gè)二維邏輯回歸模型。不過(guò)可以很容易的擴(kuò)展使用深度神經(jīng)網(wǎng)絡(luò)。
我們要在已知用戶特征和點(diǎn)擊數(shù)據(jù)的條件下估計(jì)模型參數(shù)。我們采用經(jīng)典的 EM(Expectation-Maximization)算法。
EM 算法需要先求解 Q 函數(shù):
為優(yōu)化 Q 函數(shù)我們對(duì)參數(shù)進(jìn)行迭代優(yōu)化如下:
上面兩個(gè)更新很容易通過(guò) Gradient Decent 方法求解。
下圖是我們對(duì)求解模型的一個(gè)解釋。我們發(fā)現(xiàn)高活躍用戶更加看中自己的傾向,預(yù)測(cè)模型的權(quán)重在用戶偏好類的特征中高(high model weights on user preference features);低活躍用戶更加依賴于平臺(tái)的推薦,更喜歡平臺(tái)選擇的搭配性好的商品,預(yù)測(cè)模型權(quán)重在商品搭配性的特征權(quán)重高 (high model weights on )。這可以直觀的理解為深度用戶在選擇商品上更有自己主見,而新手更依賴于平臺(tái)。
目前該工作在線上取得了不錯(cuò)的效果,購(gòu)物搭配的推送推薦場(chǎng)景上看到~50% 點(diǎn)擊率的提升。
更廣義地來(lái)講,這項(xiàng)技術(shù)給行業(yè)帶來(lái)的好處的是可以更精準(zhǔn)和全面的刻畫用戶,進(jìn)一步推廣可以用來(lái)描述商品、資訊、視頻等其他目標(biāo)。該技術(shù)可以幫助使我們的營(yíng)銷推薦更友好(了解用戶),同時(shí)從商業(yè)上提高轉(zhuǎn)化率(高點(diǎn)擊率)。