自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

怎么做精準(zhǔn)投放與轉(zhuǎn)化?阿里多渠道序列化投放技術(shù)揭秘

人工智能 算法
在移動(dòng)互聯(lián)網(wǎng)和科技快速發(fā)展的今天,消費(fèi)者決策鏈路不再是線性的,也不僅僅是動(dòng)態(tài)的,影響決策行為的新營銷觸點(diǎn)隨時(shí)可能發(fā)生。而數(shù)據(jù)技術(shù)能夠做到智能化地處理這種無序和離散,阿里健康的多渠道序列化投放,通過算法技術(shù)對投放渠道和素材創(chuàng)意進(jìn)行序列化人群觸達(dá),可以擴(kuò)大 TA(目標(biāo)受眾)覆蓋率、提升廣告投放轉(zhuǎn)化率。

一、阿里健康用戶算法業(yè)務(wù)簡介

圖片

首先,阿里健康的用戶算法其實(shí)是圍繞整個(gè)天貓行業(yè)的數(shù)據(jù)資產(chǎn)。

商家,會(huì)分成兩部分,一部分是自營的藥房,比如阿里健康大藥房、海外店、品牌旗艦店,等等。當(dāng)我們平臺(tái)的商家,帶著某些訴求來到平臺(tái),比如說,想提升產(chǎn)品的一些指標(biāo),例如商品類目的 GMV,或者是提升 ROI 等。首先,平臺(tái)會(huì)向商家提供人群策略上的能力,也就是根據(jù)目標(biāo)以及目標(biāo)運(yùn)營商品,提供定向人群的能力。人群產(chǎn)生后,下一步就是商家如何去做營銷投放。這里會(huì)遇到一個(gè)問題,淘內(nèi)外有那么多營銷渠道,比如短信、push 推送、包括站內(nèi)的廣告。在站外,還會(huì)有一些字節(jié)系的比如抖音、知乎等站外廣告。那么商家在面對這么多不同的投放渠道時(shí),會(huì)遇到這些人群怎么去投放才能最高效、渠道間怎么合作等等一系列的問題。

在這里,我們會(huì)有一些渠道上的策略,人群策略 + 渠道策略,幫助我們的商家去做人群的投放。當(dāng)流量來到我們站內(nèi)以后,我們會(huì)根據(jù)用戶數(shù)據(jù)去做一些差異化引導(dǎo),比如商品推薦、入會(huì)引導(dǎo)、權(quán)益的個(gè)性化等等。通過這些,我們獲取了用戶在我們站內(nèi)的一些行為數(shù)據(jù),同時(shí)這部分?jǐn)?shù)據(jù)會(huì)回流到平臺(tái)的行業(yè)數(shù)據(jù)用戶資產(chǎn)中。這些數(shù)據(jù)會(huì)進(jìn)一步提煉出用戶標(biāo)簽、去支持我們后續(xù)人群策略的迭代。

針對阿里健康用戶算法,序列化投放,重點(diǎn)解決用戶運(yùn)營全圖中渠道策略的部分,提供渠道組合、序列觸達(dá)、預(yù)算/出價(jià)能力以及頻次控制等能力。

圖片

序列化投放主要解決以下兩大問題:

(1)首先,行業(yè)商家面對多種多樣的淘內(nèi)外投放產(chǎn)品,缺乏一個(gè)全局化的抓手,不知道如何投放整體效率最高。

(2)另外,對于行業(yè)平臺(tái)來說,如果各個(gè)營銷渠道都是以自己的目標(biāo)為先,各自為戰(zhàn)。在短期的目標(biāo)下,每個(gè)渠道獨(dú)有的、可以相互協(xié)作的用戶運(yùn)營價(jià)值會(huì)被商家忽視、影響平臺(tái)增長。

針對上述問題,我們這邊的解法就是通過定向人群流轉(zhuǎn)、序列觸達(dá)推薦,和曝光頻次控制實(shí)現(xiàn)人群有次序的觸達(dá),從而實(shí)現(xiàn)人群的精準(zhǔn)觸達(dá)和轉(zhuǎn)化。從上圖中的觸達(dá)次數(shù)與用戶轉(zhuǎn)化占比圖,可以看出大部分的成交都是發(fā)生在消費(fèi)者的非首次觸達(dá)中,也就是說用戶首次觸達(dá)轉(zhuǎn)化情況是非常少見的。

結(jié)合一些實(shí)際的數(shù)據(jù),可以發(fā)現(xiàn)渠道的多次觸達(dá)對于用戶的轉(zhuǎn)化心智存在累積效應(yīng)。其次不同的渠道觸達(dá)順序?qū)τ脩舻霓D(zhuǎn)化存在影響。

二、序列化投放模型基礎(chǔ)方案

圖片

接下來介紹針對上述問題的基礎(chǔ)解決方案。

將單渠道優(yōu)化中的人貨預(yù)估問題,針對特定的人群、特定的商品。去做 CTR 和 CVR 的預(yù)估,包括其他目標(biāo)的預(yù)估。然后把問題,轉(zhuǎn)化為人貨路徑的預(yù)估問題。

基于這樣的思路,我們會(huì)遇到兩個(gè)問題:

(1)首先是序列樣本構(gòu)建。

(2)第二個(gè)問題是路徑的不確定性。投放前規(guī)劃的觸達(dá)序列在實(shí)際投放中并不能保證被完整曝光,尤其是廣告渠道。

圖片

下一步,結(jié)合實(shí)際場景設(shè)計(jì)序列化投放推薦的模型。基礎(chǔ)方案就是通過一個(gè)向量三塔模型去解決。

為什么要通過向量三塔模型呢?

首先,剛才提到的三元組,第一個(gè)就是人,第二個(gè)就是貨,也就是商品,第三個(gè)就是路徑。人、貨、路徑三元塔的數(shù)量級(jí)其實(shí)是非常龐大的。而產(chǎn)品功能需要保證計(jì)算時(shí)間可控,并將白盒化的定向人群、匹配商品及推薦路徑及時(shí)反饋給商家。然后商家確認(rèn)策略后采取投放?;谶@樣的產(chǎn)品性能的要求,采用向量的模型。因?yàn)橄蛄勘热缟唐坊蛘呗窂娇梢蕴崆熬彺妫鹊饺巳喝x出來后再做計(jì)算,這樣可以保證時(shí)間可控。

基于這個(gè)模型,我們做個(gè)兩點(diǎn)優(yōu)化:

(1)第一點(diǎn),泛化性的優(yōu)化。模型訓(xùn)練樣本近 80% 為營銷重點(diǎn)品。因此模型對中長尾商品、新品的學(xué)習(xí)是不充分的。因此基于 GraphSAGE 在基礎(chǔ)模型的 item 側(cè)構(gòu)建了Graph Embedding,提升泛化性。

(2)第二點(diǎn),根據(jù)實(shí)際情況去做的一個(gè)優(yōu)化,原來的序列化投放模型是基于 CVR 預(yù)估的,但其實(shí)從行業(yè)商家視角來看,渠道策略最終的目標(biāo)是提升 ROI。所以結(jié)合這一情況,我們這邊把最終的目標(biāo)轉(zhuǎn)化成 ROI 的預(yù)估問題。

對于 ROI 的預(yù)估有兩種方式:

(1)第一種,直接預(yù)估。這種方式的優(yōu)點(diǎn)是,模型保序即可,選擇預(yù)估值最大的觸達(dá)序列作為推薦策略。缺點(diǎn)就是,ROI 值域較大,模型預(yù)測難度大。

(2)第二種,分別預(yù)估。這種方式的優(yōu)點(diǎn)是,模型預(yù)測難度小于直接預(yù)估。缺點(diǎn)是分別預(yù)估由兩個(gè)預(yù)估值相除得到,存在模型誤差累積放大的可能。

三、向量模型優(yōu)化

圖片

基于最后的實(shí)驗(yàn)結(jié)果可以看到,使用這個(gè)直接預(yù)估 ROI 的結(jié)果,效果不是很好。剛才提到的向量三塔模型中,有一個(gè)很明顯的缺點(diǎn),就是人貨路徑三塔分離的向量化結(jié)構(gòu),保證了產(chǎn)品的 serving 性能,但因?yàn)槿鄙偬卣鹘徊娴哪P徒Y(jié)構(gòu),導(dǎo)致對側(cè)信息交叉過晚、模型表達(dá)能力被嚴(yán)重制約,整個(gè)模型精度有所欠缺。

基于這類問題,我們第一個(gè)優(yōu)化解決方式就是——知識(shí)蒸餾。

剛剛提到,缺少類似交叉特征等對模型精準(zhǔn)度有很大幫助的特征。如果可以引入這個(gè)優(yōu)勢特征,并且通過知識(shí)蒸餾的方式提供給線上模型,那是不是這個(gè)問題就能解決了?

圖中 teacher 網(wǎng)絡(luò)除了基礎(chǔ)特征以外,還引入了優(yōu)勢特征。這里的優(yōu)勢特征包括對側(cè)交叉特征和承接后鏈路特征。被知識(shí)蒸餾過的 student 特征,保證了線上線下特征的一致性。teacher 網(wǎng)絡(luò)只基于前后鏈路數(shù)據(jù),在更高緯的假設(shè)空間下學(xué)習(xí)知識(shí)。并指導(dǎo) student 網(wǎng)絡(luò)的學(xué)習(xí)。并不存在數(shù)據(jù)穿越的問題。

圖片

第二個(gè)優(yōu)化方案,虛擬內(nèi)核,topic embedding。在保證模型性能的前提下,實(shí)現(xiàn)用戶向量的千物千面,實(shí)現(xiàn)對側(cè)特征的融合。

四、規(guī)則優(yōu)化

圖片

營銷階段的算法,離不開規(guī)則的優(yōu)化。

原始人群流轉(zhuǎn)的規(guī)則,用戶在前置觸點(diǎn)中產(chǎn)生了目標(biāo)商品的曝光,才進(jìn)入下一個(gè)觸點(diǎn)的投放計(jì)劃。那么這個(gè)原始人群流轉(zhuǎn)的規(guī)則是相當(dāng)嚴(yán)格的。比如商品在直通車的渠道上面沒有產(chǎn)生曝光或者消耗。由于前置條件是產(chǎn)生了才會(huì)走到后續(xù)的渠道,否則將會(huì)永遠(yuǎn)停留在這個(gè)階段,不再進(jìn)行流轉(zhuǎn)。

我們的初衷是想通過更多的渠道去做多次的觸達(dá),促使用戶轉(zhuǎn)化心智的累積。所以要盡可能多的讓用戶產(chǎn)生累積觸達(dá)。不要去浪費(fèi)前面觸點(diǎn)的價(jià)值。盡可能提升人群流轉(zhuǎn)率,提升投放覆蓋和感知力度。

首先第一點(diǎn),需要對原來嚴(yán)格的流轉(zhuǎn)策略做一個(gè)放寬。原來是基于場景去做約束,比如直通車知道必須在這個(gè)點(diǎn)曝光,但是呢,用戶基于前面的觸點(diǎn)曝光以后,或者已經(jīng)在其他的一些場景產(chǎn)生了類似的行為,比如說公域,用戶已經(jīng)去搜索這個(gè)商品了,或者已經(jīng)在詳情頁里對這個(gè)商品產(chǎn)生瀏覽。那么我們應(yīng)該把這個(gè)場景放寬,公域場景也可以觸發(fā)曝光,這樣就可以使他流轉(zhuǎn)到下一個(gè)節(jié)點(diǎn)。另外是約束放寬,是指不局限于目標(biāo)商品的曝光??赡芟嗤娜~子類目或者店鋪品牌的相似品類的曝光,也可以觸發(fā)流轉(zhuǎn)。

兩個(gè)放寬策略優(yōu)化后,整個(gè)人群的流轉(zhuǎn)大概提升了 23.6%。

第二點(diǎn)就是頻次控制,前面提到,有些用戶經(jīng)由前面的觸點(diǎn),已經(jīng)完成轉(zhuǎn)化,如果后續(xù)還按照原有的計(jì)劃投放,會(huì)造成資源的浪費(fèi)。過度曝光頻次控制包括:對遠(yuǎn)超閾值曝光次數(shù)、但未對商品產(chǎn)生行為的用戶,停止后續(xù)的觸點(diǎn)流轉(zhuǎn)。頻次控制策略優(yōu)化后,投放整體 ROI 提升 4.46%。

五、總結(jié)與展望

最后對整個(gè)序列化實(shí)驗(yàn)和后續(xù)迭代方向做一個(gè)總結(jié)。

在模型階段,知識(shí)蒸餾和虛擬內(nèi)核方案的引入對側(cè)信息以及優(yōu)勢特征,在保證推理時(shí)效的同時(shí)提升了模型的準(zhǔn)確性。可以看到,在 AUC 和 ROI 方向,都有提升。

可迭代的方向,就是要結(jié)合整個(gè)健康行業(yè),醫(yī)藥類目的一些屬性去做一些事情。

首先,第一點(diǎn)就是我們在健康類目上,尤其是結(jié)合 OTC 或者處方藥的復(fù)購屬性,對臨近復(fù)購周期人群定制化流轉(zhuǎn)策略。舉個(gè)例子,一些用戶習(xí)慣在淘寶下單一些慢病相關(guān)的藥,當(dāng)這個(gè)藥購買之后,我們已經(jīng)可以獲得他買的這個(gè)規(guī)格或者說是訂單的數(shù)量,大概就可以判斷出什么時(shí)候把這些藥品吃完。那么在寫一個(gè)階段他到達(dá)復(fù)購周期的時(shí)候,我們可以針對這部分人做一些定制化的流轉(zhuǎn)策略。

第二點(diǎn),復(fù)購可以和渠道策略進(jìn)行結(jié)合。渠道策略可以圍繞用戶運(yùn)行的前后鏈路做一些聯(lián)動(dòng)。

第三點(diǎn),序列化投放,其實(shí)是一個(gè)多觸點(diǎn)決策,決策完成后,需要做多觸點(diǎn)歸因分析。歸因分析告訴我們不同的觸點(diǎn),對于用戶轉(zhuǎn)化的目標(biāo),或者價(jià)值,以及各個(gè)觸點(diǎn)貢獻(xiàn)了多少的增量價(jià)值?;谶@些結(jié)果,可以沉淀為整個(gè)經(jīng)營策略。包括多觸點(diǎn)歸因其實(shí)是可以輔助序列化投放的優(yōu)化迭代。

六、問答環(huán)節(jié)

Q1:模型線上單次運(yùn)行耗時(shí)多久?

A1:單次線上運(yùn)行耗時(shí)要分不同的情況,比如商家基于不同的目標(biāo),圈選的人群量級(jí)、或者商品的量級(jí),包括最后選定的渠道數(shù)量等等,不同的量級(jí),比如百萬級(jí)和千萬級(jí)的人群數(shù)量運(yùn)行的時(shí)間肯定是不同的 。但結(jié)合目前的情況來看,單個(gè)模型運(yùn)行下來,大概是分鐘級(jí)別的,也就是,商家需要等待一段時(shí)間,才能將整個(gè)策略白盒化。

Q2:不同渠道下的用戶側(cè)特征可以對齊嗎?

A2:其實(shí)是可以的。因?yàn)橛脩魝?cè)的特征其實(shí)沒有包含渠道上的數(shù)據(jù),更多的比如像 user 的特征或者說他的行為特征。這個(gè)行為特征,你可以理解為就是用戶在整個(gè)淘系內(nèi)產(chǎn)生的一些點(diǎn)擊、轉(zhuǎn)化搜索之類的行為。他其實(shí)并沒有和渠道側(cè)相關(guān)。所以這邊目前沒有加入一些渠道定制化的特征在里面。唯一和渠道結(jié)合的數(shù)據(jù)可能就是用戶在渠道上面的點(diǎn)擊率等等。點(diǎn)擊率和點(diǎn)擊率其實(shí)是能夠?qū)R的。

Q3:序列化重的渠道選擇與預(yù)算,頻率在模型中是如何結(jié)合的?

A3:作為模型特征,序列化渠道是沒有考慮預(yù)算的事情。因?yàn)轭A(yù)算,不是算法能夠解決的。往往是說,商家?guī)е繕?biāo),想要去運(yùn)營哪些商品,那么營銷商品,有多少的營銷預(yù)算,那么這個(gè)預(yù)算,其實(shí)在一開始就做好決定的。算法能做的就是基于歷史的一部分?jǐn)?shù)據(jù),幫助做一部分預(yù)算的分配。

比如你有 1000 萬的營銷預(yù)算,這些預(yù)算應(yīng)該花在那個(gè)節(jié)點(diǎn)上面。所以預(yù)算的總量是沒辦法用算法做出決定的。更多是在分配或者出價(jià)上,給出一定的建議或者策略。

至于頻次的話,就是在人群流轉(zhuǎn)的時(shí)候去做一些控制。比如會(huì)基于用戶的一些實(shí)際行為和轉(zhuǎn)化意愿等做一個(gè)頻次的控制。

Q4:投放路徑的選擇存在因人而異或者是差異化嗎?

A4:這個(gè)是的。因?yàn)檎虑榫褪腔诓煌挠脩?,然后去設(shè)置個(gè)性化的路徑。這一定是因人而異的。

Q5:用戶行為的使用是否存在數(shù)據(jù)泄露?

A5:不存在數(shù)據(jù)泄露的問題。

Q6:觸點(diǎn)是曝光觸點(diǎn)還是喚醒?

A6:觸點(diǎn)是在我們淘內(nèi)的渠道場景下發(fā)生的曝光。比如說短信發(fā)送以后,我們可以收到日志,來判斷用戶是否成功接收了短信。如果說成功接收了這條短信,對于用戶來說就是一次觸達(dá),也就是一次觸點(diǎn)。再比如說,直通車,搜索一些關(guān)鍵詞,然后我們出現(xiàn)在第一個(gè)坑位,只要用戶看到了這個(gè)坑位,我們也認(rèn)為這是一種觸點(diǎn)的曝光。

Q7:客戶路徑差異化通過什么工具或者方式把這個(gè)路徑固定下來?

A7:首先,在投放階段,商家?guī)е繕?biāo)或者意愿,還有預(yù)算來到平臺(tái),去設(shè)計(jì)整個(gè)人群的投放策略。在這個(gè)時(shí)候,我們會(huì)通過剛才提到的方式把路徑固定下來,交付給商家。其實(shí)就是一個(gè)人群包。無非就是你這個(gè)人群包中不同的用戶對應(yīng)當(dāng)天投放的哪些渠道。比如說用戶 A 對應(yīng)的就是短信,用戶 B 對應(yīng)的就是直通車。商家會(huì)根據(jù)人群包去做相應(yīng)的投放計(jì)劃。前面提到的用戶已經(jīng)產(chǎn)生了一些曝光,那么按照剛才的人群流轉(zhuǎn)策略,需要對這個(gè)用戶 A 對應(yīng)的渠道做一些更新。所以,行業(yè)商家看到的就是一個(gè)人群包不停更新的結(jié)果。

Q8:用戶行為發(fā)生變化,是否會(huì)改變路徑,不同路徑如何轉(zhuǎn)換?

A8:用戶行為發(fā)生變化是否會(huì)去改變路徑,我理解這是另外一個(gè)問題,叫做重定向問題。這可以理解為是否要基于這個(gè)用戶當(dāng)時(shí)實(shí)際的一個(gè)行為去改變下一個(gè)節(jié)點(diǎn)。在這一版本的序列化投放其實(shí)是沒有的。目前的序列化投放是做好了整個(gè)計(jì)劃的創(chuàng)建,然后按照這個(gè)計(jì)劃去執(zhí)行,比如這個(gè)問題,其實(shí)有兩個(gè)難點(diǎn)。第一個(gè)就是說這個(gè)用戶的數(shù)據(jù)要盡可能做到實(shí)時(shí),比如秒級(jí)或者分鐘級(jí)。那么你才能夠做到一個(gè)很好的且即時(shí)的重定向。然后,這個(gè)重定向其實(shí)會(huì)有一個(gè)長期價(jià)值預(yù)估的問題,可能更多的涉及到一些前后鏈路的問題。

責(zé)任編輯:姜華 來源: DataFunTalk
相關(guān)推薦

2021-11-03 07:58:27

SaaSRta技術(shù)

2018-12-14 16:10:34

有米科技AWS虛擬主機(jī)

2022-12-22 20:53:49

小紅書廣告

2015-09-20 18:31:29

阿里云心電數(shù)據(jù)云上安心

2021-08-05 15:29:38

Facebook 加密技術(shù)

2012-04-13 10:45:59

XML

2023-12-13 13:49:52

Python序列化模塊

2018-03-19 10:20:23

Java序列化反序列化

2012-03-23 15:27:24

阿拉丁

2013-03-11 13:55:03

JavaJSON

2013-11-12 11:01:28

多屏DSP加速

2022-08-06 08:41:18

序列化反序列化Hessian

2023-11-13 16:33:46

2022-04-26 06:36:09

渠道分析數(shù)據(jù)采集

2016-09-14 21:16:17

服務(wù)

2017-09-19 14:27:54

大數(shù)據(jù)數(shù)據(jù)可視化廣告投放

2024-05-06 00:00:00

C#序列化技術(shù)

2023-11-20 08:44:18

數(shù)據(jù)序列化反序列化

2021-05-21 18:59:59

ZTouch

2016-12-14 15:13:30

GradleAndroid定制化打包
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)