互聯(lián)網(wǎng)廣告的歸因分析(Attribution Analysis)
歸因分析可能是廣告技術(shù)中最復(fù)雜的一個(gè)問題,其復(fù)雜來源幾個(gè)方面:難建模,難驗(yàn)證,難應(yīng)用;但從另外一個(gè)方面說,它又是重要無比的,它可以幫助回答“我的50%廣告費(fèi)用都浪費(fèi)在哪里了?”,我的廣告預(yù)算分配如何更加合理?
雖然,本篇文章會(huì)假模假樣的建立幾個(gè)科學(xué)模型,把問題講“清楚”,并且試圖解決之,但是,這個(gè)狀態(tài)離真正的驗(yàn)證和廣泛應(yīng)用還是有一段距離。這有點(diǎn)像我們的中醫(yī),理論聽起來有模有樣,診療也是煞有介事,至于療效是否有因果關(guān)系,并非可以通過經(jīng)典科學(xué)實(shí)驗(yàn)可驗(yàn)證。這個(gè)問題本身就是非線性的問題,但是,道長且阻,行者將至!
歸因分析(Attribution Analysis)要解決的問題,就是廣告的Conversion的產(chǎn)生,其功勞應(yīng)該歸功于哪些渠道;舉個(gè)例子,廣告主投放了信息流廣告,搜索廣告,視頻廣告,轉(zhuǎn)化(Conversion)很多都直接發(fā)生在搜索廣告中,那么這些Conversion完全是搜索渠道功勞么?其實(shí)未必,很多轉(zhuǎn)化都是用戶在觀看視頻廣告/信息流廣告之后,引起用戶注意,而后用戶做了大量研究后,***一次轉(zhuǎn)化發(fā)生在搜索引擎渠道中而已。因此,在PC時(shí)代,搜索引擎收割各個(gè)營銷渠道的成果,成為了一個(gè)不爭的行業(yè)秘密。
下面圖示意了這個(gè)簡單的過程,目前大部分人在手機(jī)上的時(shí)間已經(jīng)超過了PC時(shí)間,雖然手機(jī)上的推廣對人們會(huì)有直接的影響,但這些轉(zhuǎn)化的落地往往在搜索和垂直電商網(wǎng)站。所以,搜索引擎的每一次轉(zhuǎn)化,實(shí)際上是和之前渠道的的投放是密切相關(guān)的,那么到底有多相關(guān),就是歸因分析要解決的問題。
首先,介紹一下幾種歸因分析模型,假設(shè)廣告觸點(diǎn),依次發(fā)生在渠道1,2,3,4,***發(fā)生了轉(zhuǎn)化,如何將轉(zhuǎn)化歸功于幾個(gè)渠道。比如說,Last Model就是認(rèn)為***一個(gè)渠道的貢獻(xiàn)是100%;Decay Model認(rèn)為貢獻(xiàn)程度隨著時(shí)間而衰減,越接近轉(zhuǎn)化的渠道,程度越高。
上面幾種模型,權(quán)重分配聽起來都比較武斷,并非根據(jù)數(shù)據(jù)計(jì)算出每個(gè)渠道的權(quán)重,無法直接指導(dǎo)投放的優(yōu)化。因此,很多學(xué)術(shù)同學(xué),對這個(gè)問題深入研究,并且做了一些模型。今天,介紹4種模型,分別
- 夏普里值(Shapley Value)
- 生存分析(Survival Analysis)
- 通徑分析
- 馬爾科夫鏈
方法一:夏普里值方法
夏普里值(Shapley Value)指所得與自己的貢獻(xiàn)匹配的一種分配方式,由諾貝爾獎(jiǎng)獲得者夏普里(Lloyd Shapley)提出,它對合作博弈在理論上的重要突破及其以后的發(fā)展帶來了重大影響。如果對夏普里不熟悉的同學(xué)可以看看下面的例子:
約克和湯姆結(jié)對旅游。約克和湯姆準(zhǔn)備吃午餐。約克帶了3塊餅,湯姆帶了5塊餅。這時(shí),有一個(gè)路人路過,路人餓了。約克和湯姆邀請他一起吃飯。路人接受了邀請。約克、湯姆和路人將8塊餅全部吃完。吃完飯后,路人感謝他們的午餐,給了他們8個(gè)金幣。路人繼續(xù)趕路。
約克和湯姆為這8個(gè)金幣的分配展開了爭執(zhí)。湯姆說:“我?guī)Я?塊餅,理應(yīng)我得5個(gè)金幣,你得3個(gè)金幣。”約克不同意:“既然我們在一起吃這8塊餅,理應(yīng)平分這8個(gè)金幣。” 約克堅(jiān)持認(rèn)為每人各4塊金幣。為此,約克找到公正的夏普里。
夏普里說:“孩子,湯姆給你3個(gè)金幣,因?yàn)槟銈兪桥笥眩銘?yīng)該接受它;如果你要公正的話,那么我告訴你,公正的分法是,你應(yīng)當(dāng)?shù)玫?個(gè)金幣,而你的朋友湯姆應(yīng)當(dāng)?shù)玫?個(gè)金幣。”
約克不理解。
夏普里說:“是這樣的,孩子。你們3人吃了8塊餅,其中,你帶了3塊餅,湯姆帶了5塊,一共是8塊餅。你吃了其中的1/3,即8/3塊,路人吃了你帶的餅中的3-8/3=1/3;你的朋友湯姆也吃了8/3,路人吃了他帶的餅中的5-8/3=7/3。這樣,路人所吃的8/3塊餅中,有你的1/3,湯姆的7/3。路人所吃的餅中,屬于湯姆的是屬于你的的7倍。因此,對于這8個(gè)金幣,公平的分法是:你得1個(gè)金幣,湯姆得7個(gè)金幣。你看有沒有道理?”
約克聽了夏普里的分析,認(rèn)為有道理,愉快地接受了1個(gè)金幣,而讓湯姆得到7個(gè)金幣。
我們?nèi)绾斡眠@個(gè)方法來分析不同渠道的貢獻(xiàn)度呢? 下面是一個(gè)例子,
假設(shè)有3個(gè)渠道:信息流(A),開屏(B),視頻前貼(C),他們的獨(dú)自投放效果和兩兩投放效果如下圖所標(biāo)識。
下面,我們來計(jì)算,每一個(gè)渠道的夏普里值,夏普里值的定義:是在各種可能的聯(lián)盟次序下,參與者對聯(lián)盟的邊際貢獻(xiàn)之和除以各種可能的聯(lián)盟組合。
三個(gè)渠道,有3*2種聯(lián)盟次序,具體計(jì)算如下:
因此,信息流的夏普里值為20,開屏的夏普里值為33.3,視頻前貼的夏普里值為46.6。
方法二:生存分析方法(Survival Analysis)
生存分析(Survival analysis)是來源于醫(yī)學(xué)研究的一種方法,指根據(jù)試驗(yàn)或調(diào)查得到的數(shù)據(jù)對生物或人的生存時(shí)間進(jìn)行分析和推斷,研究生存時(shí)間和結(jié)局與眾多影響因素間關(guān)系及其程度大小的方法,也稱生存率分析或存活率分析。這個(gè)方法在醫(yī)療處理領(lǐng)域也比較成熟,可以通過以下的映射到歸因分析;
- 病人==>Impression
- 治療方法==>渠道
- 死亡==>轉(zhuǎn)化
在實(shí)現(xiàn)分析中,可以使用COX回歸方法,COX可以對多個(gè)因素進(jìn)行分析;COX回歸方法和邏輯回歸LR有些相似的地方,通過訓(xùn)練過程找?guī)讉€(gè)參數(shù),不同的是COX回歸中考慮了時(shí)間的因素;通過COX回歸計(jì)算,可以算出每一個(gè)渠道的權(quán)重。
方法三:通徑分析(Path Analysis)
通徑分析的基本原理是美國學(xué)者賴特(S·Wright)于1921年創(chuàng)立的。通徑分析是指利用通徑系數(shù)分析變量間相關(guān)關(guān)系的方法。
通徑分析是進(jìn)行相關(guān)系數(shù)分解的一種統(tǒng)計(jì)方法。它的意義不僅在于揭示了在多個(gè)自變量x1,x2,…,xm,y的相關(guān)分析中,xi對y的直接影響力和間接影響力,而且還可以在x1,x2,…,xm,y間的復(fù)雜相關(guān)關(guān)系中,從某個(gè)自變量與其他自變量的“協(xié)調(diào)”關(guān)系中得到對y的***影響的路徑信息,即從復(fù)雜的自變量相關(guān)網(wǎng)中,得到某個(gè)自變量決定y的***路徑,具有決策的意義?,F(xiàn)通過實(shí)例說明通徑分析的方法與步驟,并進(jìn)一步了解通徑系數(shù)的意義和應(yīng)用。它的本質(zhì)也是基于概率的一些計(jì)算。
方法四:馬爾科夫鏈
馬爾科夫鏈模型來自于數(shù)學(xué)家Andrew Markov所定義的一種特殊的有序列。馬爾可夫鏈(Markov Chain),描述了一種狀態(tài)序列,其每個(gè)狀態(tài)值取決于前面有限個(gè)狀態(tài)。馬爾可夫鏈?zhǔn)蔷哂旭R爾可夫性質(zhì)的隨機(jī)變量的一個(gè)數(shù)列。這些變量的范圍,即它們所有可能取值的集合,被稱為“狀態(tài)空間”。
在應(yīng)用當(dāng)中,序列中的每個(gè)點(diǎn)通常映射為一個(gè)廣告觸點(diǎn),每個(gè)觸點(diǎn)都有一定概率變成真正的轉(zhuǎn)化。通過這種建模,可以選擇最有效,概率***的觸點(diǎn)路徑。這種方法需要較多的數(shù)據(jù),計(jì)算也比較復(fù)雜。
“哲學(xué)是用來解釋世界的,而重要的是改變世界”--馬克思
那么我們得出各個(gè)渠道的重要程度后,我們?nèi)绾问褂眠@些權(quán)重是非常有趣的,因?yàn)檫@些渠道都是相關(guān)的,需要程序組合一套方案,達(dá)到效果推廣***。但是,這些影響力實(shí)際上也會(huì)發(fā)生很大變化:
1.時(shí)間變化而變化:例如人們對一些廣告,容易在時(shí)間軸上產(chǎn)生疲軟;
2.人群變化而變化:例如洗人群后,效果變化很大;因此,廣告花費(fèi)在一個(gè)渠道的過渡增加,往往會(huì)影響效果。
介紹幾個(gè)知名歸因分析公司:
1.Google Attribution 360:
Google Analysis Suite 360中有一個(gè)重要模塊就是Attribution,這個(gè)產(chǎn)品是收購收購了Adometry公司之后,全新打造的新產(chǎn)品。這個(gè)產(chǎn)品使用起來非常復(fù)雜,需要專業(yè)的培訓(xùn)才可了解。它支持以上大部分歸因分配模型,例如Last Model, Decay Model,customized Model等。
2.VisualIQ
Visual IQ是一家全球領(lǐng)先的跨渠道營銷歸屬軟件公司。公司在2006年成立。公
司的IQ智能套件可以為用戶提供市場數(shù)據(jù)見解,行政級別和從業(yè)級別建議,以提高自己的營銷業(yè)績。
Visual IQ是一家專門研究營銷信息管理方案、利用數(shù)據(jù)以及消費(fèi)者經(jīng)歷的每一個(gè)營銷觸點(diǎn)對一個(gè)客戶整體營銷目標(biāo)的影響的科學(xué)計(jì)算和衡量方法的公司。
Visual IQ采用信息管理歸納方案的方法收集數(shù)據(jù),然后利用分析模型,計(jì)算和量化消費(fèi)者的購買習(xí)慣的方法,去分析數(shù)據(jù),整理出最適合企業(yè)的廣告方案。
3.Convertro
Convertro 主要利用數(shù)據(jù)分析,幫助營銷人員了解哪些類型的廣告導(dǎo)致了客戶的購買。AOL與2014年收購了這家公司,收購時(shí)間與谷歌收購Adometry非常接近。AOL可以利用 Convertro 的技術(shù),告訴廣告主他們的那些廣告取得了更好的效果,例如,是 AOL 網(wǎng)站主頁上的橫幅廣告,還是《赫芬頓郵報(bào)》網(wǎng)站某視頻下方的廣告。Convertro 還可以檢測電視或電臺那一時(shí)段的廣告導(dǎo)致了客戶購買。
4.AppsFlyer
移動(dòng)的歸因市場應(yīng)該是剛剛起步,有幾家公司開始這方面的工作,包括App推廣渠道的跟蹤,跟蹤效果可以直接對接各種廣告平臺;國外的應(yīng)用市場比較單純,Android是Google Play, iOS是App Store。AppsFlyer是一個(gè)以色列公司,在移動(dòng)App方面,起步比較早,在行業(yè)中也做的比較領(lǐng)先。
//移動(dòng)歸因其實(shí)是一個(gè)非常有趣的話題,找個(gè)時(shí)間,單獨(dú)好好聊聊。
總結(jié)的話
歸因是一個(gè)大問題,幫助分析廣告?zhèn)鞑サ男Ч?,更加系統(tǒng)的分析效果貢獻(xiàn)程度,效果形成的路徑,傳播的方式等方面,幫助廣告主優(yōu)化預(yù)算的花費(fèi),***化傳播效果和轉(zhuǎn)化效果。
【本文為51CTO專欄作者“歐陽辰”的原創(chuàng)稿件,轉(zhuǎn)載請聯(lián)系作者本人獲取授權(quán)】