【友盟+】李丹楓:從用戶行為數(shù)據(jù)透視大數(shù)據(jù)商業(yè)密碼
原創(chuàng)【51CTO.com原創(chuàng)稿件】2016年11月25日,由51CTO.com主辦的WOT2016大數(shù)據(jù)技術(shù)峰會(huì)在北京粵財(cái)JW萬豪酒店召開,50多位來自阿里、騰訊、百度、京東、小米等知名企業(yè)的大數(shù)據(jù)領(lǐng)域資深技術(shù)專家齊聚大會(huì)現(xiàn)場(chǎng),將在兩天的時(shí)間里與逾千名一線IT技術(shù)人員直面交流,分享經(jīng)驗(yàn)。
在WOT2016大數(shù)據(jù)技術(shù)峰會(huì)的主會(huì)場(chǎng),【友盟+】CDO李丹楓做了《從用戶行為數(shù)據(jù)透視大數(shù)據(jù)商業(yè)密碼》的演講。以下是他的演講實(shí)錄:
說到大數(shù)據(jù)肯定先要介紹所謂的大數(shù)據(jù)到底是什么數(shù)據(jù)?這個(gè)數(shù)據(jù)里頭包括了幾個(gè)部分:
***,友盟+的APP統(tǒng)計(jì)服務(wù),服務(wù)了將近一百萬個(gè)APP,所以友盟+是有APP的用戶行為數(shù)據(jù),就是APP用戶什么時(shí)候啟動(dòng)使用?使用時(shí)長(zhǎng)?這些信息的數(shù)據(jù)。
第二,網(wǎng)站的信息,網(wǎng)站的內(nèi)容,用戶的來源,搜索詞友盟+都有涉及。友盟+每天會(huì)收集240億的數(shù)據(jù),這個(gè)體量是友盟+多年積累才能達(dá)到的。
最近的例子是在剛過去的雙十一,當(dāng)天友盟+一個(gè)廣告效果,監(jiān)控的產(chǎn)品實(shí)際上監(jiān)測(cè)到了人民幣34億的廣告投放。友盟+每天能夠觸達(dá)中國(guó)社區(qū)每天活躍設(shè)備是達(dá)到了13億,所以基本上來說,如果在中國(guó)你是一個(gè)比較正常設(shè)備的話,有很大的機(jī)會(huì)我們是會(huì)監(jiān)測(cè)到部分行為的。
今天主要分享的這三個(gè)內(nèi)容,主要都是基于數(shù)據(jù),友盟+做了挖掘的工作和應(yīng)用的實(shí)踐。
我覺得作為數(shù)據(jù)來說,最重要的是連接,因?yàn)槟阒挥邪褦?shù)據(jù)連接才能產(chǎn)生價(jià)值,任何獨(dú)立的數(shù)據(jù)點(diǎn)其實(shí)用處都不是很大的。對(duì)于友盟+來說,最核心的數(shù)據(jù)是用戶數(shù)據(jù)。剛才提到了友盟+有APP的使用數(shù)據(jù),有網(wǎng)站的瀏覽數(shù)據(jù)。你能想象,如果我們把移動(dòng)端的數(shù)據(jù)跟PC端的數(shù)據(jù)結(jié)合起來,對(duì)一個(gè)人的行為可以有更完整了解。
友盟+根據(jù)數(shù)據(jù)做了幾個(gè)事情:
***個(gè),是人口學(xué)信息。包括年齡、性別,還有加上他的地理位置這些信息。那么這些信息,實(shí)際上會(huì)通過一些標(biāo)識(shí)數(shù)據(jù),用這些標(biāo)識(shí)數(shù)據(jù)做模型訓(xùn)練,做出這個(gè)模型就可以對(duì)全量的數(shù)據(jù)進(jìn)行預(yù)測(cè)。用預(yù)測(cè)的結(jié)果,用到友盟+的應(yīng)用當(dāng)中。
第二個(gè),是行為信息。這個(gè)行為信息,其實(shí)包括了線上行為信息,移動(dòng)端的APP使用行為和PC的瀏覽行為,實(shí)際上友盟+現(xiàn)在已經(jīng)開始進(jìn)入線下這個(gè)領(lǐng)域,收集人的進(jìn)店行為,你去哪個(gè)商場(chǎng)逛,你進(jìn)了哪個(gè)店,這些行為把它收集起來,跟友盟+的線上行為打通。所以友盟+行為數(shù)據(jù)包括線上和線下,當(dāng)然線下可能還沒有線下的體量大,但是現(xiàn)在的增長(zhǎng)也是比較可觀的。
第三個(gè),更重要的實(shí)際上是通過這些數(shù)據(jù),會(huì)找到一些關(guān)系特征,其實(shí)這里包括了人與物的關(guān)系,人與世界,人與空間,人與時(shí)間,和人與人的關(guān)系。大家可以想一下,比如說一個(gè)廣告主要做一個(gè)活動(dòng),我做這活動(dòng)是不是可以找到,比如過去做的活動(dòng),對(duì)這個(gè)活動(dòng)有興趣的人都是什么人群?可以把歷史的數(shù)據(jù)和你現(xiàn)在要做的關(guān)聯(lián)起來。這個(gè)不是有一個(gè)固定的標(biāo)簽體系,這樣可以比較靈活的去滿足客戶需求,包括這個(gè)例子實(shí)際上是人與事件。人與物很多時(shí)候可以理解成,你對(duì)這個(gè)商品是不是有興趣?人與空間,你經(jīng)常在哪個(gè)區(qū)域活動(dòng)?你家在哪?你上班的地點(diǎn)在哪?人與時(shí)間,你不同的時(shí)間段可能有一些不同的信息。這些對(duì)內(nèi)容提供商有幫助,因?yàn)樗煌臅r(shí)間有不同的推送。當(dāng)然***人與人之間的關(guān)系,非常重要。
除此之外,當(dāng)然還會(huì)收集一些其他的特征,這些其他的特征,基本上是包括,這里所有,剛才提到的這些可以命名的信息之外的一些信息,這里不一一贅述了。
這是對(duì)數(shù)據(jù)的一些基礎(chǔ)處理,有了這些基礎(chǔ)處理,最主要的是得到行為數(shù)據(jù),這因?yàn)槲冶容^強(qiáng)調(diào)行為數(shù)據(jù),行為數(shù)據(jù)到底能夠?qū)鹘y(tǒng)企業(yè)也好,商家也好,能夠提供什么樣的價(jià)值?這里會(huì)舉三個(gè)例子。
***個(gè)例子非常容易想象,就廣告營(yíng)銷,這個(gè)是基本上做大數(shù)據(jù)現(xiàn)在應(yīng)用的幾個(gè)主要場(chǎng)景,一個(gè)是廣告營(yíng)銷,一個(gè)是搜索,一個(gè)是推薦,一個(gè)是金融。廣告營(yíng)銷友盟+今年做了一些嘗試,用數(shù)據(jù)做廣告營(yíng)銷,***的特點(diǎn)是有高覆蓋率??梢阅靡粋€(gè)最近做的案例,這是一個(gè)游戲的發(fā)行商,它有很多很多游戲。他自己是有一個(gè)自有的DMP,所以友盟+這個(gè)比較實(shí)際上不是跟一個(gè)什么數(shù)據(jù)都沒有的比較,友盟+是用自有的DMP和他的DMP進(jìn)行比較。
因?yàn)橛衙?每天可以監(jiān)測(cè)到1.3億的設(shè)備,所以覆蓋量非常非常大。談到這個(gè)覆蓋量具體的數(shù)字,用戶的DMP對(duì)于他所要投放的人群,他的這個(gè)性別和年齡的覆蓋率分別是74.1%和45.6%。對(duì)于友盟+來說,兩個(gè)都是91.2%。大家可能會(huì)問為什么兩個(gè)都是91.2%?因?yàn)槲艺f了友盟+的性別年齡是用預(yù)測(cè)模型做的,當(dāng)然友盟+的設(shè)備都會(huì)有年齡性別,當(dāng)然除了一些有問題的設(shè)備沒有這樣的信息。如果認(rèn)為這是一個(gè)質(zhì)量比較好的設(shè)備,友盟+都會(huì)有相關(guān)的信息的,所以這個(gè)覆蓋率是91.2%,基本上是覆蓋率非常非常高。
當(dāng)然重要的一點(diǎn),友盟+做了一個(gè)離線的CTR預(yù)估,其實(shí)自有的DMP,我基本上是說,沒有給具體的數(shù)字。用友盟+的數(shù)據(jù)你LIFI是原來的1.4倍,CPA從1降到0.6。1.4倍什么意思呢?這個(gè)離線你可以理解成我把它做成兩個(gè)類型,我在這個(gè)人群里面去預(yù)測(cè)哪些人是最容易點(diǎn)擊的?因?yàn)槲矣蓄A(yù)測(cè)的值嘛,我可以看到預(yù)測(cè)的效果是怎樣的。我投了一百萬人有一萬人點(diǎn)擊了,這一萬人要排在我前面,當(dāng)然現(xiàn)在還沒有系統(tǒng)達(dá)到這個(gè)效果。
前面的一千人里,有一百個(gè)人點(diǎn)擊了,這個(gè)預(yù)測(cè)的1.4,大概的意思,在前面這個(gè),剛剛指的一萬個(gè)人里有140人點(diǎn)擊了,這個(gè)更容易篩選誰更容易點(diǎn)擊你的廣告。這個(gè)對(duì)后面的投放有很好的指導(dǎo)意義。
既然友盟+把這個(gè)順序排得***,意思就是說,你把你的錢更多的用在刀刃上了,因?yàn)槟泐A(yù)測(cè)的點(diǎn)擊準(zhǔn)了,所以你點(diǎn)擊的人在你投放的這個(gè)范圍內(nèi)點(diǎn)擊你的人,用友盟+的模型實(shí)際上圈出來的人更多了。因?yàn)槟阃斗诺腻X是一定的,你每個(gè)人的點(diǎn)就降低了,降低了40%。這個(gè)數(shù)字還是很有意義的,因?yàn)檫@個(gè)不是說跟一個(gè)隨機(jī)投放比,而是跟一個(gè)已有的DMP去比。
這是***個(gè)友盟+做的離線測(cè)試,當(dāng)然這離線的測(cè)試往往還不能說明實(shí)際的問題,所以大家往往看到一些真實(shí)的案例。
這是一個(gè)游戲,這是一個(gè)APP的創(chuàng)意。友盟+做了一些分析,我這里用了一個(gè)叫TGI,用了一個(gè)星號(hào)。這個(gè)平常的定義是什么呢?你這個(gè)人群跟整體的人群的比較,剛才***內(nèi)容官說到,我們的講師都是男的,其實(shí)我看的一下,這一屆的講師也全都是男的。如果說我們這個(gè)人群性別的TGI跟整體的TGI比,那就是一個(gè)非常明顯的區(qū)別,我們這邊絕大多數(shù)都是男的,少部分人是女的,正常是50%50%。
所以這個(gè)TGI的意義是說,我要把兩個(gè)人群的***不同給它放大。如果說大家做過一些畫像產(chǎn)品,可能都會(huì)有這樣的體會(huì),如果我畫出來,好像我所有客戶的畫像都差不多,這什么原因呢?因?yàn)楝F(xiàn)在市面上很少有一個(gè)DMP能夠給你非常非常完全沒有一個(gè)偏差的數(shù)據(jù)統(tǒng)計(jì)。
因?yàn)槟氵@個(gè)數(shù)據(jù)的性質(zhì),你本身這個(gè)數(shù)據(jù)級(jí)和在你采集的這個(gè)用戶的行為,因?yàn)椴皇撬械男袨?,這本身可能就會(huì)有偏差。你用稍微帶點(diǎn)偏差的數(shù)據(jù)做出畫像,你會(huì)發(fā)現(xiàn)在你的數(shù)據(jù)里頭,相似的永遠(yuǎn)相似,不管在什么場(chǎng)景里面。所以為什么用TGI呢?實(shí)際上就是把你關(guān)心的人群跟原來用你這個(gè)數(shù)據(jù)畫出來整體人群的差別做一個(gè)對(duì)比,這樣把差別的地方放大。 實(shí)際上對(duì)比就是用你的人群除以整體人群的比例,這樣把差別體現(xiàn)出來了。
這里的TGI,用了所有看廣告的人,點(diǎn)了和沒點(diǎn)做了個(gè)比較,所以這個(gè)不是對(duì)一個(gè)整體的比較。這個(gè)更顯示了這兩個(gè)人群的區(qū)別,我發(fā)現(xiàn)比較明顯的幾個(gè)區(qū)別,***個(gè)點(diǎn)的人對(duì)冒險(xiǎn)類的游戲都比較有興趣,比較喜歡看跟軍事有關(guān)的新聞。后面兩個(gè)是說男性25到35歲,有了這個(gè)歷史數(shù)據(jù)的分析呢,就可以用這個(gè)去指導(dǎo)投放,我下面再投放的時(shí)候,我就要用這四個(gè)緯度,當(dāng)然這個(gè)我只是舉一個(gè)簡(jiǎn)單例子,實(shí)際上并不是只用了這四個(gè)緯度。去圈你下一次要投放的人群,效果其實(shí)還是有,如果你要算相對(duì)的提升,還是有很高很高的提升。所以這個(gè)實(shí)際的案例去印證我們的數(shù)據(jù)能夠?yàn)閺V告主提供很大的價(jià)值。
當(dāng)然了,這個(gè)例子,大家可以會(huì)覺得這個(gè)例子比較人肉,我有一個(gè)廣告主來了,可能找一兩個(gè)人去給他做一個(gè)比較深入的分析,我說我怎么去把你的歷史數(shù)據(jù)拿出來做一個(gè)比較?怎么提出來哪幾個(gè)緯度***?這個(gè)人肉的方式我們不是特別喜歡。剛才阿里云的同志也說了,支付寶這邊放貸是沒有人工介入的,我們也希望做廣告沒有人工介入。在廣告業(yè),當(dāng)然這個(gè)其實(shí)并不是一個(gè)新的事情了,就是我如果用一批自己的核心用戶,我肯定想找出跟我核心用戶相近的人群,我把我的消息推送給他們,這實(shí)際上是最有效的。
這個(gè)對(duì)做數(shù)據(jù)的人來說,反而是相對(duì)來說比較好做的事情,因?yàn)橛杏?xùn)練數(shù)據(jù)的,這個(gè)非常非常關(guān)鍵,而且很多廣告,效果廣告,尤其像安裝啊,***的這種轉(zhuǎn)化數(shù)據(jù)也是非常非常明顯。所以我們有訓(xùn)練數(shù)據(jù),也非常容易定義我們的目標(biāo)是什么?其實(shí)我們就可以通過廣告本身核心人群,在這個(gè)整體的人群里頭去找,哪些人跟他們最相近?
這個(gè)找呢,友盟+數(shù)據(jù)一大好處,數(shù)據(jù)一個(gè)是覆蓋非常多,知道它的行為也很多。所以,這個(gè)找你緯度越多,越容易找到相近的人,如果你只是從一兩個(gè)角度去看這個(gè)人,其實(shí)你有時(shí)候很難判斷他們倆是不是真正相近?當(dāng)然我們數(shù)據(jù)也不是很***,但是至少我們有很多緯度可以作為參考。
所以友盟+就訓(xùn)練了模型去通過你的人群給你放大,還有一個(gè)好處,我這么放大,你可以任意選投放人群的大小,因?yàn)檫@個(gè)模型做出來,實(shí)際上把整體的整個(gè)的人群做一個(gè)排序,最和你這個(gè)相近的人群都排在前頭。如果你投一千萬人,我可以給你劃一千萬人,這樣你永遠(yuǎn)可以找到人投,而且我們可以告訴你為什么投這些人?一些傳統(tǒng)的DMP的投放方式,包括他們打標(biāo)簽的方式都是基于事實(shí)的標(biāo)簽,也就是說,我判斷這個(gè)人是不是對(duì)體育有興趣?我可能說看看他最近是不是用了體育相關(guān)的這些APP,如果他用了,我就給他打上一個(gè)體育性質(zhì)的標(biāo)簽,如果他用的多我還可以給他一個(gè)權(quán)重。但是如果這些人沒有用體育,或者你沒有監(jiān)測(cè)到他用體育的APP,你沒有監(jiān)控到,并不能說明他對(duì)體育沒有興趣。這個(gè)就是說我根據(jù)各個(gè)緯度去判斷這個(gè)人群的相似成都,其實(shí)你可以理解成友盟+是覆蓋***的人,只是你愿意投到百分之多少的閾值那,這個(gè)對(duì)廣告主來說也是比較靈活的。
這個(gè)是一個(gè)比較,這個(gè)并不是特別特別***,這個(gè)因?yàn)槟軌蛘业胶芏嘈碌娜巳?,所以這個(gè)線保持得是比較平穩(wěn)的。當(dāng)然我們還在做許多工作,在模型上,在特征上把這個(gè)能夠做得***,這兩個(gè)是實(shí)際我們?cè)趶V告營(yíng)銷上投放的兩個(gè)實(shí)際的案例。
下面一個(gè),個(gè)人認(rèn)為比較有意思的,這個(gè)項(xiàng)目是今年年初成立以來,我起動(dòng)的一個(gè)項(xiàng)目,本身跟我自己的背景稍微有點(diǎn)相關(guān),因?yàn)槲以瓉碓诿绹?guó)是做過風(fēng)險(xiǎn)控制。我就在想有這么多數(shù)據(jù)是不是能在風(fēng)控上做一些嘗試呢?因?yàn)樵诿绹?guó)實(shí)際上有一個(gè)公司,它是原來谷歌的CIO出來辦的。他辦這個(gè)公司的目的是什么呢?其實(shí)美國(guó)整個(gè)征信體系是非常非常好的,它有三大信用局,它把美國(guó)所有人有關(guān)這種借款、貸款、信用卡這種還款記錄,實(shí)際上都收集起來了。收集起來以后呢,三大信用局,有一個(gè)公司是我工作的公司做了一個(gè)叫風(fēng)險(xiǎn)控制,這個(gè)在美國(guó)非常非常重要,如果你的風(fēng)險(xiǎn)控制高,你帶看可以比別人貸款利息多的多。
美國(guó)這個(gè)數(shù)據(jù)收集了很久,歷史很長(zhǎng),覆蓋率也很好,確實(shí)是把信用高的人和信用低的人分開了,但是信用高的人因?yàn)樾庞酶?,那各大貸款、銀行都爭(zhēng)先恐后去搶這些人,必然他們的利潤(rùn)就會(huì)越來越低。我在美國(guó)的時(shí)候用信用卡,我其實(shí)不太看利率多少。這個(gè)意味著,你如果說都集中在這一塊,你的這個(gè)利潤(rùn)其實(shí)競(jìng)爭(zhēng),中國(guó)所謂的紅海,競(jìng)爭(zhēng)是比慘烈的。
谷歌這個(gè)CIO,他的想法是說,我是不是可以收集一些其他的數(shù)據(jù)源?因?yàn)槟切?shù)據(jù)都是跟借貸直接相關(guān)的數(shù)據(jù),然后更好的用一個(gè)用戶信用的判斷。這樣的話,我可以去找這些信用好的下面這一層人,這些人他們可能是因?yàn)樾庞梅植桓?,所以他們拿不著貸款,我可以收很高很高的利息,但是如果我在這些人里做一個(gè)篩選,我能把有意愿,有能力還款的人再篩出來,我做這個(gè)生意就是一個(gè)很好的生意。
所以他當(dāng)時(shí)是建了這個(gè)公司,他是用了大概兩千多維度,其中包括用戶行為數(shù)據(jù)。我這邊一看用戶行為數(shù)據(jù),比他的用戶行為數(shù)據(jù)覆蓋率大的多的多,友盟+為什么不做一個(gè)嘗試?這就是啟動(dòng)這個(gè)項(xiàng)目的原因。
剛才提到了一點(diǎn),這個(gè)數(shù)據(jù)跟風(fēng)控有關(guān)的數(shù)據(jù),其實(shí)是一個(gè)金字塔型的。在金字塔最上方就是你借還款記錄,這個(gè)非常非常重要,美國(guó)的三大信用局收集的數(shù)據(jù)是這個(gè)數(shù)據(jù)。下面是一些消費(fèi)數(shù)據(jù),包括你銀行卡的記錄,包括你在淘寶、天貓上的這個(gè)消費(fèi),因?yàn)楝F(xiàn)在很多外面的P2B公司,把你的淘寶帳號(hào)給我,我去查一下你的消費(fèi)記錄。
再下面一層是通訊數(shù)據(jù),就是你的電話記錄,這個(gè)也用得非常多。再往下是社交,其實(shí)通訊里頭可以引申出一些社交,你經(jīng)常給誰打電話?當(dāng)然社交還包括微信微博。***是行為數(shù)據(jù),這些數(shù)據(jù)有什么不一樣呢?越往金字塔的上方跟風(fēng)控和信用相關(guān)性越強(qiáng)。你如果掌握了這個(gè)數(shù)據(jù),它能用這個(gè)數(shù)據(jù)做很好很好的模型。越往下面呢,實(shí)際上是覆蓋率越來越高,尤其在中國(guó),央行有一個(gè)信用數(shù)據(jù),里面有3.5億人,這3.5億人,實(shí)際上它收集的數(shù)據(jù)也不是特別特別全。
行為數(shù)據(jù)的好處是什么呢?我剛才提了數(shù)據(jù)覆蓋量非常非常大,尤其在互聯(lián)網(wǎng)和APP使用上,一般人不會(huì)說我要做個(gè)假,我自己假裝成我是一個(gè)別的人,所以這個(gè)行為數(shù)據(jù)是非常非常真實(shí)的。那是不是說可以通過這個(gè)行為數(shù)據(jù)做一些有意義的事情在風(fēng)控和信用方面呢?所以今年做的一些比較有意思的嘗試。
***個(gè),是匹配率。因?yàn)槠髽I(yè)最關(guān)心,你要用這個(gè)服務(wù),你不能說給一萬個(gè)服務(wù)號(hào),我只給你匹配一百個(gè),你沒什么用,你必須有足夠高的覆蓋率。
***個(gè)發(fā)現(xiàn)拿到這個(gè)數(shù)據(jù),對(duì)于按期還款的人我們能夠匹配到71%,這個(gè)匹配不是用全量數(shù)據(jù),只是用了一個(gè)月的數(shù)據(jù),要不然做這種驗(yàn)證代價(jià)太大了。對(duì)于沒有還款的人,他匹配率66%不到。整體來說,如果給我一個(gè)數(shù)據(jù),我能給你匹配到70%,那么這個(gè)就可用。
因?yàn)榭戳艘谎圻@個(gè)預(yù)期和不預(yù)期的,他們匹配率不同,下面一個(gè)自然想到他們風(fēng)險(xiǎn)是不是不同?這個(gè)數(shù)字說明什么呢?是說如果一個(gè)設(shè)備在這兒沒有找到匹配,它的風(fēng)險(xiǎn)要比找到了匹配的風(fēng)險(xiǎn)要高28%。實(shí)際上這對(duì)于下面這個(gè)借款公司,這個(gè)本身可以作為一個(gè)參考。這是非常早的時(shí)候發(fā)現(xiàn)一個(gè)比較有意思的事情。
第二個(gè),操作系統(tǒng)跟手機(jī)品牌。這個(gè)其實(shí)大家比較容易想象,這邊是IOS這邊是安卓,因?yàn)镮OS本身它的系統(tǒng)也比較封閉,不太容易做太多亂七八糟的事情。安卓是很開放的,有很多山寨機(jī),甚至有很多模擬期,都可以模擬安卓,所以安卓本身風(fēng)險(xiǎn)率要比IOS的要高很多。
另外一個(gè)比較有意思的事情,是友盟+內(nèi)部,因?yàn)槊刻爝@么多設(shè)備,我們會(huì)這些設(shè)備做一個(gè)評(píng)級(jí),這評(píng)級(jí)的意思就是說我去判斷,你這個(gè)設(shè)備是一個(gè)非常正常,有正常使用的設(shè)備,還是說你這個(gè)設(shè)備是一個(gè)用來刷量的設(shè)備,羊毛黨用的設(shè)備?這個(gè)是統(tǒng)計(jì)級(jí)別的,我們其實(shí)自己想一些規(guī)則,做的一些統(tǒng)計(jì)上的處理。我們把這個(gè)評(píng)級(jí)內(nèi)部評(píng)為一到四級(jí),一級(jí)是***的最正常的設(shè)備,四級(jí)是最不正常的設(shè)備,這里可以看出他們之間的風(fēng)險(xiǎn)率是非常非常不同的。
下面簡(jiǎn)單說一下友盟+用到的特征和模型。我們的特征分成幾類,一類是APP相關(guān)的,你安裝的APP,或者你經(jīng)常使用什么APP。第二類是跟設(shè)備有關(guān)的,品牌、操作系統(tǒng),包括你的尺寸、價(jià)格和我們內(nèi)部的質(zhì)量。
下面這個(gè)例子基本上差不多,這是0.68跟0.28,友盟+現(xiàn)在跟所有的P2B公司,或者銀行,我們不希望你直接用我們這個(gè)輸出去判斷是不是給人借款?但是我希望你把我們這個(gè)輸出整合到你們自己的模型里頭,用到你們所收集到的數(shù)據(jù),消費(fèi)數(shù)據(jù)、通信數(shù)據(jù)、社交數(shù)據(jù)放在一起,希望能夠幫助你們做得更好。這個(gè)是我們?cè)陲L(fēng)控方面的嘗試。
***一點(diǎn),開始進(jìn)入店下,從客流分析入手。之所以做客流分析,友盟+前身的公司就是做APP的客流分析的起家的,這個(gè)實(shí)際上我們的老本行,只不過你的數(shù)據(jù)源不同而已。為什么做線下?都說線上很好,線下的日子過得很好,一個(gè)原因,如果你想一個(gè)電商的網(wǎng)站,用戶從進(jìn)入你這個(gè)網(wǎng)站他的所有選為你有嚴(yán)格的監(jiān)控,他干了什么你全都知道,什么東西都躲不過你的眼睛,你就可以用這些數(shù)據(jù)做很多多的優(yōu)化。包括雙十一淘寶、天貓每個(gè)人看見的產(chǎn)品都不一樣,這些都是多年收集數(shù)據(jù)的結(jié)果。
對(duì)線下來說就比較慘淡了,線下你如果說到我這個(gè)店的附近了,我是不是有辦法知道你?這個(gè)線上的話,除非他過來了,要不你是不知道的。對(duì)于線上來說呢,其實(shí)這所有的環(huán)節(jié)基本上到現(xiàn)在為止,沒什么輸出,付款你可能知道一點(diǎn)點(diǎn),如果他有你的會(huì)員,你說會(huì)員卡給我,我可能你買了什么東西,如果他現(xiàn)金付不是會(huì)員,你只知道他買了什么東西,對(duì)于這個(gè)人你完全不知道。
對(duì)于線下來說我一點(diǎn)數(shù)據(jù)沒有,我怎么做優(yōu)化啊?沒法做優(yōu)化。我們就想,是不是可以幫助線下的商家開始收集一些數(shù)據(jù)?收集數(shù)據(jù)呢有很多方法,收集數(shù)據(jù)傳統(tǒng)的有紅外線,有攝像頭。紅外線和攝像頭的好處呢,它數(shù)的屬于可能相對(duì)來說比較準(zhǔn)一點(diǎn)。壞處是它沒辦法做連接,我剛才提到這個(gè)數(shù)據(jù)非常重要一點(diǎn)是連接,今天這個(gè)人來了,明天這個(gè)人回來你不知道他是同一個(gè)人。我們現(xiàn)在人臉識(shí)別技術(shù)很好了,像我一看見這個(gè)人,我就可以跟你說歡迎你,再次回來。這個(gè)離具體到實(shí)施還是有一段距離。
現(xiàn)在還有兩個(gè)方式,一個(gè)是通過WIFI收集,這個(gè)WIFI不對(duì)人,只對(duì)設(shè)備。只要你手機(jī)開了WIFI,它就不斷往外發(fā)信號(hào),去找最近有沒有上網(wǎng)的地方?他發(fā)的時(shí)候把手機(jī)的ID也會(huì)帶著,WIFI可以去匹配這些信息,這些信息收集到以后,你就知道這個(gè)人來了,在我店里待了多長(zhǎng)時(shí)間?他第二天是不是又來了?
Beacon它就是一個(gè)二維碼,你不用去掃,你開著藍(lán)牙它就自動(dòng)知道你在附近了。這三個(gè)都是WIFI,這個(gè)是Beacon。
今天我主要分享一下跟WIFI有關(guān)的嘗試。WIFI比較好的是用戶不需要做什么,如果他開著WIFI,我們就能收集到信息,我們也可以做連接。做了連接以后,實(shí)際上我們有一系列的指標(biāo)可以計(jì)算出來,這里頭包括客流數(shù),路過數(shù)??土鲾?shù)在某一個(gè)時(shí)刻有多少人在你店里?路過數(shù)是有多少人從你店前路過,這兩者一除你就知道你進(jìn)店人數(shù)。
后面包括兩個(gè),一個(gè)是跳出率,一個(gè)是進(jìn)入率,這個(gè)是有的人一進(jìn)我店就出去的,對(duì)我們店沒什么興趣。還有人一逛逛兩個(gè)小時(shí),這個(gè)人就是的金主。新客。還有這個(gè)人是不是來過?如果每周都來我店,每次來都待30分鐘,我把這部分人圈起來,這是我將來重點(diǎn)營(yíng)銷的人。
現(xiàn)在我們做的一些案例,***個(gè)案例,去年雙十一促銷,是一個(gè)化妝品的零售店,北京有24個(gè)店面,它這個(gè)促銷店面,11月6號(hào)到11月11號(hào),他主要想衡量他這個(gè)活動(dòng)到底效果怎么樣?我們用的是WIFI探針。
***項(xiàng),這個(gè)線是總客流的情況,這個(gè)線是入店客流,然后在促銷期間呢,大家可以看到,這個(gè)入店客流增長(zhǎng)還是不錯(cuò)的??傮w看這個(gè)效果至少對(duì)引流來說還是做得不錯(cuò)的。但是是不是都是這樣呢?就更細(xì)節(jié)的看一下,因?yàn)樗?4個(gè)店在北京,分區(qū),四個(gè)區(qū)。好像有點(diǎn)問題,有兩個(gè)區(qū)不錯(cuò),另外兩個(gè)區(qū)好像基本上沒效果。這個(gè)數(shù)據(jù)我們就給到店家,你去深入研究一下,為什么這兩個(gè)有效果,這兩個(gè)區(qū)沒效果?這會(huì)對(duì)后面有一個(gè)比較好的指導(dǎo),有一個(gè)定量的指導(dǎo)。
我做的不簡(jiǎn)單只是客流,因?yàn)檫@個(gè)數(shù)據(jù)可以和我們線上數(shù)據(jù)連接,連接以后就可以對(duì)你的人群有一個(gè)更好的了解,一個(gè)是你的性別,有多少人,這是性別的分布,你的客流性別分布這個(gè)主要以女性為主。在網(wǎng)上消費(fèi)的能力,年齡的分布,在網(wǎng)上消費(fèi)的頻率還有你經(jīng)常感興趣的新聞是什么?你經(jīng)常使用的APP類型是什么?這些我們都可以提供通過這個(gè)產(chǎn)品。
第二個(gè),是一個(gè)展會(huì),這個(gè)展會(huì)實(shí)際上是用這個(gè)可以看一下熱力跟動(dòng)線圖,因?yàn)闀r(shí)間比較緊,這個(gè)字不過了。說一下這個(gè)效果,這是這個(gè)會(huì)場(chǎng)的平面圖,你可以看到人流是怎么在你主要幾個(gè)點(diǎn)之間流動(dòng)的,包括人流的大,這個(gè)是熱力圖。哪些點(diǎn)大家比較感興趣,你都可以看到。
我們希望通過這個(gè)線下的數(shù)據(jù)收集和線上的數(shù)據(jù)打通,能夠把線上商家的數(shù)據(jù)化應(yīng)用能力,提供給線上的商家,其實(shí)很多線上的商家走到線下,線下的商家都到線上,這個(gè)也符合我們的發(fā)展趨勢(shì)。
好,謝謝大家!
【51CTO原創(chuàng)稿件,合作站點(diǎn)轉(zhuǎn)載請(qǐng)注明原文作者和出處為51CTO.com】