如何構建好的用戶畫像平臺?
一、畫像平臺產(chǎn)品架構
上圖是基于快看數(shù)據(jù)中臺畫像平臺產(chǎn)品的理解和定位整理出來的產(chǎn)品架構。
畫像平臺首先是服務于業(yè)務的,運營可以基于畫像平臺對單個用戶或者人群包做畫像的洞察,平臺服務的業(yè)務應用層包含:
(1)個性化推薦:它對畫像的使用是非常重的,能夠基于每個用戶的畫像去做千人千面的內容分發(fā)。
(2)精細化運營:產(chǎn)品運營對用戶做精細化營銷的時候,會使用畫像平臺的人群圈選,依賴平臺的人群洞察分析能力。
(3)精準營銷:商業(yè)化側如精準營銷,會依賴畫像平臺,針對內容或者產(chǎn)品特點,精準觸達一定偏好的用戶,提高營銷效率。
(4)獲客推廣:渠道獲客推廣對畫像平臺的應用也非常多,依賴也很重。
畫像平臺產(chǎn)品服務層的功能一般包含如下這些:
(1)人群圈選:指根據(jù)用戶畫像的標簽或者特定的維度篩選出需要使用的人群包,然后對人群包中的用戶做一些特定的操作。
(2)人群計算:對多個人群包進行交、差、并等操作。
(3)人群洞察:對特定的人群包基于用戶的標簽或者維度去分析其分布以及特點規(guī)律。
(4)人群包管理:畫像平臺上能夠清晰有效的管理創(chuàng)建出的人群包,進行體系化的管理和展示。
(5)標簽管理:畫像平臺最重要的信息就是用戶的畫像標簽,需要對這些標簽進行一個體系化的管理。
(6)Look-alike:快看數(shù)據(jù)中臺在建設畫像平臺的時候,這方面的訴求不多,公司的廣告業(yè)務自己實現(xiàn)了 Look-alike 功能,因此這里不做詳細說明。
(7)功能 API 和畫像查詢 API:畫像產(chǎn)品和業(yè)務的對接中,會收到業(yè)務側對畫像平臺功能 API 和查詢 API 等 API 接口的需求。有了 API,運營系統(tǒng)或營銷系統(tǒng)能夠便捷的接入畫像平臺的特定功能,使用畫像平臺的人群畫像。
建設畫像平臺,需要實現(xiàn)對數(shù)據(jù)生產(chǎn)、數(shù)倉建模以及標簽數(shù)據(jù)體系的管理。我們基于數(shù)據(jù)倉庫模型,對畫像數(shù)據(jù)進行體系化的管理,主要有三部分:
(1)數(shù)據(jù)域建模:首先基于數(shù)據(jù)倉庫對多條業(yè)務線的數(shù)據(jù)進行分數(shù)據(jù)域的建模管理。主要是對公司數(shù)據(jù)進行數(shù)倉的分層,并在數(shù)倉的 DWD/DWS 偏底層的部分,對我們的業(yè)務數(shù)據(jù)域進行分域的管理,以保證不同業(yè)務線的數(shù)據(jù)能有清晰的管理存儲以及位置查詢。
(2)標簽計算和挖掘:有了基礎數(shù)據(jù)之后,需要進行標簽計算和挖掘,生產(chǎn)標簽。
(3)畫像主題建模:生產(chǎn)的標簽會存儲在數(shù)倉的主題層。快看建設了專門的畫像主題,畫像主題對畫像平臺所有的標簽體系以及用戶標簽相關的數(shù)據(jù),進行了建模和管理。
再下面就是數(shù)據(jù)采集層,包括埋點平臺、業(yè)務日志、業(yè)務 DB 數(shù)據(jù)以及三方數(shù)據(jù)。把數(shù)據(jù)采集上來,進行數(shù)據(jù)側的 ETL 清洗提取,轉化成數(shù)據(jù)倉庫模型里面的基礎數(shù)據(jù)。
一般來說,這是畫像平臺從業(yè)務側到數(shù)據(jù)采集側全鏈路的產(chǎn)品架構。
討論完產(chǎn)品架構之后,繼續(xù)探討另外一個話題,公司內部什么樣的組織適合搭建畫像平臺,以及它的定位是什么?
根據(jù)我的理解總結了兩方面畫像平臺的定位:
(1)業(yè)務內自建平臺。在很多公司,一些比較大的業(yè)務線,是有能力去建設自己的畫像平臺的,特點是畫像平臺建設是服務于本業(yè)務線的,在本業(yè)務線內去使用。一般要求業(yè)務線能夠具備相對比較完善的數(shù)據(jù)平臺能力,數(shù)據(jù)倉庫建模能力以及一定的數(shù)據(jù)挖掘能力,這些是進行畫像平臺數(shù)據(jù)生產(chǎn)的基礎。另外,業(yè)務內自建畫像平臺因為只服務于單條業(yè)務線,往往會和自己業(yè)務運營的營銷系統(tǒng)或者 BI 報表或者數(shù)據(jù)監(jiān)控平臺等有相對比較重的耦合性。耦合性是指業(yè)務自建畫像平臺會在平臺內部把運營能力(比如說配置能力或者分發(fā)能力),營銷能力(比如 PUSH 或者說短信觸達)以及精細化運營和精準營銷的數(shù)據(jù)回收計算、指標展示、監(jiān)控等功能都糅合到畫像平臺中。
(2)中臺型畫像平臺。快看有自己的數(shù)據(jù)中臺,各個業(yè)務也沒有足夠人手建設業(yè)務內自建畫像平臺,所以快看的畫像平臺是由數(shù)據(jù)中臺部門建設的。它服務于多條業(yè)務線,每條業(yè)務線都可以基于自己的業(yè)務場景和訴求去使用。一個特點是平臺數(shù)據(jù)源是來自于多條業(yè)務線,所以數(shù)據(jù)源的標準性和一致性不好把控;另外因為業(yè)務和業(yè)務之間的差異很大,數(shù)據(jù)差異也非常大,不同領域數(shù)據(jù)模型的差異也非常大,所以數(shù)倉建模的復雜度是非常高的;再一個特點是中臺畫像平臺,要求平臺能力盡量和業(yè)務的運營系統(tǒng),營銷系統(tǒng)或者其他的報表平臺能夠做功能的解耦,因為如果中臺畫像平臺和某一個或者幾個業(yè)務的業(yè)務系統(tǒng)能力耦合過重,擴展性就會不好,平臺產(chǎn)品能力過于定制化是非常不利于將來的功能拓展和迭代設計優(yōu)化的。
這是不同的公司在不同的階段可能會面臨的一個選擇,大家可以根據(jù)自己公司實際的痛點問題選擇合適的自建方式。
二、快看畫像平臺建設經(jīng)驗
下面介紹快看建設中臺型畫像平臺的經(jīng)驗。
1、快看畫像平臺建設的背景
首先來介紹一下快看畫像平臺建設的背景,快看成立于 2014 年,是漫畫垂類下用戶體量最大的平臺,目前總用戶量近 3 億,主要業(yè)務有漫畫閱讀、二次元社區(qū)以及商業(yè)化等。
在業(yè)務需求方面:
(1)快看的業(yè)務發(fā)展非常快,業(yè)務線的數(shù)量和業(yè)務線的規(guī)模都在快速擴張,目前中臺支持了十多條業(yè)務線,公司還在不斷的孵化新的業(yè)務線,公司的業(yè)務規(guī)模也是不斷變化的。
(2)從 2018 年、2019 年之后,移動互聯(lián)網(wǎng)市場的用戶量增長就非常緩慢了,再加上短視頻行業(yè)的興起,用戶時間被短視頻行業(yè)搶占了很多,移動互聯(lián)網(wǎng)市場已經(jīng)變成了一個存量用戶競爭的紅海市場。各個 ToC 的產(chǎn)品為了能夠吸引用戶、提升用戶時長,各個業(yè)務對存量用戶的精細化運營和精準營銷的需求越來越多了。
前面的分析中可以看出各個業(yè)務對數(shù)據(jù)的依賴,對精細化運營操作的訴求,快看各個業(yè)務也會面臨這些問題和訴求。
數(shù)據(jù)中臺作為公司里面去統(tǒng)一承接各個業(yè)務,各種數(shù)據(jù)場景,各種數(shù)據(jù)類需求的部門,在長期的對接中,逐漸感受到大家對畫像標簽的依賴越來越重,因此從各個業(yè)務對畫像平臺的通用訴求中提煉出最常見的對于畫像平臺一些依賴的能力以及對標簽的依賴的需求。
快看中臺從 2016 年初就開始建設,大數(shù)據(jù)平臺的能力是比較完善的。對于數(shù)據(jù)采集、數(shù)據(jù) ETL、數(shù)倉建模這些方面都是有自己的模型以及方法論建設的,而且開發(fā)能力也相對比較完善。
2、快看畫像平臺功能簡介
上圖是快看畫像平臺的功能以及產(chǎn)品的界面,因為時間有限,分享的重點不在于我們每一個功能產(chǎn)品設計的邏輯,或者一個功能的具體實現(xiàn),而是想著重的跟大家去介紹一下我們在建設中臺型畫像產(chǎn)品的時候,遇到的 4 個比較難的問題,或者說我們認為一些關鍵的點。我們的產(chǎn)品能力前面已經(jīng)介紹過了,也都是比較通用的能力,因為我們做的是中臺型的畫像產(chǎn)品,建設目標就是為了滿足業(yè)務對畫像平臺、畫像標簽的通用需求。
我們平臺的功能可以概括為:標簽管理、人群圈選、人群上傳、人群計算、人群洞察和人群包管理。
接下來分享我們在快看建設中臺型畫像產(chǎn)品過程中遇到的 4 個比較有意思的問題。
(1)實踐1:弱登錄類型 App 建立設備 ID 標識
第一個問題是弱登錄類型 App 建立設備 ID 標識。
弱登錄類型的特點是用戶不需要強制登錄也能夠使用這個平臺的一些核心產(chǎn)品能力產(chǎn)品功能,像內容型和工具型的 APP,大概都會符合這個特點。為了用戶能夠快速使用我們的核心功能,提高用戶轉化,產(chǎn)生用戶的激活留存,很少強制用戶授權登錄,所以允許用戶不需要登錄也可以使用 APP。
但是,各個業(yè)務又希望能夠對新用戶以及拉活召回的用戶快速的產(chǎn)生深度連接,讓用戶能夠快速的產(chǎn)生興趣和粘性,這就需要做精細化運營或者精準營銷,而這些動作,都是要針對于非登陸用戶,基于設備的 ID 做一個動作。
所以設備的唯一性識別在畫像的建設中極其重要。如果設備的唯一性識別的準確性不高,將會產(chǎn)生比較大的問題。而提高設備 ID 的識別度,有以下的難點:
① Android/IOS 的 IMEI、IDFA、OAID 的獲取受限以及頻繁變更。Android 和 IOS 從系統(tǒng)層面對用戶隱私的保護機制是越來越強。以 Android 來說,從 Android 10 之后是不允許獲取用戶 IMEI 的,現(xiàn)在的新系統(tǒng)都是獲取不到的。以 IOS 來說,14.5 版本之后,獲取 IDFA 都需要彈窗用戶授權。在中國,華為、小米、OPPO、VIVO 等組成的廣告聯(lián)盟一起協(xié)作出了一個 OAID 作為廣告標識。上面這些 ID 或者不能獲取了,或者就是獲取的時候需要用戶授權,造成一定的損失;再或者像 IDFA 和 OAID 面臨頻繁變更的情況,用戶是可以主動重置的,包括重置系統(tǒng),刷機,重裝 APP 等都可能造成 ID 的變更。這是是我們保證設備 ID 唯一性最大的困難。
② ID Mapping 的變更。各個業(yè)務希望基于各自對 ID 的依賴去做 ID Mapping。以廣告業(yè)務為例,廣告業(yè)務目前去做廣告投放或者廣告回傳效果監(jiān)測的時候,對 IMEI 和 IDFA 的使用現(xiàn)在還是很重的。他們希望不管你內部使用哪種 ID,但是你需要能夠基于 IMEI 或者 IDFA 和本部門完成廣告投放方面的協(xié)作或者信息的打通回傳。如果我們對設備 ID 的獲取的覆蓋率以及它的變更無法精準識別,那當進行外部協(xié)作,比如與廣告業(yè)務的外部協(xié)作就會產(chǎn)生很大的折損,對效率造成影響。
作為中臺部門,我們在構建畫像平臺的時候,首先需要解決這個問題,如果不解決,剛才提到的難點在業(yè)務側會產(chǎn)生很大的影響,我們的解決方案主要是兩個方向:
① 第一,快看能夠維護每個設備各個 ID 的映射和變更關系,我們把這些 ID 盡可能都收集上來并且去維護它的映射和變更關系,并且基于收集信息去自建快看的 KKDID。生成快看自己的 ID 之后,我們對設備的唯一性就有了自己的識別體系,對它的質量也有了自己的保證。
② 第二,在建設的過程中,可以借助行業(yè)內的第三方反作弊平臺,利用它的唯一 ID 的識別能力,提升自建設備 ID 體系的準確性。
我們在 Android/IOS 兩個平臺分別采取了很多判斷邏輯去構建自建的 KKDID 體系,在構建自己的 ID 體系的過程中,需要做非常復雜的唯一性識別和判斷。需要平臺根據(jù)自己產(chǎn)品的特點以及收集的用戶數(shù)據(jù),制定適合自己業(yè)務的定制化判斷邏輯。
下面列出一些快看自建 KKDID 后在公司內部的效果,這里只列出重點,我們其實有完整的評估報告:
① 第一,為安卓提升了約 2.2% 的 IMEI 填充率。比如我們有 3 億設備,里面有一部分安卓,乘以安卓的比例,然后再乘以 2.2%,這部分設備原來是沒有 IMEI 或者 IMEI 的識別是有問題無法精準匹配的,但是通過唯一 ID 識別,可以把這部分 IMEI 的填充率提升上來。如果有很多重復設備被識別成不同的設備會導致安卓的 IMEI 填充率降低,但是我們通過設備的唯一識別,可以提升其填充率。
② 第二,對比第三方反作弊平臺,我們的唯一設備識別率提升了 1.5%。我們行業(yè)內的第三方反作弊平臺,他們在設備唯一識別上也是存在很多 bad case 的,我們在構建的過程中發(fā)現(xiàn)了這些問題,即使是行業(yè)內 Top1/Top2 的反作弊平臺。
③ 第三,我們在搭建了 KKDID 之后,還做了 KDDID 和 IMEI、IDFA、OAID 之間的兩兩映射,提升了各個業(yè)務在不同場景下使用對接上的準確性。
這是我們解決的第一個問題,也是我們構建畫像平臺的一個基礎。首先要能夠精準的識別唯一的設備,然后才能去對這個設備進行畫像。
這里重點提了設備 ID,但不同的業(yè)務對設備 ID 的重要性依賴度是不一樣。像很多商業(yè)化,用戶只有登錄后才能進行商業(yè)化的操作,如果對它做精準營銷,只依賴用戶登錄后的登錄 ID 就可以了,反而不那么關注設備層面的畫像,所以需要根據(jù)不同的業(yè)務去思考這個問題。當然,KKDID 是一個通用能力,供大家參考。
(2)實踐 2:數(shù)倉建模經(jīng)驗
?接下來介紹第二個經(jīng)驗,中臺型的畫像平臺對接的業(yè)務方非常多,會面臨如何管理非?;靵y的數(shù)據(jù)源的問題。為了解決這個問題,我們用了分層建模以及數(shù)據(jù)域和主題去分層管理的思路,特點是數(shù)倉有兩個明確的業(yè)務數(shù)據(jù)域層和畫像主題層兩個明確的分層。
底層的業(yè)務數(shù)據(jù)域,DWD/DWS 層負責清洗和管理各個業(yè)務數(shù)據(jù)域內的明細層數(shù)據(jù)。以付費域來說,用戶或者會員的付費,我們會在付費數(shù)據(jù)域把付費相關用戶的行為全部在付費域里面進行建模,然后建不同的寬表進行存儲和管理。對用戶域、流量域甚至其他域都是用同樣思路去建設的,不承擔直接的畫像計算或者挖掘任務。
在這之上我們建設了專門的畫像主題,在數(shù)倉里面對應的是 DM/APP 層,承擔著整個畫像平臺的畫像標簽體系的管理,以及標簽數(shù)據(jù)的存儲管理,以及寬表的建模。
畫像主題的數(shù)據(jù)源頭是各個底層的業(yè)務數(shù)據(jù)域,需要哪一個,可以從管理好的業(yè)務數(shù)據(jù)域里面對相應的數(shù)據(jù)進行提取和應用。這樣做的優(yōu)點是業(yè)務域的數(shù)據(jù)條理比較清晰,畫像主題的數(shù)據(jù)能夠統(tǒng)一管理,實現(xiàn)標簽體系和標簽底層數(shù)據(jù)的統(tǒng)一管理。
這是數(shù)據(jù)的存儲和生產(chǎn)應用規(guī)范,能夠在數(shù)據(jù)生產(chǎn)流程中形成這樣一個標準,能夠提升標簽生產(chǎn)的效率。在數(shù)倉建設,比如一些數(shù)據(jù)產(chǎn)品建設的時候,如果面臨這類問題,解決方案可以通用。
第二個經(jīng)驗實現(xiàn)了對我們畫像平臺標簽生產(chǎn)效率的支撐。?
(3)實踐 3:多業(yè)務標簽增量融合
?作為中臺型畫像平臺,我們會自己生產(chǎn)標簽,同時各個業(yè)務線也有基于中臺或者基于自建的數(shù)據(jù)平臺定制化標簽生產(chǎn)的訴求。各個業(yè)務線生產(chǎn)的標簽能否在畫像平臺中使用呢?
我們的第三個經(jīng)驗就是能夠支持多業(yè)務標簽在畫像平臺里面做增量融合。如上圖的左面部分所示,數(shù)倉里面有各個業(yè)務自己的數(shù)據(jù)域里面的數(shù)據(jù),都做了數(shù)層分層管理和寬表建模的建設,業(yè)務開發(fā)同學或者產(chǎn)品同學基于建設好的數(shù)據(jù),在業(yè)務內可以做一些開發(fā)和標簽的生產(chǎn)。比如增長業(yè)務、基礎業(yè)務或者廣告商業(yè)化業(yè)務,用自己業(yè)務數(shù)據(jù)域的數(shù)據(jù),生產(chǎn)一些復雜的定制化的標簽。
在這個過程中,中臺側可以定義標簽生產(chǎn)和融合的規(guī)范:比如標簽生產(chǎn)的命名、準確性、覆蓋率以及標簽取值(碼值)需要符合哪些規(guī)范;然后標簽內容的存儲位置、存儲形式、存儲格式也有一定的規(guī)范。
業(yè)務線標簽生產(chǎn)完成后,中臺會有對應的標簽融合的任務,把業(yè)務生產(chǎn)的定制化標簽,自動融合到畫像主題。融合之后,還會觸發(fā)標簽的自動化管理,在標簽的體系中,把業(yè)務側生產(chǎn)的標簽也融合進去,做統(tǒng)一的管理。
這樣做的優(yōu)點是作為中臺,我們把畫像平臺的標簽生產(chǎn)能力開放給業(yè)務,能夠提升標簽的生產(chǎn)效率,也能夠給業(yè)務方的開發(fā)側或業(yè)務側進行賦能。?
(4)實踐 4:支持復合標簽
第四個是偏產(chǎn)品功能上的一個創(chuàng)新。在畫像平臺的迭代中發(fā)現(xiàn),用戶除了對一些簡單標簽的使用之外,在業(yè)務的精細化運營、精準營銷的過程中,對非常復雜的標簽的使用是很頻繁的,希望我們能夠對很復雜的篩選條件做支持,分更多的維度對篩選的用戶做不同維度的計算。
經(jīng)過這部分功能的提煉之后,我們發(fā)現(xiàn)可以通過面向特定業(yè)務的某一個用戶的行為去做一些符合標簽類型的支持。
上圖左面是我們畫像平臺后臺截的一個比較有代表性的例子,這里的標簽是近 90 天用戶消費和充值明細,它是對用戶近 90 天的行為做了維度的聚合,并且支持把篩選條件也糅合到標簽里面。我們在畫像后臺使用這個標簽的時候,就可以使用該標簽下面特定的條件做篩選,甚至做一些復雜的篩選條件。比如近 90 天的用戶,他的訂單日期相對于當前時間是大于 30 天的,然后訂單類型是充值類型,貨幣類型是人民幣,對這個人群的標簽,我們希望對它的金額維度做一個求和計算,得出求和后的結果,這是一個具體的例子。
它的優(yōu)點是提升了標簽計算的靈活性,能夠固化高復用的復雜標簽,降低開發(fā)成本。
對數(shù)據(jù)產(chǎn)品來說,需要對業(yè)務高頻的標簽使用場景有比較好的分析和洞察,才能夠提煉出他對復合標簽的真正訴求,從而把復合標簽提煉出來。所以復合標簽的生產(chǎn)需要,對產(chǎn)品側的業(yè)務理解和分析洞察能力要求比較高,但它確實可以大大降低開發(fā)成本,提高標簽的復用性,在業(yè)務側看來這個能力是很方便的,可以對篩選條件和維度做很靈活的篩選和統(tǒng)計分析。
三、快看畫像平臺應用案例
下面分享一下快看畫像平臺的應用案例,這里分享兩個例子。
1、案例一:助力精準營銷閉環(huán)
第一個案例是助力用戶充值付費業(yè)務線的精準營銷。精準營銷應用畫像平臺之后,流程形成了一個營銷的閉環(huán)。
(1)首先用戶可以基于畫像后臺去做人群包的篩選,對于不同的營銷活動,基于復合標簽或者特定標簽篩選出人群包。
(2)在運營后臺,對人群包以及投放的特定活動做相應的操作配置,運營后臺通過畫像平臺的功能 API 把相應的人群包或需要依賴的數(shù)據(jù)拉取到后臺,基于我們營銷后臺的能力,對特定的人群包做特定的分發(fā)和營銷活動的操作展示。
(3)對營銷活動的數(shù)據(jù)進行采集,生成 BI 報表。
(4)運營人員可以根據(jù) BI 報表中的指標數(shù)據(jù)觀察每一個營銷活動效果,根據(jù)效果的反饋,對自己的營銷活動方案或者對人群包去做出相應的調整或優(yōu)化。
這個閉環(huán),在付費會員側營銷活動中的使用目前已經(jīng)例行化了,也是使用畫像平臺的一個非常重的業(yè)務。上圖右側是在畫像平臺截取的一個篩選條件的截圖。
2、案例二:支持內容精準宣發(fā)
第二個案例是快看作為內容型的平臺產(chǎn)品使用畫像平臺進行內容精準宣發(fā)的例子。
精準宣發(fā)業(yè)務是指什么呢?比如有一個新的漫畫作品,平臺想給其作者一定的扶持,讓它的受眾用戶能夠快速觸達,從而能夠對這個作品產(chǎn)生興趣開始閱讀,給作者和作品積累一定的人氣。
這個操作過去經(jīng)常出現(xiàn)的情況會對所有的用戶做千人一面的分發(fā),所有的用戶看到的是同一個宣發(fā)的作品,這樣的做法,造成很多非受眾用戶也會看到,分發(fā)效率有很大的可提升空間。
使用這個畫像平臺,就一定程度上可以解決這個問題。宣發(fā)運營側對內容精準宣發(fā)的流程是什么?
(1)基于畫像平臺去圈選出特定內容偏好人群包。用戶閱讀打分類下的用戶標簽里面會有他的偏好,根據(jù)要宣發(fā)的漫畫作品的品類和特點去匹配相應偏好特征的人群包,運營后臺基于畫像平臺的功能 API 去獲取人群包。
(2)在運營后臺的配置中,配上相應的人群包和資源位,對該人群包的人群做定向的宣發(fā)。
(3)采集宣發(fā)的數(shù)據(jù),將相應的指標可視化。
(4)根據(jù) BI 報表的反饋和分析,驅動內容運營策做出相應的調整和優(yōu)化。
我們畫像平臺的功能是比較通用的,在廣告業(yè)務場景中以及渠道業(yè)務場景中,因為業(yè)務邏輯和流程的鏈路是非常長的,對畫像平臺的依賴會有很多偏定制化的需求。對于這樣的場景,建議在他們的廣告業(yè)務和渠道業(yè)務的數(shù)據(jù)平臺中去建立畫像模塊,這個畫像模塊可以和自己業(yè)務的數(shù)據(jù)產(chǎn)品做很重的耦合,因為它就是服務于該業(yè)務的。畫像模塊可以把中臺畫像產(chǎn)品的基礎能力甚至基礎數(shù)據(jù)進行打通應用,這樣可以極大提升畫像建設速度,同時不需要關注畫像是怎么生產(chǎn),畫像標簽是如何管理的,畫像的功能 API 是怎么樣的,只需使用可依賴的接口,把更多的精力去投入到自己業(yè)務側數(shù)據(jù)產(chǎn)品的流程和邏輯中。
四、總結和展望
最后介紹一下我們總結的一些經(jīng)驗,以及我們未來的發(fā)力方向。
經(jīng)驗總結有如下幾點:
(1)中臺型畫像,要重點關注業(yè)務側的通用訴求,做一些通用能力的提煉。
(2)大數(shù)據(jù)平臺、數(shù)倉建模和數(shù)據(jù)挖掘的基礎能力是畫像平臺的基本保障。這些能力是必備的,畢竟一旦涉及到畫像的話,數(shù)據(jù)量會比較大,用戶體量也比較大,對計算能力、數(shù)據(jù)采集、ETL 和建模能力的要求是很高的。使用的越重,這一側整個全鏈路的要求也會越高。
(3)畫像平臺的核心能力是人群圈選、計算、洞察、復雜標簽支持、標簽融合體系等。
未來展望有以下三點:
(1)加強標簽的系統(tǒng)性管理,自動創(chuàng)建的效率更高一些,目前有一些人工操作和干預。
(2)更完善的服務化能力建設。服務化是剛才提到的畫像平臺的功能 API 和查詢 API,服務的穩(wěn)定性保障以及響應及時性都有一些優(yōu)化空間。
(3)實時畫像與離線畫像融合。目前實時畫像的應用場景比離線畫像要少很多,但未來實時畫像的應用會越來越多,因為現(xiàn)在大家已經(jīng)不太滿足于 T+1 小時這樣的數(shù)據(jù)產(chǎn)出效率了,更希望在分鐘以內的延遲生產(chǎn)實時畫像。后面我們會加強實時能力,并與離線畫像進行一些融合。
五、問答環(huán)節(jié)
Q1:底層用戶 ID 生成的規(guī)則能不能分享一下?
A1:由于信息比較敏感,可以大概的說一下。
ID 的生成規(guī)則,最基礎依賴是先要把所有的 ID 收集上來。需要首先和法務、用戶產(chǎn)品側去討論可以收集哪些 ID,因為不同產(chǎn)品的定位不同,能收集的 ID 也不一樣。
確定了能收集的 ID之后,需要思考的第二個問題是不同的 ID 的變更頻次也即它的可靠性是怎么樣的?首先安卓和 IOS 是有區(qū)別的,然后安卓和 IOS 內部每一個 ID 的變更頻次或可靠性也是不一樣的,這里建議優(yōu)先使用內部采集的 ID,對內部采集的 ID 優(yōu)先使用可靠性更高、變更頻次更低的。
如果可靠性更高的 ID 是空的或者有問題,再去找次優(yōu)的可靠性低一些的 ID,經(jīng)過這樣的一個優(yōu)先級的次序去逐步判斷每一個 ID 在我們的 ID 庫里面是否存在過,和我們已有的唯一設備是否有某一個 ID 的重合,這個是做設備唯一識別的一個很重要的點。
使用內部采集的 ID 做完優(yōu)先級的判斷之后,如果我們還采用了第三方的反作弊平臺,最后可以使用第三方反作弊平臺向我們開放他們內部的唯一 ID。我們使用他們的內部唯一 ID,在我們存下來的外部 ID 里面做去重判斷,對我們自建 ID 的邏輯進行補充。基本上是以這樣流程逐漸的積累。
ID 體系的建立,除了剛才提到的采集和規(guī)則的判斷,很重要的一點就是如何把歷史設備的信息回溯重建,因為歷史設備信息也是需要基于同樣的體系構建出來的,這是一個難點。
另外就是如何能夠持續(xù)積累,并且唯一 ID 如何能夠在設備上逐漸提升覆蓋率,只有有了足夠的覆蓋率之后,在公司內部才能產(chǎn)生足夠多的應用場景,覆蓋度不高的話,很多業(yè)務沒有辦法直接使用這個唯一 ID。
Q2:快看漫畫平臺是如何防止過度打擾用戶的?
A2:這個很依賴運營策略,體現(xiàn)了運營策略對于精細化的運營是如何理解的。重要的一點就是如何判斷運營策略是有效的,同時也不過度影響用戶。
我自己的一個經(jīng)驗是這樣的,對運營部門的精細化運營策略或者階段性的目標做評估的話,從這個部門的角度,可以建立一個完整的運營策略評估指標體系,而不是只看運營策略的直接效果指標。
比如通過 PUSH 希望能夠提升用戶的點擊率,提升用戶的每天打開人數(shù)。如果只看這個的話,通過 PUSH 頻次的提升,或者對 PUSH 的文案做一些技巧性的優(yōu)化,是很有可能帶來效果的。但是如何減少對用戶的打擾,對 PUSH 的場景來說,需要加一些圍欄指標,就是限制指標,PUSH 不能夠導致圍欄指標的下降。比如用戶對 PUSH 打開的長留(長期留存),比如接收到這樣 PUSH 消息之后,對用戶 PUSH 的觸達率是否有影響。如果 PUSH 經(jīng)常推垃圾消息或者說很有欺騙性、誘導性的文案,但用戶又感受不到實際的信息和價值,那么他后面可能就把 PUSH 消息接收關掉了或者說根本不看了,這樣肯定會影響未來的觸達以及 PUSH 點擊的一個長期留存。
所以我建議如果要減少用戶的打擾,我們沒有辦法從全局去求每一個策略都考慮得非常深,而且也不可能盯得太細,但是我們可以用一些圍欄指標去限制運營側的人員去深度思考后再做出精細化運營策略的制定和執(zhí)行,可能效果會好一些。
Q3:公司從 0 到 1 搭建畫像平臺,標簽體系初期構建的時候有什么需要提前注意的點嗎?
A3:我可以大概的積累一下可能會有哪些方面我們踩過的坑。
首先從 0 到 1 去建設,一定會伴隨著你對業(yè)務的逐步的理解,以及業(yè)務訴求方面的積累。
如果我們是一個中臺側,對于單個業(yè)務提的需求,我們需要能夠有一定的宏觀視角去看,它是屬于畫像平臺的哪些能力,或者說標簽體系的哪一部分有這樣的訴求,他的訴求是長期的需求,還是短期的需求。對于我們是要構建一個長期的能力支持,還是臨時性的一個支持,這個分析是蠻重要的。這對于我們畫像平臺的一些需求能力的提煉是一個逐漸的積累的過程。前期在對接單個業(yè)務的時候,從整個數(shù)據(jù)中臺側我們產(chǎn)品同學在遇到這類需求的時候,可以適當?shù)目紤]用一些臨時性的方案去支持臨時性的需求,然后業(yè)務的臨時性需求,有了一定的固定頻次去對接的時候,再去思考如何將它固化下來,以及是否適合固化到畫像平臺里面。
有一個經(jīng)驗就是多個業(yè)務線里面和用戶相關的需求,在前期都可以往畫像平臺構建的能力上多去思考能不能去做一些支持的。如果單個業(yè)務有很頻繁的對用戶這方面的一些畫像并且比較固化,畫像平臺的建設就可以逐步啟動去支持了。
從產(chǎn)品側我們還需要考慮的一點,大數(shù)據(jù)平臺、數(shù)倉建模和數(shù)據(jù)挖掘基礎能力,是畫像平臺的基本保障。在有了一個通用或者需要固化的需求之后,我們對產(chǎn)品也有了初步的思考和設計,我們還要從底層思考我們當前有沒有這樣的數(shù)據(jù)能力去支撐我們去做畫像平臺的建設,需要和開發(fā)側去做方向或者目標的討論,看他們能不能提供相應的能力和人員的支持。
這可能是從 0 到 1 搭建的時候,對外以及對內的數(shù)據(jù)側需要討論的。
如果我們屬于業(yè)務部門,想從 0 到 1 搭建畫像平臺,標簽體系的話有什么要注意的點?我個人覺得如果這個業(yè)務是有一定規(guī)模的,包括人的規(guī)模以及業(yè)務體量都比較大的話,才是業(yè)務線內搭建畫像平臺的一個起點或者基礎。在搭建畫像平臺的時候,思路就不是做一個大而全的畫像平臺,可能要先跑一些畫像平臺的功能性的 MVP。畫像平臺哪個能力目前需求是最強烈的,用戶的使用會是最頻繁的,我們先把這個功能性的 MVP 跑通,這是我們業(yè)務內去搭建的一個原則。
在業(yè)務內搭建的時候可以多和運營系統(tǒng)或者數(shù)據(jù)后臺多做一些聯(lián)動,去看看有沒有產(chǎn)品已經(jīng)有了類似的能力或者規(guī)劃,如果有能力有規(guī)劃的話,我們和他們一起去分析,這樣的產(chǎn)品能力在哪做更合適,和哪些平臺打通交互,各自該如何定位。這些討論清楚也是我們從 0 到 1 計劃去搭建畫像平臺的一個基礎。
另外業(yè)務內也非常需要關注業(yè)務內現(xiàn)有的數(shù)據(jù)能力,我們平臺能力是否足夠完善,否則可能我們做完了產(chǎn)品方面的思考規(guī)劃之后,發(fā)現(xiàn)項目沒法啟動,因為開發(fā)人力或者數(shù)據(jù)基礎是不足的。
這是我覺得起步階段可能需要注意的一些點,包括我們過去也踩過一些坑。
Q4:H5 的 Cookie ID 是否可以作為用戶標識,基于 Cookie ID 的標簽計算是不是有意義?
A4:我們的很多活動都是基于 H5 做的,因為 H5 的開發(fā)短平快,一個活動下線之后也就不再用了,做到 APP 里面成本會高,H5 的開發(fā)效率會更高,迭代速度也會更快。但它的一個問題就是 Cookie ID 的變更會很頻繁,而且 H5 頁面現(xiàn)在會面臨一個難題,現(xiàn)在很多 APP 內嵌了瀏覽器,很多 H5 頁面在自己內嵌的瀏覽器打開之后,在自己的瀏覽器里面很可能是有特定的 Cookie ID 的,那么對于同一個頁面同一個設備,我用 UC、用百度、用微信、用釘釘打開,它的 Cookie ID 很可能是有很大差異的,或者根本就不一樣,我們用 Cookie ID 去唯一標識這個設備的話,幾乎是不可能的。
快看 APP 內嵌的 H5,我們有一套機制,H5 和我們安卓 /IOS 做信息接口的打通,把我們設備層面的 ID 一定要傳到 APP 內嵌的 H5 上。這樣,我們內嵌的 H5 的活動也好,或者說各種頁面,上報的很多信息,其實都是攜帶了我們的設備 ID 的,設備 ID 會比 Cookie ID 的穩(wěn)定性要高很多。甚至我們自建的 KKDID 都可以傳上來,當然這個依賴你們有沒有自建的 ID,它的穩(wěn)定性會更高。
對于很多快看 APP 外的 H5 頁面,沒有我們的設備 ID 可以獲取。像小程序會好一些,對直接使用它的 Open ID,每個小程序都有自己的 Open ID 體系,都是可以獲取的,作為匿名用戶的一個標識是可以的。
但是對非小程序類的采集就會很難,個人經(jīng)驗,PC Web 或者 H5 頁面,它的用戶的訪問習慣是用完即走的,包括你的活動應該基本上也都是短期的。所以我覺得這類活動,我們的目標前期不要設置成期望用戶多么頻繁,有多么高留存,有次日、7 日、14 日都能夠使用我的 H5 頁面。我們更多的可以在用戶首次訪問的時候,就抓住用戶,激活他的興趣,從而把他引導到我們的 APP,這是可以重點考慮的方向。因為不管是 PC Web 還是 H5,目前所有的數(shù)據(jù)平臺都是一個難題,你包括友盟也好、百度統(tǒng)計也好,他們對于這種 Web 類頁面的用戶識別以及用戶的一個累積,歷史用戶的識別都不重視,也沒有這樣的能力,所以我建議自建數(shù)據(jù)產(chǎn)品的時候,也可以吸取比較好的經(jīng)驗,不用過度的去想 H5 頁面在站外的唯一用戶標識,以及后續(xù)如何長期去做用戶的識別,做精準分發(fā)。我覺得這個可能是一個行業(yè)難題。
Q5:人群效果是針對單個業(yè)務場景的回收,還是已經(jīng)做了通用功能,所有的場景都能用呢?
A5:對于快看中臺的畫像產(chǎn)品,我們沒有做人群包應用效果的 track,因為每個人群包在業(yè)務內的使用場景以及使用邏輯,包括數(shù)據(jù)統(tǒng)計的指標以及報表展示的邏輯都會有挺大差異的,通用能力很難提煉。當然會有一些很基礎的效果的展示,但是我覺得意義并不大,對業(yè)務來說你給我了我也用不到,我更想看的是這個人群包在業(yè)務場景中,精細化的每一個關鍵鏈路的轉化漏斗也好,各種人群行為分析也好,做一個更精細深層次的洞察,這不是中臺型畫像產(chǎn)品能提供的,所以我們是沒做這個能力的。
如果想對你們的精細化運營效果做精準 track 的話,根據(jù)快看數(shù)據(jù)中臺產(chǎn)品側的經(jīng)驗,其實可以從分析師和數(shù)據(jù)產(chǎn)品側協(xié)作,去把你們特定的營銷活動的整個的數(shù)據(jù)產(chǎn)品側的邏輯梳理一下,然后用 BI 報表或者說自建報表的形式,把它的整個分析模型以及它的核心指標固化下來,這個可能是一個更有效的一種手段。
Q6:人群精細化運營中人群的覆蓋度和準確率是如何進行平衡的?
A6:這個應該是基于精細化運營在業(yè)務側應用的角度去問我們如何去做人群圈選,能夠對我們精細化運營的這些活動或者場景產(chǎn)生更高的準確性,同時就是整體的運營效果會更好。
所謂的精細化運營,他一定會越做越細,我們能夠在我們運營的過程中逐漸發(fā)現(xiàn)人群里面存在的規(guī)律,就是哪一類人有什么樣的規(guī)律,這些規(guī)律會以什么樣的規(guī)則去確定下來這一人群,它是一個應該越做越細的過程。
為什么會需要這樣?因為精細化運營如果始終處于某一個用戶運營的力度上,就會眉毛胡子一把,始終在這個力度上,我們對人群的區(qū)分始終不會做得更細。我們很多活動的策略,針對的人群不一定是它非常精準的受眾人群,所以效果可能會存在一定的瓶頸。
我個人的經(jīng)驗就是我們在運營的過程中,對每次精細化運營效果,人群投放效果多做一些分析,為什么有的投放沒有效果,這部分沒有效果的人群和有效果的人群,有一些什么樣的差異。我們找到的差異就是我們下次精細化運營投放的時候,篩選人群包可以多加的規(guī)則,下次投放的時候加上這些篩選規(guī)則,人群的投放會更加的精準,效果也會好一些,轉化率也會高一些,業(yè)務的指標可能也會更高。
這里面又引出一個問題,我們做的越來越細的話,這些人群的一個覆蓋率就變低了,我們活動效果的總 UV 或者說我們的總的 GMV 或者總收入下降了,這也不是我們想要的效果。
能不能平衡?其實我覺得做的越細和覆蓋率指標它不是矛盾的,首先做細的過程中,會逐漸細化出越來越多的人群包,不僅是對原來的人群包加條件讓這個人群包越來越小,而且是創(chuàng)建越來越多精細化的人群包。一個好的方向,用戶存在的特征,我們認識的越來越細,通過這些特征我們篩選的人群包越來越精準,數(shù)量越來越多,當然最好他們之間的重合度會低一些。不同的人群包之間是明顯的特征差異,可以針對他們做更加有效的策略的制定和投放。這樣我們就能夠兼顧用戶人群的覆蓋性以及策略的有效性。
今天的分享就到這里,謝謝大家。