58標(biāo)簽體系建設(shè)實(shí)踐
一、痛點(diǎn)及標(biāo)簽建設(shè)方案
我們先思考一個(gè)問(wèn)題,業(yè)務(wù)在怎樣的發(fā)展階段時(shí),需要建設(shè)標(biāo)簽體系?
1、怎樣的業(yè)務(wù)發(fā)展階段,需要建設(shè)標(biāo)簽體系?
不同規(guī)模、不同業(yè)務(wù)階段的企業(yè),對(duì)數(shù)據(jù)體系的需求不一樣,并不是所有企業(yè)都有必要建設(shè)標(biāo)簽體系。
業(yè)務(wù)在起步階段和初期增長(zhǎng)階段,粗放式的投放也能帶來(lái)較好的增長(zhǎng)和轉(zhuǎn)化,業(yè)務(wù)的訴求更傾向于有數(shù)可看。
在增長(zhǎng)轉(zhuǎn)成熟階段,隨著流量紅利的消失,增長(zhǎng)乏力的情況下,運(yùn)營(yíng)人員開(kāi)始探索以精細(xì)化運(yùn)營(yíng)的方式來(lái)提高 ROI,考慮在合適的時(shí)間、給合適的人群、推薦合適的內(nèi)容,從而提升用戶體驗(yàn)并帶來(lái)轉(zhuǎn)化。數(shù)據(jù)建設(shè)不僅需要滿足自助取數(shù)分析,也逐漸需要建設(shè)一些用戶標(biāo)簽表,滿足初期精細(xì)化運(yùn)營(yíng)的需要。
并且隨著各業(yè)務(wù)開(kāi)始開(kāi)展精細(xì)化運(yùn)營(yíng),標(biāo)簽體系的建設(shè)會(huì)逐步完善,數(shù)據(jù)團(tuán)隊(duì)也會(huì)建設(shè)標(biāo)簽平臺(tái)來(lái)提升標(biāo)簽接入的效率和標(biāo)簽質(zhì)量。
那建設(shè)標(biāo)簽過(guò)程中,會(huì)遇到什么問(wèn)題?有何解決方案?
2、標(biāo)簽建設(shè)過(guò)程中的問(wèn)題及方案
在標(biāo)簽體系建設(shè)的不同階段,會(huì)遇到一系列的問(wèn)題:
起步階段:數(shù)據(jù)質(zhì)量與數(shù)據(jù)應(yīng)用矛盾
在標(biāo)簽起步階段,數(shù)據(jù)開(kāi)發(fā)同學(xué)主要精力在于快速支持運(yùn)營(yíng)的標(biāo)簽需求,缺乏標(biāo)簽數(shù)據(jù)建設(shè)規(guī)范、應(yīng)用規(guī)范等設(shè)計(jì)。運(yùn)營(yíng)人員在標(biāo)簽應(yīng)用時(shí),存在標(biāo)簽含義和邏輯不清晰、標(biāo)簽覆蓋率不高、部分算法標(biāo)簽的準(zhǔn)確率低等問(wèn)題,導(dǎo)致運(yùn)營(yíng)人員不敢用,或是花較多時(shí)間去咨詢,費(fèi)時(shí)費(fèi)力。
增長(zhǎng)階段:標(biāo)簽權(quán)限管控與靈活便捷的矛盾
而隨著各業(yè)務(wù)線都在提標(biāo)簽需求,標(biāo)簽使用者越來(lái)越多,標(biāo)簽的應(yīng)用出口也隨之增多。對(duì)業(yè)務(wù)人員而言,標(biāo)簽屬于業(yè)務(wù)資產(chǎn),在運(yùn)營(yíng)過(guò)程中,需控制觸達(dá)用戶的頻次和方式,過(guò)多或是不當(dāng)觸達(dá)本業(yè)務(wù)用戶會(huì)損害用戶體驗(yàn),給業(yè)務(wù)線帶來(lái)?yè)p失。例如58車的業(yè)務(wù)希望做流量增長(zhǎng),希望交叉招聘用戶做營(yíng)銷活動(dòng),如圈選招聘7日活躍用戶,每天持續(xù)觸達(dá)車的落地頁(yè);這樣勢(shì)必會(huì)引起招聘業(yè)務(wù)運(yùn)營(yíng)的反對(duì),車業(yè)務(wù)每天觸達(dá)招聘的用戶,影響用戶體驗(yàn)。
因而需要?jiǎng)澐植煌瑯I(yè)務(wù)標(biāo)簽的歸屬,以及標(biāo)簽權(quán)限審批。但增加權(quán)限審批又會(huì)帶來(lái)新的問(wèn)題,增加了審批后,每次運(yùn)營(yíng)想要使用標(biāo)簽,都得找業(yè)務(wù)負(fù)責(zé)人審批,有時(shí)還需拉群溝通來(lái)申請(qǐng)權(quán)限,標(biāo)簽使用效率、便捷度大大降低。
成熟階段:標(biāo)簽價(jià)值與成本的矛盾
數(shù)據(jù)平臺(tái)上的標(biāo)簽越來(lái)越多,開(kāi)發(fā)上線了幾千個(gè)標(biāo)簽,占用了較多服務(wù)器存儲(chǔ)與計(jì)算資源,但平臺(tái)上真正在投入使用的標(biāo)簽只有幾百個(gè)。如何合理的評(píng)估標(biāo)簽的價(jià)值?如何提升高價(jià)值標(biāo)簽的使用率,下線低價(jià)值標(biāo)簽?
因而標(biāo)簽建設(shè)需要構(gòu)建結(jié)構(gòu)化、場(chǎng)景化、系統(tǒng)化的解決方案。
3、標(biāo)簽體系建設(shè)方案
58 大數(shù)據(jù)平臺(tái)支撐了租房、新房、招聘、新車、到家等十幾條業(yè)務(wù)線數(shù)據(jù),數(shù)據(jù)覆蓋了 58 APP、安居客 APP、小程序等多個(gè)終端,業(yè)務(wù)線較多,對(duì)接流程較為復(fù)雜。因而 58 在建設(shè)標(biāo)簽體系時(shí),采用組織協(xié)同+平臺(tái)建設(shè)+運(yùn)營(yíng)的方法。
組織協(xié)同層,大數(shù)據(jù)團(tuán)隊(duì)主要負(fù)責(zé)跟各業(yè)務(wù)線需求的對(duì)接、通用標(biāo)簽開(kāi)發(fā)、標(biāo)簽平臺(tái)能力的建設(shè)等;業(yè)務(wù)數(shù)據(jù)團(tuán)隊(duì)負(fù)責(zé)自助接入業(yè)務(wù)標(biāo)簽;運(yùn)營(yíng)團(tuán)隊(duì)負(fù)責(zé)提出需求以及標(biāo)簽權(quán)限審批。
平臺(tái)建設(shè)層,主要建設(shè)標(biāo)簽管理與分析平臺(tái),包含 ID 建模、標(biāo)簽建模、數(shù)倉(cāng)規(guī)范、元數(shù)據(jù)管理、權(quán)限管理、標(biāo)簽評(píng)估、標(biāo)簽推薦等能力。
在運(yùn)營(yíng)層,目前是由大數(shù)據(jù)團(tuán)隊(duì)統(tǒng)一梳理各業(yè)務(wù)線的標(biāo)簽應(yīng)用情況,形成精細(xì)化運(yùn)營(yíng)應(yīng)用案例集,供各業(yè)務(wù)線參考學(xué)習(xí)。
這里需要注意的是,在不同階段,大數(shù)據(jù)建設(shè)標(biāo)簽體系的側(cè)重點(diǎn)有所不同。
在起步階段和增長(zhǎng)階段主要目標(biāo)是提效,需要不斷提升標(biāo)簽質(zhì)量,保障標(biāo)簽的可用性;建設(shè)合理的標(biāo)簽權(quán)限管控、標(biāo)簽推薦能力,提升標(biāo)簽使用的易用性。
在成熟階段主要目標(biāo)是保障標(biāo)簽應(yīng)用價(jià)值增長(zhǎng)的同時(shí),進(jìn)行成本管控,做好標(biāo)簽全生命周期管理,評(píng)估標(biāo)簽價(jià)值,及時(shí)下線無(wú)用標(biāo)簽,釋放服務(wù)器存儲(chǔ)與計(jì)算資源。
4、標(biāo)簽建設(shè)架構(gòu)
在數(shù)據(jù)采集層,接入埋點(diǎn)數(shù)據(jù)、業(yè)務(wù)系統(tǒng)的表數(shù)據(jù)、日志數(shù)據(jù),以及第三方數(shù)據(jù),如個(gè)推數(shù)據(jù),跨越多個(gè)端、各個(gè)業(yè)務(wù)線,打破數(shù)據(jù)孤島。
在數(shù)據(jù)存儲(chǔ)與計(jì)算層,建設(shè)數(shù)倉(cāng)建模、用戶/客戶/企業(yè) ID 體系建模、標(biāo)簽體系建模規(guī)范,并支持?jǐn)?shù)據(jù)的離線和實(shí)時(shí)同步。
在標(biāo)簽平臺(tái)層,建設(shè)標(biāo)簽全生命周期管理,包含標(biāo)簽的接入生產(chǎn)、標(biāo)簽挖掘、元數(shù)據(jù)管理、標(biāo)簽下線、權(quán)限審批;以及標(biāo)簽評(píng)估分析能力,包含標(biāo)簽評(píng)分、標(biāo)簽推薦等能力。
這里需要注意的是:
- 盡可能全的采集數(shù)據(jù),對(duì)用戶畫(huà)像的刻畫(huà),十分依賴標(biāo)簽數(shù)據(jù)的覆蓋率,若是都采不到數(shù)據(jù),何談刻畫(huà)畫(huà)像?這也就比較依賴企業(yè)前期數(shù)倉(cāng)的建設(shè),需要規(guī)范 ods、dwd、dws、ads 層的建設(shè),將各個(gè)業(yè)務(wù)線的數(shù)據(jù)歸攏至數(shù)據(jù)中臺(tái),盡可能全的利用好企業(yè)內(nèi)部的數(shù)據(jù);若是企業(yè)內(nèi)部的數(shù)據(jù)不足的情況下,可考慮購(gòu)買第三方數(shù)據(jù),進(jìn)一步提升標(biāo)簽覆蓋率。
- 采集數(shù)據(jù)會(huì)涉及多端,如 app、pc、小程序,以及涉及多業(yè)務(wù),如房產(chǎn)、招聘等,要想盡可能的關(guān)聯(lián)多方數(shù)據(jù),需進(jìn)行ID體系的打通,包含userid(賬號(hào))、telep(手機(jī)號(hào))、imei(原生 Android 標(biāo)識(shí))、idfa(原生蘋(píng)果標(biāo)識(shí))、oaid(匿名設(shè)備標(biāo)識(shí))、openid(微信小程序標(biāo)識(shí))等
二、標(biāo)簽體系
1、標(biāo)簽建設(shè)痛點(diǎn)及方案
標(biāo)簽數(shù)據(jù)越建越多,運(yùn)營(yíng)人員在使用時(shí),會(huì)存在以下問(wèn)題:
標(biāo)簽分類不清晰,找不到對(duì)應(yīng)標(biāo)簽。例如房產(chǎn)、招聘等十幾個(gè)業(yè)務(wù)線的標(biāo)簽混在一起,用戶、客戶企業(yè)的標(biāo)簽也混在一起,難以查找。
標(biāo)簽建設(shè)時(shí)憑感覺(jué),較多標(biāo)簽無(wú)實(shí)際使用場(chǎng)景,上線后無(wú)人用。例如建設(shè)“房產(chǎn)-瀏覽商圈個(gè)數(shù)”標(biāo)簽,最開(kāi)始產(chǎn)品側(cè)認(rèn)為在做精細(xì)運(yùn)營(yíng)時(shí),可以圈選瀏覽商圈較多的用戶群,對(duì)其做觸達(dá)轉(zhuǎn)化。但后續(xù)發(fā)現(xiàn),在實(shí)際運(yùn)營(yíng)過(guò)程中,到不了這么細(xì)的場(chǎng)景,這類標(biāo)簽從上線以來(lái)就無(wú)人使用。
58 的標(biāo)簽體系建設(shè),以結(jié)構(gòu)化、場(chǎng)景化的方式建設(shè),保障標(biāo)簽建設(shè)的可拓展性、業(yè)務(wù)使用的易用性,以及應(yīng)用價(jià)值。
2、標(biāo)簽結(jié)構(gòu)化
標(biāo)簽結(jié)構(gòu)化建設(shè),按實(shí)體對(duì)象劃分,劃分為用戶、客戶、企業(yè)、帖子等實(shí)體對(duì)象。若是電商類業(yè)務(wù),較常劃分的是買家、賣家、商品;外賣業(yè)務(wù),常劃分為用戶、商戶、騎手等。
按業(yè)務(wù)劃分可劃分為1+N的模式,即1個(gè)通用中臺(tái)+N個(gè)業(yè)務(wù)的方式,例如劃分為通用、房產(chǎn)、招聘、車、本地服務(wù)等。將用戶的基礎(chǔ)信息類劃分在通用中,例如性別、年齡、預(yù)測(cè)傾向訪問(wèn)業(yè)務(wù)等,打通各個(gè)業(yè)務(wù)的數(shù)據(jù)源,提升標(biāo)簽的覆蓋率和準(zhǔn)確率;將業(yè)務(wù)線特有的數(shù)據(jù)歸攏至各個(gè)業(yè)務(wù),例如新房活躍用戶、招聘活躍用戶、二手車連接用戶等,方便業(yè)務(wù)運(yùn)營(yíng)人員使用,以及方便后續(xù)做權(quán)限管控。
按標(biāo)簽類型,以用戶標(biāo)簽為例,可劃分為基礎(chǔ)信息、行為偏好、個(gè)性化標(biāo)簽大類。基礎(chǔ)信息標(biāo)簽,用于描述用戶的基礎(chǔ)屬性,包含自然屬性、社會(huì)屬性、地理位置、設(shè)備信息等,例如常駐城市、設(shè)備型號(hào)、學(xué)歷。
行為偏好類標(biāo)簽,主要通過(guò)洞察用戶最近一段時(shí)間內(nèi)的各類行為,如訪問(wèn)、收藏、電話、IM、付費(fèi)等,進(jìn)一步提煉出用戶的需求。包含活躍行為、連接偏好、付費(fèi)交易、用戶分層等大類,例如用戶的訪問(wèn)活躍度、買房意向用戶、價(jià)格偏好等。
行為類標(biāo)簽在劃分時(shí),常見(jiàn)的問(wèn)題是業(yè)務(wù)側(cè)窮舉用戶行為路徑上的埋點(diǎn)行為數(shù)據(jù),都將其做成標(biāo)簽,例如瀏覽次數(shù)、瀏覽房源個(gè)數(shù)、收藏次數(shù)、IM次數(shù)、電話次數(shù)等,業(yè)務(wù)建設(shè)的出發(fā)點(diǎn)是好的,但業(yè)務(wù)運(yùn)營(yíng)實(shí)際使用時(shí)會(huì)遇到不知道怎么組合用、不知道用哪個(gè)標(biāo)簽的問(wèn)題。
因而,在搭建好標(biāo)簽結(jié)構(gòu),保障標(biāo)簽結(jié)構(gòu)上的可拓展性、分類清晰后,在開(kāi)發(fā)具體標(biāo)簽時(shí),需結(jié)合業(yè)務(wù)使用場(chǎng)景,以場(chǎng)景化的方式來(lái)建設(shè)。
3、標(biāo)簽場(chǎng)景化
場(chǎng)景化標(biāo)簽建設(shè),主要是指從標(biāo)簽的實(shí)際使用場(chǎng)景切入,拆分相關(guān)運(yùn)營(yíng)模型,從運(yùn)營(yíng)策略來(lái)倒推需要建設(shè)哪些標(biāo)簽數(shù)據(jù)。
日常運(yùn)營(yíng)常用的業(yè)務(wù)分析模型有 OSM 模型、AARRR 模型、用戶行為路徑、用戶分層、RFM模型等。
OSM 模型:即目標(biāo)、策略、度量,例如在促付費(fèi)的目標(biāo)下,運(yùn)營(yíng)人員通過(guò)制定給潛在用戶發(fā)送優(yōu)惠券的方式,提升付費(fèi)用戶數(shù)。
AARRR:即獲客、激活、留存、付費(fèi)、推薦,不同的階段對(duì)應(yīng)有不一樣的運(yùn)營(yíng)策略,對(duì)于成熟期的企業(yè)而言,各業(yè)務(wù)的運(yùn)營(yíng)重點(diǎn)更偏重于留存。
用戶行為路徑:是一種常用的用戶分析方法,數(shù)據(jù)產(chǎn)品在梳理埋點(diǎn)、指標(biāo)體系的時(shí)候會(huì)經(jīng)常用到,當(dāng)然標(biāo)簽體系的梳理也可采用該方法。不過(guò)注意點(diǎn)是統(tǒng)計(jì)用戶訪問(wèn)APP、訪問(wèn)詳情頁(yè)、點(diǎn)擊詳情頁(yè)、IM /電話點(diǎn)擊、購(gòu)買操作行為數(shù)據(jù)時(shí),需結(jié)合運(yùn)營(yíng)目標(biāo)(O)及策略(S),將其開(kāi)發(fā)為標(biāo)簽(M)。
用戶分層:很大程度上是AARRR與用戶行為路徑的結(jié)合體,劃分為潛在用戶、活躍用戶、連接用戶、付費(fèi)用戶。
RFM 模型:這是交易類業(yè)務(wù)下常用的客戶模型,以最近消費(fèi)時(shí)間、消費(fèi)頻次、消費(fèi)金額3個(gè)指標(biāo),劃分重要價(jià)值客戶、一般價(jià)值客戶、重要發(fā)展客戶、一般發(fā)展客戶、重要保持客戶、一般保持客戶、重要挽留客戶、一般挽留客戶 8 類群體。此處不做展開(kāi),詳情可查看草帽小子之前寫(xiě)的《標(biāo)簽體系》。
在標(biāo)簽體系構(gòu)建過(guò)程中,OSM 模型是基礎(chǔ),貫穿了構(gòu)建標(biāo)簽的各個(gè)階段,較為通用的 AARRR 模型、用戶行為路徑分析、用戶分層模型;特定業(yè)務(wù)模式下常用的是 RFM 模型。
具體這些業(yè)務(wù)模型如何應(yīng)用?我們先來(lái)看看實(shí)例。
4、場(chǎng)景化標(biāo)簽設(shè)計(jì)案例
業(yè)務(wù)背景:租房省心租是面向個(gè)人房東群體推出的VIP會(huì)員服務(wù),租房運(yùn)營(yíng)人員希望促進(jìn)個(gè)人房東購(gòu)買省心租套餐,提升付費(fèi)客戶數(shù)。
整體目標(biāo)是提升付費(fèi)客戶數(shù),拆分至拉新、促轉(zhuǎn)、留存/復(fù)購(gòu)的子目標(biāo)。
在拉新階段需要擴(kuò)曝光和提服務(wù),運(yùn)營(yíng)策略,在租房首頁(yè)活動(dòng)位/首頁(yè)加懸浮窗資源位,增加個(gè)性化租房首頁(yè)活動(dòng)位,針對(duì)“有出租需求的個(gè)人房東”展示省心租活動(dòng)、曝光更多房東;同時(shí)進(jìn)行push/短信推送,面向“房源上架 1、3、7、14 天但未出租成功的的個(gè)人房東”,推送消息
產(chǎn)品服務(wù)策略,增加房東推薦租客頁(yè)面,提供“高意向租客、本房源瀏覽用戶特征的價(jià)格偏好、戶型偏好”等信息,并上線個(gè)人用戶畫(huà)像服務(wù),包含個(gè)人意向價(jià)格、意向戶型、7 日活躍、連接次數(shù)、租房目的等數(shù)據(jù),幫助房東全方位了解租客。
促轉(zhuǎn)化階段,梳理省心租頁(yè)面轉(zhuǎn)化路徑,包含曝光、服務(wù)瀏覽、提交訂單、購(gòu)買等;
在留存階段,需促進(jìn)客戶升級(jí)套餐,針對(duì)購(gòu)買基礎(chǔ)版套餐用戶群,推送高級(jí)套餐介紹/優(yōu)勢(shì);促進(jìn)客戶續(xù)費(fèi)、復(fù)購(gòu),服務(wù)期內(nèi)提感知,機(jī)制推推送“新增推薦的租客”,提升房東對(duì)省心租服務(wù)的感知度;服務(wù)即將到期客戶促續(xù)費(fèi);服務(wù)已到期客戶召回。
整體策略構(gòu)建、標(biāo)簽構(gòu)建,以 OSM 模型為框架,劃分 AARRR 模型中的拉新、促轉(zhuǎn)、留存場(chǎng)景,結(jié)合用戶行為路徑分析方法,進(jìn)一步得到所需構(gòu)建的用戶、客戶、房源標(biāo)簽。
結(jié)構(gòu)化設(shè)計(jì)標(biāo)簽,邏輯結(jié)構(gòu)清晰,可拓展性強(qiáng),但容易與業(yè)務(wù)脫節(jié),不貼合業(yè)務(wù)實(shí)際使用場(chǎng)景;而場(chǎng)景化設(shè)計(jì)標(biāo)簽,貼合業(yè)務(wù)使用場(chǎng)景,使用率高,但比較零散,容易亂,因而需要采用“結(jié)構(gòu)化+場(chǎng)景化”的設(shè)計(jì)方法。
5、58標(biāo)簽體系
58標(biāo)簽體系,依照結(jié)構(gòu)化和場(chǎng)景化的建設(shè)原則,面向房產(chǎn)、招聘、車等各個(gè)業(yè)務(wù),構(gòu)建用戶標(biāo)簽、客戶標(biāo)簽、企業(yè)標(biāo)簽體系,建設(shè)了性別、職業(yè)、居住城市、瀏覽行為、價(jià)格偏好等上千個(gè)標(biāo)簽。
從標(biāo)簽結(jié)構(gòu)上也可以看出,不同實(shí)體對(duì)象標(biāo)簽數(shù)量不同,例如企業(yè)標(biāo)簽應(yīng)用場(chǎng)景較少,所需建設(shè)的數(shù)量也比較少,用戶標(biāo)簽一般建設(shè)的比較多,其匹配的用戶運(yùn)營(yíng)團(tuán)隊(duì)人員多、對(duì)應(yīng)的運(yùn)營(yíng)活動(dòng)也比較多。
梳理完用哪些標(biāo)簽后,接下來(lái)的建設(shè)重點(diǎn)就是標(biāo)簽開(kāi)發(fā)。
6、標(biāo)簽開(kāi)發(fā)類型
標(biāo)簽開(kāi)發(fā)類型,一般是數(shù)據(jù)產(chǎn)品和開(kāi)發(fā)人員關(guān)注的模塊。標(biāo)簽按統(tǒng)計(jì)方式分,可分為事實(shí)標(biāo)簽、規(guī)則標(biāo)簽、算法標(biāo)簽;按更新頻率來(lái)劃分,可分為離線標(biāo)簽、實(shí)時(shí)標(biāo)簽;按數(shù)據(jù)類型分類,可分為數(shù)值、字符串、字符串?dāng)?shù)組等;按維度分類,可分為單維標(biāo)簽、多維標(biāo)簽。
事實(shí)類標(biāo)簽是用戶畫(huà)像最基礎(chǔ)、最常見(jiàn)的標(biāo)簽,通常是基于原始數(shù)據(jù)清理后的歸類,用于描述客觀事實(shí)。例如,姓名、會(huì)員等級(jí)、終端類型、購(gòu)買次數(shù)、購(gòu)買金額等。
規(guī)則類標(biāo)簽,顧名思義,是基于確定的規(guī)則而產(chǎn)生。與事實(shí)類標(biāo)簽不同的是,規(guī)則類標(biāo)簽擁有更多的業(yè)務(wù)屬性,其業(yè)務(wù)規(guī)則需與業(yè)務(wù)人員共同制定。例如,將“活躍用戶”標(biāo)簽可定義為,“過(guò)去 30 天發(fā)生 a 行為 x 次”&“過(guò)去 30 天發(fā)生 b 行為 x 次”,進(jìn)行綜合評(píng)定。
算法類標(biāo)簽,基于現(xiàn)有事實(shí)及規(guī)則無(wú)法得出,導(dǎo)致標(biāo)簽的覆蓋率低,業(yè)務(wù)使用價(jià)值就大大降低,這時(shí)需要運(yùn)用決算法進(jìn)行數(shù)據(jù)挖掘與訓(xùn)練,得出標(biāo)簽預(yù)測(cè)結(jié)果。
7、性別標(biāo)簽
例如性別標(biāo)簽,需要綜合使用 58 底層的多個(gè)數(shù)據(jù)源,優(yōu)先取身份認(rèn)證數(shù)據(jù),其次取用戶填寫(xiě)的一些數(shù)據(jù)。
以上強(qiáng)認(rèn)證的數(shù)據(jù)均沒(méi)有的情況下,判斷有 APP 列表的用戶,基于相關(guān)特征,通過(guò)LR算法做分類預(yù)測(cè)。選取如用戶 5 年內(nèi)最新安裝的 APP 列表、表現(xiàn)類二級(jí)偏好、手機(jī)型號(hào)、操作系統(tǒng)等特征,進(jìn)行模型訓(xùn)練。預(yù)測(cè)的準(zhǔn)確率達(dá) 86.94%,性別標(biāo)簽的覆蓋率從 20%,提升至 74%。
但隨著個(gè)保法的頒布,獲取 APP 列表的數(shù)據(jù)逐漸下降,為進(jìn)一步提升標(biāo)簽覆蓋率,針對(duì)無(wú)法獲取 APP 列表的用戶性別預(yù)測(cè),根據(jù)用戶訪問(wèn)行為,針對(duì) 90 天內(nèi)看帖量>= 5的人群,采用 LR 算法進(jìn)行預(yù)測(cè),特征使用用戶看帖帖子內(nèi)容,帖子標(biāo)題,帖子一級(jí)表現(xiàn)類,帖子二級(jí)表現(xiàn)類。用帖子數(shù)據(jù)預(yù)測(cè)的準(zhǔn)確率為 73.7%,標(biāo)簽覆蓋率補(bǔ)充提升 5%。
三、標(biāo)簽管理平臺(tái)
1、標(biāo)簽建設(shè)痛點(diǎn)及方案
制定完標(biāo)簽規(guī)范和標(biāo)簽建設(shè)流程后,通過(guò)維護(hù)線上文檔的方式來(lái)指導(dǎo)建設(shè),存在標(biāo)簽質(zhì)量無(wú)法校驗(yàn)、標(biāo)簽權(quán)限申請(qǐng)麻煩、標(biāo)簽上下線管理混亂等問(wèn)題。建設(shè)標(biāo)簽管理與分析平臺(tái),提升標(biāo)簽的可用性、易用性和價(jià)值。
2、標(biāo)簽生命周期管理
構(gòu)建標(biāo)簽全生命周期管理與分析,以及標(biāo)簽權(quán)限管控能力。核心解決標(biāo)簽數(shù)據(jù)質(zhì)量、標(biāo)簽應(yīng)用質(zhì)量、標(biāo)簽安全問(wèn)題。
做好標(biāo)簽增、看、用、評(píng)、下,即標(biāo)簽接入、標(biāo)簽查看、標(biāo)簽使用、標(biāo)簽評(píng)估、標(biāo)簽下線全生命周期管理。構(gòu)建標(biāo)簽生產(chǎn)、元數(shù)據(jù)管理、標(biāo)簽市場(chǎng)、安全管理四類能力,進(jìn)行標(biāo)簽數(shù)據(jù)質(zhì)量、標(biāo)簽應(yīng)用價(jià)值兩類評(píng)估。
3、標(biāo)簽評(píng)估
標(biāo)簽數(shù)據(jù)質(zhì)量評(píng)估,包含標(biāo)簽的準(zhǔn)確性、標(biāo)簽覆蓋數(shù)、元數(shù)據(jù)的完備度。應(yīng)用價(jià)值評(píng)估,主要從標(biāo)簽使用度、關(guān)注度、標(biāo)簽應(yīng)用效果三方面評(píng)估。
例如,標(biāo)簽應(yīng)用價(jià)值總評(píng)分=權(quán)重*標(biāo)簽使用度評(píng)分 + 權(quán)重* 標(biāo)簽關(guān)注度評(píng)分 + 權(quán)重 *標(biāo)簽應(yīng)用效果評(píng)分。
標(biāo)簽使用度
標(biāo)簽使用度,用于表示標(biāo)簽在哪些地方使用,通常標(biāo)簽應(yīng)用的模塊,如人群圈選、人群分析、接口調(diào)用等。
標(biāo)簽使用度評(píng)分=權(quán)重*標(biāo)簽分析次數(shù)評(píng)分 +權(quán)重* 人群圈選次數(shù)評(píng)分+權(quán)重*接口調(diào)用次數(shù)評(píng)分
分析次數(shù)評(píng)分=標(biāo)簽被分析使用的日平均次數(shù)/(all 標(biāo)簽被分析的日 max 次數(shù)/ 100分)
標(biāo)簽關(guān)注度
標(biāo)簽關(guān)注度,用于表示使用者對(duì)標(biāo)簽的關(guān)注類操作,如查看、收藏、申請(qǐng)權(quán)限等。
標(biāo)簽關(guān)注度評(píng)分=權(quán)重*標(biāo)簽查看次數(shù)評(píng)分 + 權(quán)重* 收藏次數(shù)評(píng)分 + 權(quán)重 *申請(qǐng)權(quán)限次數(shù)評(píng)分
標(biāo)簽應(yīng)用效果
標(biāo)簽應(yīng)用效果,用于表示標(biāo)簽在實(shí)際場(chǎng)景應(yīng)用時(shí)的效果,如CTR等,需回收例如push、資源位平臺(tái)的效果數(shù)據(jù)。
標(biāo)簽應(yīng)用效果評(píng)分=標(biāo)簽 CTR/(all 標(biāo)簽 max CTR / 100分)
在標(biāo)簽使用時(shí),對(duì)標(biāo)簽展開(kāi)評(píng)估相當(dāng)重要,方便平臺(tái)方下線無(wú)用標(biāo)簽,同時(shí)也方便做一些熱門標(biāo)簽、優(yōu)質(zhì)標(biāo)簽的推薦。
4、標(biāo)簽平臺(tái)
構(gòu)建數(shù)據(jù)源接入和標(biāo)簽錄入能力,如規(guī)范標(biāo)簽命名、標(biāo)簽口徑、標(biāo)簽分類結(jié)構(gòu)、標(biāo)簽更新頻率等;增加標(biāo)簽接入審批能力,由平臺(tái)產(chǎn)品進(jìn)行審批,把控標(biāo)簽錄入質(zhì)量;并配置標(biāo)簽數(shù)據(jù)監(jiān)控,標(biāo)簽數(shù)據(jù)異常時(shí),能及時(shí)通知到對(duì)應(yīng)負(fù)責(zé)人。
從標(biāo)簽使用者視角,解決使用者在海量標(biāo)簽中,選取合適的標(biāo)簽的問(wèn)題。通過(guò)構(gòu)建標(biāo)簽地圖,支持快速檢索標(biāo)簽;通過(guò)構(gòu)建標(biāo)簽評(píng)分,評(píng)估標(biāo)簽的價(jià)值,從而進(jìn)一步進(jìn)行標(biāo)簽推薦。
四、小結(jié)
標(biāo)簽體系的建設(shè),需以實(shí)際業(yè)務(wù)應(yīng)用場(chǎng)景出發(fā),滿足業(yè)務(wù)使用的同時(shí),保障能力的可拓展性,使用的便捷性。以場(chǎng)景化、結(jié)構(gòu)化、系統(tǒng)化的方式,解決標(biāo)簽質(zhì)量、數(shù)據(jù)權(quán)限、標(biāo)簽下線的問(wèn)題。