自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

手把手教你做用戶畫像:三種標(biāo)簽類型、八大系統(tǒng)模塊

大數(shù)據(jù) 數(shù)據(jù)分析
在互聯(lián)網(wǎng)步入大數(shù)據(jù)時代后,用戶行為給企業(yè)的產(chǎn)品和服務(wù)帶來了一系列的改變和重塑,其中最大的變化在于,用戶的一切行為在企業(yè)面前是可“追溯”“分析”的。

[[427098]]

在互聯(lián)網(wǎng)步入大數(shù)據(jù)時代后,用戶行為給企業(yè)的產(chǎn)品和服務(wù)帶來了一系列的改變和重塑,其中最大的變化在于,用戶的一切行為在企業(yè)面前是可“追溯”“分析”的。企業(yè)內(nèi)保存了大量的原始數(shù)據(jù)和各種業(yè)務(wù)數(shù)據(jù),這是企業(yè)經(jīng)營活動的真實記錄,如何更加有效地利用這些數(shù)據(jù)進(jìn)行分析和評估,成為企業(yè)基于更大數(shù)據(jù)量背景的問題所在。

隨著大數(shù)據(jù)技術(shù)的深入研究與應(yīng)用,企業(yè)的關(guān)注點(diǎn)日益聚焦在如何利用大數(shù)據(jù)來為精細(xì)化運(yùn)營和精準(zhǔn)營銷服務(wù),而要做精細(xì)化運(yùn)營,首先要建立本企業(yè)的用戶畫像。

一、用戶畫像是什么

用戶畫像,即用戶信息標(biāo)簽化,通過收集用戶的社會屬性、消費(fèi)習(xí)慣、偏好特征等各個維度的數(shù)據(jù),進(jìn)而對用戶或者產(chǎn)品特征屬性進(jìn)行刻畫,并對這些特征進(jìn)行分析、統(tǒng)計,挖掘潛在價值信息,從而抽象出用戶的信息全貌,如圖1所示。

▲圖1 某用戶標(biāo)簽化

用戶畫像可看作企業(yè)應(yīng)用大數(shù)據(jù)的根基,是定向廣告投放與個性化推薦的前置條件,為數(shù)據(jù)驅(qū)動運(yùn)營奠定了基礎(chǔ)。由此看來,如何從海量數(shù)據(jù)中挖掘出有價值的信息越發(fā)重要。

大數(shù)據(jù)已經(jīng)興起多年,其對于互聯(lián)網(wǎng)公司的應(yīng)用來說已經(jīng)如水、電、空氣對于人們的生活一樣,成為不可或缺的重要組成部分。從基礎(chǔ)設(shè)施建設(shè)到應(yīng)用層面,主要有數(shù)據(jù)平臺搭建及運(yùn)維管理、數(shù)據(jù)倉庫開發(fā)、上層應(yīng)用的統(tǒng)計分析、報表生成及可視化、用戶畫像建模、個性化推薦與精準(zhǔn)營銷等應(yīng)用方向。

很多公司在大數(shù)據(jù)基礎(chǔ)建設(shè)上投入很多,也做了不少報表,但業(yè)務(wù)部門覺得大數(shù)據(jù)和傳統(tǒng)報表沒什么區(qū)別,也沒能體會大數(shù)據(jù)對業(yè)務(wù)有什么幫助和價值,究其原因,其實是“數(shù)據(jù)靜止在數(shù)據(jù)倉庫,是死的”。

而用戶畫像可以幫助大數(shù)據(jù)“走出”數(shù)據(jù)倉庫,針對用戶進(jìn)行個性化推薦、精準(zhǔn)營銷、個性化服務(wù)等多樣化服務(wù),是大數(shù)據(jù)落地應(yīng)用的一個重要方向。數(shù)據(jù)應(yīng)用體系的層級劃分如圖2所示。

▲圖2 數(shù)據(jù)應(yīng)用體系的層級劃分

二、用戶畫像的3種標(biāo)簽類型

用戶畫像建模其實就是對用戶“打標(biāo)簽”,從對用戶打標(biāo)簽的方式來看,一般分為3種類型:①統(tǒng)計類標(biāo)簽;②規(guī)則類標(biāo)簽;③機(jī)器學(xué)習(xí)挖掘類標(biāo)簽。

下面我們介紹這3種類型的標(biāo)簽的區(qū)別:

1. 統(tǒng)計類標(biāo)簽

這類標(biāo)簽是最為基礎(chǔ)也最為常見的標(biāo)簽類型,例如,對于某個用戶來說,其性別、年齡、城市、星座、近7日活躍時長、近7日活躍天數(shù)、近7日活躍次數(shù)等字段可以從用戶注冊數(shù)據(jù)、用戶訪問、消費(fèi)數(shù)據(jù)中統(tǒng)計得出。該類標(biāo)簽構(gòu)成了用戶畫像的基礎(chǔ)。

2. 規(guī)則類標(biāo)簽

該類標(biāo)簽基于用戶行為及確定的規(guī)則產(chǎn)生。例如,對平臺上“消費(fèi)活躍”用戶這一口徑的定義為“近30天交易次數(shù)≥2”。在實際開發(fā)畫像的過程中,由于運(yùn)營人員對業(yè)務(wù)更為熟悉,而數(shù)據(jù)人員對數(shù)據(jù)的結(jié)構(gòu)、分布、特征更為熟悉,因此規(guī)則類標(biāo)簽的規(guī)則由運(yùn)營人員和數(shù)據(jù)人員共同協(xié)商確定;

3. 機(jī)器學(xué)習(xí)挖掘類標(biāo)簽

該類標(biāo)簽通過機(jī)器學(xué)習(xí)挖掘產(chǎn)生,用于對用戶的某些屬性或某些行為進(jìn)行預(yù)測判斷。例如,根據(jù)一個用戶的行為習(xí)慣判斷該用戶是男性還是女性、根據(jù)一個用戶的消費(fèi)習(xí)慣判斷其對某商品的偏好程度。該類標(biāo)簽需要通過算法挖掘產(chǎn)生。

在項目工程實踐中,一般統(tǒng)計類和規(guī)則類的標(biāo)簽即可以滿足應(yīng)用需求,在開發(fā)中占有較大比例。機(jī)器學(xué)習(xí)挖掘類標(biāo)簽多用于預(yù)測場景,如判斷用戶性別、用戶購買商品偏好、用戶流失意向等。一般地,機(jī)器學(xué)習(xí)標(biāo)簽開發(fā)周期較長,開發(fā)成本較高,因此其開發(fā)所占比例較小。

三、用戶畫像8大系統(tǒng)模塊及解決方案

搭建一套用戶畫像方案整體來說需要考慮8個模塊的建設(shè),如圖3所示。

▲圖3 用戶畫像主要覆蓋模塊

用戶畫像基礎(chǔ):需要了解、明確用戶畫像是什么,包含哪些模塊,數(shù)據(jù)倉庫架構(gòu)是什么樣子,開發(fā)流程,表結(jié)構(gòu)設(shè)計,ETL設(shè)計等。這些都是框架,大方向的規(guī)劃,只有明確了方向后續(xù)才能做好項目的排期和人員投入預(yù)算。這對于評估每個開發(fā)階段重要指標(biāo)和關(guān)鍵產(chǎn)出非常重要。

數(shù)據(jù)指標(biāo)體系:根據(jù)業(yè)務(wù)線梳理,包括用戶屬性、用戶行為、用戶消費(fèi)、風(fēng)險控制等維度的指標(biāo)體系。

標(biāo)簽數(shù)據(jù)存儲:標(biāo)簽相關(guān)數(shù)據(jù)可存儲在Hive、MySQL、HBase、Elasticsearch等數(shù)據(jù)庫中,不同存儲方式適用于不同的應(yīng)用場景。

標(biāo)簽數(shù)據(jù)開發(fā):用戶畫像工程化的重點(diǎn)模塊,包含統(tǒng)計類、規(guī)則類、挖掘類、流式計算類標(biāo)簽的開發(fā),以及人群計算功能的開發(fā),打通畫像數(shù)據(jù)和各業(yè)務(wù)系統(tǒng)之間的通路,提供接口服務(wù)等開發(fā)內(nèi)容。

開發(fā)性能調(diào)優(yōu):標(biāo)簽加工、人群計算等腳本上線調(diào)度后,為了縮短調(diào)度時間、保障數(shù)據(jù)的穩(wěn)定性等,需要對開發(fā)的腳本進(jìn)行迭代重構(gòu)、調(diào)優(yōu)。

作業(yè)流程調(diào)度:標(biāo)簽加工、人群計算、同步數(shù)據(jù)到業(yè)務(wù)系統(tǒng)、數(shù)據(jù)監(jiān)控預(yù)警等腳本開發(fā)完成后,需要調(diào)度工具把整套流程調(diào)度起來。

用戶畫像產(chǎn)品化:為了能讓用戶數(shù)據(jù)更好地服務(wù)于業(yè)務(wù)方,需要以產(chǎn)品化的形態(tài)應(yīng)用在業(yè)務(wù)上。產(chǎn)品化的模塊主要包括標(biāo)簽視圖、用戶標(biāo)簽查詢、用戶分群、透視分析等。

用戶畫像應(yīng)用:畫像的應(yīng)用場景包括用戶特征分析、短信、郵件、站內(nèi)信、Push消息的精準(zhǔn)推送、客服針對用戶的不同話術(shù)、針對高價值用戶的極速退貨退款等VIP服務(wù)應(yīng)用。

四、一款用戶畫像產(chǎn)品是什么樣的?

開發(fā)畫像后的標(biāo)簽數(shù)據(jù),如果只是“躺在”數(shù)據(jù)倉庫中,并不能發(fā)揮更大的業(yè)務(wù)價值。只有將畫像數(shù)據(jù)產(chǎn)品化后才能更方便業(yè)務(wù)方的使用。這里簡要介紹用戶畫像產(chǎn)品化后,主要可能涵蓋到的功能模塊,以及這些功能模塊的應(yīng)用場景。

畫像產(chǎn)品按常見的功能來看,主要包括標(biāo)簽視圖與即時查詢,用戶分群,用戶人群透視分析,對用戶從事件、留存、漏斗、分布等多維度展開的深入交互式分析等模塊。下面詳細(xì)介紹畫像的產(chǎn)品形態(tài)。

1. 標(biāo)簽視圖與查詢

標(biāo)簽視圖與查詢功能主要面向業(yè)務(wù)人員使用,如圖4所示。

▲圖4

在標(biāo)簽視圖版塊中,層級化地展示了目前已經(jīng)上線使用的全部用戶標(biāo)簽。用戶可以層級化地通過點(diǎn)擊標(biāo)簽,查看每個標(biāo)簽的詳細(xì)介紹。

在圖4中,當(dāng)點(diǎn)擊“用戶屬性”這個一級類目,可進(jìn)入到“自然性別”“購物性別”“用戶價值”等二級類目,點(diǎn)擊“自然性別”二級類目,可看到展開的“男性”“女性”三級標(biāo)簽,進(jìn)一步點(diǎn)擊三級標(biāo)簽“男性”或是“女性”,可以進(jìn)入查看該標(biāo)簽的詳細(xì)介紹,如圖5所示。

▲圖5

在該標(biāo)簽詳情頁中,可以查看人口屬性這一個類目下面的各個標(biāo)簽覆蓋用戶量情況。

每天通過對標(biāo)簽的覆蓋用戶量進(jìn)行監(jiān)控,可以作為預(yù)警使用。例如:某天某個標(biāo)簽的覆蓋用戶量與前一天相比出現(xiàn)了很大比例的波動,需要排查該標(biāo)簽當(dāng)日ETL作業(yè)是否出現(xiàn)異?;蚴欠褚驑I(yè)務(wù)上的操作導(dǎo)致標(biāo)簽量級的波動。

在標(biāo)簽查詢模塊中,通過輸入用戶對應(yīng)的userid或cookieid,可以查看該用戶的屬性信息、行為信息、風(fēng)控屬性等多維度的信息,從多方位了解一個用戶的特征。

2. 用戶人群功能

用戶人群功能主要面向業(yè)務(wù)人員使用。產(chǎn)品經(jīng)理、運(yùn)營、客服等業(yè)務(wù)人員在應(yīng)用標(biāo)簽時,可能不僅僅只查看某一個標(biāo)簽對應(yīng)的人群情況,更多地可能需要組合多個標(biāo)簽來滿足其在業(yè)務(wù)上對人群的定義。

例如:組合“近30日購買次數(shù)”大于3次和“高活躍”“女性”用戶這三個標(biāo)簽進(jìn)行定義目標(biāo)人群,查看該類人群覆蓋的用戶量,以及該部分人群的各維度特征。下面介紹產(chǎn)品上的實現(xiàn)方式。

在“用戶人群”版塊下,點(diǎn)擊“新建人群”或編輯之前已添加的分組(如圖6),進(jìn)入詳情頁可自定義涵蓋某些標(biāo)簽的人群(如圖7)。

▲圖6 用戶自定義分群版塊

▲圖7 用戶自定義分群編輯

在自定義編輯用戶分群時,對于有統(tǒng)計值類型的標(biāo)簽,可以自定義篩選該標(biāo)簽的取值范圍,如上圖中“近30日購買次數(shù)”標(biāo)簽,業(yè)務(wù)人員可篩選該標(biāo)簽的數(shù)值。對于分類型標(biāo)簽,如上圖中“活躍度”標(biāo)簽,業(yè)務(wù)人員選中該標(biāo)簽即可圈出包含該標(biāo)簽的用戶。

“人群名稱”和“人群描述”表單用于業(yè)務(wù)人員描述該人群在業(yè)務(wù)上的定義,方便后續(xù)繼續(xù)查看、應(yīng)用該人群。

關(guān)于作者:趙宏田,資深大數(shù)據(jù)技術(shù)專家,先后在中國地質(zhì)大學(xué)(武漢)和武漢大學(xué)獲得工學(xué)和經(jīng)濟(jì)學(xué)雙學(xué)士學(xué)位。在大數(shù)據(jù)、數(shù)據(jù)分析和數(shù)據(jù)化運(yùn)營領(lǐng)域有多年的實踐經(jīng)驗,擅長Hadoop、Spark等大數(shù)據(jù)技術(shù),以及業(yè)務(wù)數(shù)據(jù)分析、數(shù)據(jù)倉庫開發(fā)、爬蟲、用戶畫像系統(tǒng)搭建等。

本文摘編自《用戶畫像:方法論與工程化解決方案》,經(jīng)出版方授權(quán)發(fā)布。

 

責(zé)任編輯:武曉燕 來源: 大數(shù)據(jù)DT
相關(guān)推薦

2017-05-18 12:45:35

數(shù)據(jù)分析數(shù)據(jù)理解數(shù)據(jù)

2025-04-08 08:28:13

RetrofitKtor網(wǎng)絡(luò)庫

2015-07-29 16:33:12

IOS半透明引導(dǎo)

2020-07-23 14:39:28

系統(tǒng)權(quán)限設(shè)計

2022-01-29 21:54:58

電商用戶數(shù)據(jù)

2022-01-08 20:04:20

攔截系統(tǒng)調(diào)用

2016-04-27 09:49:16

用戶模型產(chǎn)品總結(jié)

2021-12-28 08:38:26

Linux 中斷喚醒系統(tǒng)Linux 系統(tǒng)

2020-07-09 08:59:52

if else模板Service

2024-08-22 14:49:49

系統(tǒng)設(shè)計數(shù)據(jù)庫

2021-04-06 22:48:41

數(shù)據(jù)集工具Python

2021-07-14 09:00:00

JavaFX開發(fā)應(yīng)用

2011-01-10 14:41:26

2011-05-03 15:59:00

黑盒打印機(jī)

2011-03-28 16:14:38

jQuery

2021-12-15 08:49:21

gpio 子系統(tǒng)pinctrl 子系統(tǒng)API

2018-04-05 22:55:34

數(shù)據(jù)問答系統(tǒng)SQuAD

2021-02-26 11:54:38

MyBatis 插件接口

2011-02-22 13:46:27

微軟SQL.NET

2023-04-26 12:46:43

DockerSpringKubernetes
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號