自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

Qunar用戶畫像構(gòu)建策略及應(yīng)用實踐

大數(shù)據(jù)
目前Qunar用戶畫像數(shù)據(jù)倉庫中的數(shù)據(jù)源來自業(yè)務(wù)數(shù)據(jù)庫的數(shù)據(jù)和用戶行為日志數(shù)據(jù),目前數(shù)據(jù)倉庫中基本涵蓋了機票、酒店、火車票以及保險等業(yè)務(wù)系統(tǒng)的數(shù)據(jù),可以從全方位的了解去哪兒的一個用戶的畫像。

?[[182907]]?

1.用戶畫像的構(gòu)建原則

我們做用戶畫像的目的有兩個:

  1. 必須從業(yè)務(wù)場景出發(fā),解決實際的業(yè)務(wù)問題,之所以進行用戶畫像要么是獲取新用戶,或者是提升用戶體驗,或者是挽回流失用戶等有明確的業(yè)務(wù)目標 。
  2. 根據(jù)用戶畫像的信息做產(chǎn)品設(shè)計,必須要清楚知道用戶長什么樣子,有什么行為特征和屬性,這樣才能為用戶設(shè)計產(chǎn)品或開展營銷活動。

一般常見的錯誤想法是畫像維度的數(shù)據(jù)越多越好,畫像數(shù)據(jù)越豐富越好,費了很大的力氣進行畫像后,卻發(fā)現(xiàn)只剩下了用戶畫像,和業(yè)務(wù)相差甚遠,沒有辦法直接支持業(yè)務(wù)運營,投入精力巨大但是回報微小,可以說得不償失。鑒于此,我們的畫像的維度和設(shè)計原則都是緊緊跟著業(yè)務(wù)需求去推動。

2.用戶畫像數(shù)據(jù)倉庫構(gòu)建

2.1 數(shù)據(jù)源的集成

 

 

 

??

 

目前Qunar用戶畫像數(shù)據(jù)倉庫中的數(shù)據(jù)源來自業(yè)務(wù)數(shù)據(jù)庫的數(shù)據(jù)和用戶行為日志數(shù)據(jù),目前數(shù)據(jù)倉庫中基本涵蓋了機票、酒店、火車票以及保險等業(yè)務(wù)系統(tǒng)的數(shù)據(jù),可以從全方位的了解去哪兒的一個用戶的畫像。

2.2 我們有哪些數(shù)據(jù)?-數(shù)據(jù)維度 

 

 

??

 

2.3 我們有哪些數(shù)據(jù)?-數(shù)據(jù)倉庫

目前我們畫像數(shù)據(jù)倉庫的構(gòu)建都是基于Qunar基礎(chǔ)數(shù)據(jù)倉庫進行構(gòu)建,并按照維度進行劃分。 

 

 

?

目前數(shù)據(jù)倉庫中包括的信息如下:

  • 畫像數(shù)據(jù)倉庫表20個
  • 畫像數(shù)據(jù)倉庫
  • 國內(nèi)、國際 2年+數(shù)據(jù)
  • 標簽數(shù)據(jù)
  • 每日增量

–基本數(shù)據(jù)

–業(yè)務(wù)數(shù)據(jù)

–搜索

–Booking

2.4 用戶唯一標識設(shè)計

用戶唯一標識是整個用戶畫像的核心,它把從用戶開始使用app到下單到售后整個所有的用戶行為軌跡進行關(guān)聯(lián),可以更好的去跟蹤和描繪一個用戶的特征。

 

 

??

 

2.5 ETL過程設(shè)計-調(diào)度系統(tǒng)

  • 依賴數(shù)據(jù)平臺調(diào)度系統(tǒng)
  • 定時觸發(fā)和Job依賴觸發(fā)兩種模式

 

 

??

 

2.6 ETL過程設(shè)計-任務(wù)執(zhí)行

  • ETL的過程主要是將數(shù)據(jù)源的清洗到數(shù)據(jù)倉庫表的過程(每天更新增量)
  • Summary表的處理邏輯(每天更新全量)
  • 標簽庫的處理(每周更新,2年全量)

 

 

?

2.7 用戶主題分析及數(shù)據(jù)挖掘

有了豐富的畫像數(shù)據(jù)后,產(chǎn)品和運營人員可以根據(jù)用戶主題進行數(shù)據(jù)分析和數(shù)據(jù)挖掘相關(guān)的工作。用戶主題Cube的定義如下:

  • Measure:

–訂單數(shù)量

–訂單金額

–搜索次數(shù)

–Booking次數(shù)

  • Dimension:

–下單時間

–出發(fā)時間

–航司信息

–艙位信息

–航班(出發(fā)地、目的地)

–基本信息(年齡、性別等自然屬性) 

 

 

??

 

3.用戶畫像標簽構(gòu)建策略

3.1用戶標簽特征屬性

用戶的特征屬性可以是事實的,也可以是抽象的;可以是自然屬性,比如性別,年齡,星座等,可以是社會屬性,比如職業(yè),社交,出生地等;還可以是財富狀況,比如是否高收入人群,是否有豪車豪宅等固定資產(chǎn),對于機票用戶來講位置特征也是比較重要的屬性,比常駐地,常出差地,老家等。這些屬性都可以清楚的描繪一個用戶的畫像特征。 

 

 

?

  • 畫像標簽一般根據(jù)公司的業(yè)務(wù)體系來設(shè)計,存儲有HDFS,HBASE,ES
  • 標簽的更新頻率:每日更新,每周、每月更新
  • 標簽的生命周期:有的數(shù)據(jù)隨時間衰減迭代

3.2用戶標簽分類及特征項

提到用戶畫像就不得不提到一個詞“標簽”。標簽是表達人的基本屬性、行為傾向、興趣偏好等某一個維度的數(shù)據(jù)標識,它是一種相關(guān)性很強的關(guān)鍵字,可以簡潔的描述和分類人群。標簽的定義來源于業(yè)務(wù)目標,基于不同的行業(yè),不同的應(yīng)用場景,同樣的標簽名稱可能代表了不同的含義,也決定了不同的模型設(shè)計和數(shù)據(jù)處理方式。我們給機票用戶畫像打標簽分類為兩大類,基礎(chǔ)類標簽和個性化標簽,這些標簽可以有重復(fù),但是都是通過不同的角度去定義和刻畫一個用戶,來滿足不同的業(yè)務(wù)營銷需求。 

 

 

?

3.3用戶標簽庫構(gòu)建流程 

 

 

?

4.用戶畫像技術(shù)架構(gòu)

4.1 技術(shù)架構(gòu) 

 

 

?

4.2 實施方法論 

 

 

?

5.用戶畫像數(shù)據(jù)應(yīng)用實踐

5.1 用戶群體特征分析

  • 設(shè)計目標

–根據(jù)條件可選項,輸出篩選用戶群體

–圖形展示用戶群體屬性特征

應(yīng)用場景

–如果篩選的用戶群組滿足業(yè)務(wù)的要求,將篩選條件形成參數(shù)

–根據(jù)參數(shù)提供接口查詢 

 

 

??  

 

 

5.2 客戶行為預(yù)測

客戶行為預(yù)測建立步驟

  • 建模數(shù)據(jù)準備
  • 客戶流失節(jié)點判斷
  • 模型應(yīng)用變量確定
  • 模型構(gòu)建
  • 模型應(yīng)用
  • 模型驗證

 

 

?

可以對用戶流失做及時預(yù)測指導(dǎo)建議用戶維系運營。

5.3 數(shù)據(jù)和業(yè)務(wù)在一起

用戶畫像與業(yè)務(wù)產(chǎn)品互相依賴,相輔相成

  • 用戶畫像標簽庫豐富優(yōu)化
  • 快速提供數(shù)據(jù)服務(wù)
  • 數(shù)據(jù)分析+機器學(xué)習(xí)+模型訓(xùn)練

 

 

?

6.總結(jié)

用戶畫像作為大數(shù)據(jù)的根基,它完美的描述了一個用戶的信息全貌,為進一步精準、快速的分析用戶行為、消費等重要信息,用戶畫像倉庫同時也提供了足夠的數(shù)據(jù)基礎(chǔ),讓我們Qunar更好的為用戶提供高價值的服務(wù),滿足用戶智慧出行的需要。

作者介紹李國芳,去哪兒網(wǎng)機票大數(shù)據(jù)組,精于架構(gòu),追求極致。曾先后搭建起機票實時數(shù)據(jù)處理系統(tǒng),并主導(dǎo)用戶畫像項目,指導(dǎo)各業(yè)務(wù)線精準定位用戶。在數(shù)據(jù)倉庫方面,搭建saiku + kylin + hive平臺,為運營及業(yè)務(wù)分析人員提供更快速精確的OLAP工具。技術(shù)涉獵廣泛,樂于分享和激勵新人。

責(zé)任編輯:龐桂玉 來源: 大數(shù)據(jù)雜談
相關(guān)推薦

2024-03-07 07:31:20

畫像標簽算法業(yè)務(wù)數(shù)據(jù)

2017-04-28 11:15:26

大數(shù)據(jù)用戶畫像技術(shù)

2022-12-15 08:35:01

用戶畫像平臺

2023-03-15 07:22:56

畫像平臺數(shù)據(jù)中臺

2024-02-06 08:18:30

用戶畫像標簽數(shù)字化異常值處理

2016-11-17 11:18:01

金融行業(yè)大數(shù)據(jù)用戶畫像

2022-10-20 14:35:48

用戶畫像離線

2021-03-09 10:06:34

大數(shù)據(jù)畫像數(shù)據(jù)采集

2022-09-02 12:09:06

高質(zhì)量用戶畫像

2023-09-04 07:03:35

2022-01-29 21:54:58

電商用戶數(shù)據(jù)

2017-02-09 11:05:11

大數(shù)據(jù)用戶畫像技術(shù)

2021-03-16 10:30:44

云計算云計算產(chǎn)業(yè)云應(yīng)用

2022-12-21 12:05:40

網(wǎng)易云音樂用戶畫像

2024-05-31 08:53:40

2016-03-16 10:22:28

Spark用戶畫像數(shù)據(jù)科學(xué)

2017-11-21 13:46:30

大數(shù)據(jù)用戶畫像數(shù)據(jù)管理

2021-02-20 16:29:26

用戶畫像數(shù)據(jù)收集流程

2014-11-27 13:29:29

OpenStackSwift開源

2024-03-29 11:39:57

用戶畫像用戶分群用戶分層
點贊
收藏

51CTO技術(shù)棧公眾號