自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

智能分析最佳實(shí)踐——指標(biāo)邏輯樹(shù)

開(kāi)發(fā) 開(kāi)發(fā)工具
所有業(yè)務(wù)都會(huì)面對(duì)“為什么漲、為什么降、原因是什么?”這種簡(jiǎn)單粗暴又不易定位的業(yè)務(wù)問(wèn)題。為了找出數(shù)據(jù)發(fā)生異動(dòng)的原因,業(yè)務(wù)人員會(huì)通過(guò)使用多維查詢、dashboard等數(shù)據(jù)產(chǎn)品鎖定問(wèn)題,再輔助人工分析查找問(wèn)題原因,這個(gè)過(guò)程通常需要一天時(shí)間。

背景

所有業(yè)務(wù)都會(huì)面對(duì)“為什么漲、為什么降、原因是什么?”這種簡(jiǎn)單粗暴又不易定位的業(yè)務(wù)問(wèn)題。為了找出數(shù)據(jù)發(fā)生異動(dòng)的原因,業(yè)務(wù)人員會(huì)通過(guò)使用多維查詢、dashboard等數(shù)據(jù)產(chǎn)品鎖定問(wèn)題,再輔助人工分析查找問(wèn)題原因,這個(gè)過(guò)程通常需要一天時(shí)間。幾乎每種業(yè)務(wù)角色的用戶都在做相似的分析,但在業(yè)務(wù)方分析人員發(fā)生工作變動(dòng)時(shí),分析方法難以得到較好傳承。因此我們需要一款自動(dòng)給出分析結(jié)論的智能化數(shù)據(jù)產(chǎn)品來(lái)解決上面的問(wèn)題,產(chǎn)品的基本功能如圖1所示。

圖1 產(chǎn)品架構(gòu)圖

由上圖可知,指標(biāo)邏輯樹(shù)就是我們抽象出來(lái)的智能異動(dòng)分析數(shù)據(jù)產(chǎn)品的***實(shí)踐。它將固定的分析方法和業(yè)務(wù)場(chǎng)景抽象出來(lái),套用靈活的數(shù)據(jù)源(包含Kylin、MySQL、Elasticsearch、Druid等),自動(dòng)生成符合各類用戶的異動(dòng)分析報(bào)告;它能夠直接給出分析結(jié)論進(jìn)而快速落實(shí)業(yè)務(wù)行動(dòng),降低分析成本和決策周期。選定兩個(gè)時(shí)間周期,指定指標(biāo)順序,通過(guò)指標(biāo)邏輯樹(shù)就可找出導(dǎo)致核心指標(biāo)發(fā)生異動(dòng)的關(guān)鍵指標(biāo),同時(shí)可對(duì)單一指標(biāo)進(jìn)行細(xì)分維度拆分,鎖定細(xì)分維度對(duì)整體的影響。

挑戰(zhàn)

指標(biāo)邏輯樹(shù)作為一款支持酒旅各業(yè)務(wù)線的異動(dòng)分析數(shù)據(jù)產(chǎn)品,面臨的挑戰(zhàn)如下:

  • 基礎(chǔ)指標(biāo)多、維度多,且來(lái)自于不同的數(shù)據(jù)源。
  • 支持多種異動(dòng)分析算法。
  • 自定義計(jì)算指標(biāo)。

針對(duì)上面的挑戰(zhàn),我們給出如下的解決方案。

解決方案:指標(biāo)邏輯樹(shù)

體系架構(gòu)

圖2 指標(biāo)邏輯樹(shù)體系架構(gòu)

如圖2所示:

  • 指標(biāo)計(jì)算,用于解決基礎(chǔ)指標(biāo)多、維度多,且來(lái)自于不同數(shù)據(jù)源的問(wèn)題以及自定義計(jì)算指標(biāo)的問(wèn)題;
  • 分析算法,用于支持多種異動(dòng)分析算法;
  • 計(jì)算服務(wù),采用master-work的方式解決查詢性能的問(wèn)題。

具體方案

指標(biāo)計(jì)算

指標(biāo)計(jì)算包含指標(biāo)漏斗、基礎(chǔ)指標(biāo)序列、指標(biāo)分類,它們之間的關(guān)系如圖3所示。

圖3 指標(biāo)計(jì)算

如圖3所示,指標(biāo)漏斗為用戶自定義的有序指標(biāo)序列,包含基礎(chǔ)指標(biāo)和計(jì)算指標(biāo)(如,B=(L+H)*Y) ;基礎(chǔ)指標(biāo)序列,是將指標(biāo)漏斗中的計(jì)算指標(biāo)按照順序拆分之后的指標(biāo)序列;指標(biāo)分類采取大圣魔方(可以參考大圣魔方:https://tech.meituan.com/dsmf.html )配置的規(guī)則對(duì)基礎(chǔ)指標(biāo)進(jìn)行分類。

分析算法

目前指標(biāo)邏輯樹(shù)支持兩種異動(dòng)分析算法,后續(xù)可以根據(jù)需要進(jìn)行擴(kuò)展。

  • 生成瀑布分析圖的連環(huán)迭代分析法。
  • 根據(jù)指標(biāo)下鉆維度方案,生成單個(gè)指標(biāo)解釋度的基尼系數(shù)算法。

下面分別介紹這兩種算法在指標(biāo)邏輯樹(shù)中的運(yùn)用。

連環(huán)迭代分析法

連環(huán)迭代分析法,用于從用戶自定義的有序指標(biāo)列表中找出導(dǎo)致核心指標(biāo)發(fā)生異動(dòng)的關(guān)鍵指標(biāo),如圖4可知,本期結(jié)果指標(biāo)E產(chǎn)生的波動(dòng),主要由于A指標(biāo)的波動(dòng)影響。

圖4 瀑布分析圖

圖5 指標(biāo)漏斗

如圖5所示,意向UV、訪購(gòu)率、人均單量、連帶率、SKU單價(jià)等幾個(gè)指標(biāo)中的任意一個(gè)發(fā)生數(shù)據(jù)波動(dòng),都可能引起支付GMV的波動(dòng)。采用連環(huán)迭代分析法,可以確定某個(gè)具體指標(biāo)在本期支付GMV的波動(dòng)中產(chǎn)生的影響***。算法公式,支付GMV=意向UV*訪購(gòu)率*人均單量*連帶率*SKU單價(jià)。

基尼系數(shù)

基尼系數(shù)A/(A+B),用于計(jì)算各下鉆維度方案對(duì)單個(gè)指標(biāo)波動(dòng)的影響程度,橫軸用特征分組基期累計(jì)占比,縱軸用波動(dòng)值累計(jì)占比(可以為負(fù)值),基尼系數(shù)越大說(shuō)明該特征對(duì)波動(dòng)的解釋效果越好。

圖6 基尼系數(shù)計(jì)算

如圖6所示,指標(biāo)計(jì)算,用于獲取層級(jí)下鉆維度中各個(gè)維度的基礎(chǔ)數(shù)據(jù),如各個(gè)城市等級(jí)的本期、基期值等信息;分析算法,根據(jù)維度基礎(chǔ)數(shù)據(jù)計(jì)算出排序因子,利用排序之后的排序因子計(jì)算各特征分組的基期累積占比及波動(dòng)值累計(jì)占比,進(jìn)而獲取到基尼系數(shù);最終選取基尼系數(shù)***的特征作為最終解釋。

計(jì)算服務(wù)

隨著業(yè)務(wù)分析需求的增加,分析用戶自行配置的指標(biāo)序列以及針對(duì)單個(gè)指標(biāo)的下鉆維度方案將會(huì)急劇增加,隨之帶來(lái)的影響就是單個(gè)請(qǐng)求需要支持大量的查詢?nèi)蝿?wù),因而提升并行計(jì)算能力是提升系統(tǒng)性能的一個(gè)關(guān)鍵因素。如圖7所示,計(jì)算服務(wù)包括任務(wù)拆分、并行計(jì)算和結(jié)果合并。

圖7 計(jì)算服務(wù)

任務(wù)拆分

任務(wù)拆分分為如下幾個(gè)步驟:

  • 將指標(biāo)漏斗中的計(jì)算指標(biāo)拆分成基礎(chǔ)指標(biāo)。
  • 填充基礎(chǔ)指標(biāo)的細(xì)化維度方案,記錄指標(biāo)的各個(gè)維度方案及各方案下的層級(jí)下鉆維度。
  • 對(duì)基礎(chǔ)指標(biāo)按照數(shù)據(jù)模型和維度方案進(jìn)行分類。

并行計(jì)算

并行計(jì)算提供分布式計(jì)算功能,主要處理的是任務(wù)拆分之后的細(xì)粒度查詢?nèi)蝿?wù)。

查詢?nèi)蝿?wù)主要有以下兩類:

  • 按照數(shù)據(jù)模型分類之后的指標(biāo)序列查詢?nèi)蝿?wù),需要分別查詢本期和基期值,查詢量相對(duì)較少。
  • 按照數(shù)據(jù)模型和維度方案分類之后的查詢?nèi)蝿?wù),需要分別查詢本期和基期值,涉及到細(xì)化維度,查詢量比較大。

結(jié)果合并

結(jié)果合并主要是針對(duì)計(jì)算指標(biāo)來(lái)說(shuō)的,計(jì)算指標(biāo)是分析用戶自定義的針對(duì)基礎(chǔ)指標(biāo)的一組計(jì)算公式。并行查詢的結(jié)果是針對(duì)基礎(chǔ)指標(biāo)的,需要合并基礎(chǔ)指標(biāo)的查詢結(jié)果數(shù)據(jù),生成符合計(jì)算公式的指標(biāo)數(shù)據(jù)。結(jié)果合并模塊需要做兩部分的工作,一是解析計(jì)算公式,二是根據(jù)已有的數(shù)據(jù),按照計(jì)算公式生成新的數(shù)據(jù)。

系統(tǒng)中用到數(shù)據(jù)組裝的模塊主要有如下:

  • 如圖8所示,根據(jù)拆分之后的基礎(chǔ)指標(biāo)數(shù)據(jù),生成滿足計(jì)算公式的計(jì)算指標(biāo)數(shù)據(jù)。
  • 如圖9所示,根據(jù)拆分之后的下鉆維度基礎(chǔ)數(shù)據(jù),分別計(jì)算出各個(gè)維度的數(shù)據(jù),生成符合計(jì)算公式的下鉆維度數(shù)據(jù)。

圖8 計(jì)算指標(biāo)數(shù)據(jù)組裝

圖9 指標(biāo)下鉆維度數(shù)據(jù)組裝

總結(jié)

指標(biāo)邏輯樹(shù)在美團(tuán)點(diǎn)評(píng)酒店旅游各業(yè)務(wù)線中已經(jīng)得到了一定的應(yīng)用,并收獲了大量好評(píng)。本文只是指標(biāo)邏輯樹(shù)的一個(gè)總綱,目前產(chǎn)品尚處于初級(jí)階段,后續(xù)還有很多功能需要完善。

 【本文為51CTO專欄機(jī)構(gòu)“美團(tuán)點(diǎn)評(píng)技術(shù)團(tuán)隊(duì)”的原創(chuàng)稿件,轉(zhuǎn)載請(qǐng)通過(guò)微信公眾號(hào)聯(lián)系機(jī)構(gòu)獲取授權(quán)】

戳這里,看該作者更多好文

責(zé)任編輯:武曉燕 來(lái)源: 51CTO專欄
相關(guān)推薦

2018-01-09 14:28:55

系統(tǒng)場(chǎng)景實(shí)踐

2014-09-29 09:48:54

MySQLMySQL實(shí)踐

2024-12-30 08:45:09

2024-01-05 07:44:22

人工智能用戶隱私AI

2023-07-21 01:12:30

Reactfalse?變量

2011-08-18 11:05:21

jQuery

2011-07-26 09:31:39

Windows Ser

2023-03-28 08:28:34

2014-08-19 10:06:53

IAP

2012-08-09 09:10:56

代碼審查代碼

2024-08-21 08:02:47

2011-12-21 13:35:39

JavaJFreeChart

2014-06-09 15:50:08

2011-12-21 13:52:27

JavaJFreeChart

2015-09-23 09:08:38

java反射

2023-09-11 08:50:03

Maven工具關(guān)系管理

2015-10-12 17:40:12

數(shù)據(jù)分析實(shí)踐

2021-03-04 11:06:05

自助服務(wù)

2023-09-13 08:00:00

JavaScript循環(huán)語(yǔ)句

2010-02-04 11:55:27

ibmdwDB2
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)