自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

一起聊聊轉轉數(shù)倉評估體系實踐

開發(fā) 架構
本次分享偏向于面向數(shù)倉建設、業(yè)務交付等過程中遇到的效率、質量、成本、研發(fā)等相關問題的系統(tǒng)性評估和治理,著重于設計思路和實踐成果的展示,不涉及太多的技術細節(jié)。

1 導讀

本次分享偏向于面向數(shù)倉建設、業(yè)務交付等過程中遇到的效率、質量、成本、研發(fā)等相關問題的系統(tǒng)性評估和治理,著重于設計思路和實踐成果的展示,不涉及太多的技術細節(jié)。讀者朋友可以根據(jù)自身業(yè)務場景和實際面臨的問題,選擇性參考并應用到實際工作中。

2 背景介紹

2.1 為什么搭建數(shù)倉評估體系

數(shù)倉評估體系起源于23年底,作為轉轉數(shù)據(jù)治理的評價層,是非常重要的一環(huán)。過去很長一段時間里,轉轉數(shù)倉團隊服務于快速發(fā)展和變化的業(yè)務,為了能夠高效響應業(yè)務的數(shù)據(jù)需求,一方面存在煙囪式建設的情況,指標管理也較為粗放;另一方面對于線上的表和任務往往是只做加法不做減法,帶來額外的計算和存儲成本。??基于上述現(xiàn)狀,衍生出如下問題:

管理者視角:

  • 看不清數(shù)倉整體建設情況
  • 看不清成本增長和分布
  • 內外部用數(shù)效率和數(shù)據(jù)質量提升難
  • 看不清研發(fā)規(guī)范落地效果

數(shù)倉RD視角:

  • 名下哪些資產(chǎn)有問題,有什么問題
  • 模型完備度如何,哪些業(yè)務過程建設較薄弱
  • 模型復用率如何,哪些模型沒人用
  • 哪些規(guī)范沒有執(zhí)行好

外部用戶視角:

  • 找數(shù)、用數(shù)難,用戶效率低
  • 準確性、及時性、一致性等問題頻出
  • 報表、郵件、播報權限難管控

為了能夠系統(tǒng)性解決上述問題,我們在24年將數(shù)據(jù)治理規(guī)劃成年度重點項目。我們通過制定標準、夯實基建、搭建指標庫和數(shù)倉地圖等手段來進行事前預防和事中監(jiān)控以及輔助提效,數(shù)倉評估體系作為事后的評價和復盤工具,則是貫穿整體治理過程。

圖片圖片

以上是數(shù)據(jù)治理的整體規(guī)劃及數(shù)倉評估體系所處的位置,我們對數(shù)倉評估體系的定位是:基于客觀事實進行數(shù)倉現(xiàn)狀及問題的量化分析及橫縱向對比,實現(xiàn)基于結果指標和治理項驅動的數(shù)據(jù)治理及效果回收。

2.2 需要解決的技術問題

?數(shù)倉評估指標的設計與落地?“客觀事實”數(shù)據(jù)的獲取與處理?存量的問題怎么治理?增量的問題怎么管控?如何不斷完善和健壯評估體系

3 設計思路

整個評估體系分為結果評估和過程評估兩大模塊。我們通過結果評估中關于效率、質量、成本、模型相關的結果指標,觀測數(shù)倉治理目標達成情況;通過過程評估的治理項驅動數(shù)倉RD進行具體問題的治理。

3.1 整體架構設計

整個數(shù)倉評估體系大致上可以分為三層:

圖片圖片

  • 指標層: 以數(shù)據(jù)處理層產(chǎn)出的數(shù)據(jù)模型為基礎、結果指標和過程指標體系為目標進行指標加工,產(chǎn)出相應的指標結果表,支持趨勢分析和橫向的對比分析
  • 數(shù)據(jù)處理層: 對數(shù)據(jù)源層獲取到的數(shù)據(jù)為基礎,進行數(shù)據(jù)清洗和建模
  • 數(shù)據(jù)源層: 整合數(shù)據(jù)源,包括Hive元數(shù)據(jù)、平臺查詢日志、告警日志、賬單數(shù)據(jù)、治理項規(guī)則、組織架構等

3.2 產(chǎn)品形態(tài)設計

整個評估體系規(guī)劃為結果評估、過程評估兩大模塊,分別對應結果指標和治理項兩套指標體系。結果評估用于觀測當前現(xiàn)狀及趨勢,看的是整體表現(xiàn);過程評估驅動日常的數(shù)據(jù)治理,直擊各RD的問題資產(chǎn)及具體的問題明細。

圖片圖片

結果評估

用于呈現(xiàn)當前在效率、質量、成本、模型相關的指標現(xiàn)狀,并進行橫縱向的量化分析,支持組織、組件、人等粒度的下鉆分析。數(shù)據(jù)主要來自于分析師和產(chǎn)品運營等數(shù)據(jù)使用方的數(shù)據(jù)查詢日志進行統(tǒng)計分析、對數(shù)據(jù)質量監(jiān)控服務日志的統(tǒng)計分析、以及人工打標線上問題或事故的統(tǒng)計分析。

圖片圖片

過程評估

通過對日常問題、規(guī)范的抽象總結,形成各類治理項。目前包含效率、質量、研發(fā)、成本四大類治理項,匯集成治理工作臺。通過治理項驅動數(shù)倉RD進行數(shù)據(jù)治理。

圖片圖片

3.2 指標體系搭建

數(shù)倉評估體系的指標體系大致上可以兩層。第一層是過程評估關注的每個具體問題對應的治理項;第二層是結果評估關注的結果指標。??

治理項,來自于對日常規(guī)范的抽象,是每一個具體的問題的檢查項,是數(shù)據(jù)治理的最細粒度。我們一期圍繞效率、質量、研發(fā)、成本四方面一共設置了24個治理項。

圖片圖片

結果指標,是各類問題的聚合結果,是某一類問題或者單個核心問題的當前現(xiàn)狀表現(xiàn)。我們對管理者視角、RD視角、用戶視角所存在的問題進行了抽象和歸類成具體的治理項,設置如下指標體系:

  • 效率上: 我們會關注效率分,這是一個基于平均運行時長、ODS穿透率、復雜SQL占比加權統(tǒng)計出來的復合指標,用來觀測評估業(yè)務側通過即席查詢使用數(shù)據(jù)時的效率情況。
  • 質量上: 我們關注線上問題次數(shù)
  • 成本上: 我們關注成本整體的增長率、分組件的成本分布和增長情況,并且關注具體到業(yè)務和個人的成本分布。
  • 模型上: 我們關注整體的完備度、復用率、穩(wěn)定性、規(guī)范性等。

4 結果呈現(xiàn)

4.1 結果評估模塊展示

效率評估

實現(xiàn)效率分的橫向和縱向對比,支持分業(yè)務下鉆至具體的個人以及具體的某次查詢。通過內部模型完備、宣導加提效工具的賦能,輔助業(yè)務側的運營、產(chǎn)品、分析師等同事,提升日常查詢數(shù)據(jù)的效率。

圖片圖片

質量評估

實現(xiàn)線上質量問題的趨勢分析。這塊目前以手動填報為主,后續(xù)會引入質量監(jiān)控、任務告警等數(shù)據(jù),作為質量問題的評估依據(jù)。當前還是側重于業(yè)務感知問題記錄和復盤。

圖片圖片

成本評估

成本這塊,我們重點關注月度增長趨勢是否在可控的范圍內,后續(xù)會通過任務及存儲的系統(tǒng)性治理,驅動成本的下降,今年的重心還是在內部模型相關治理上。

圖片圖片

成本拆解至組件、組織和個人:

圖片圖片

模型評估

??這塊是今年投入時間最多的部分。我們通過完備度、復用率、穩(wěn)定性、規(guī)范性指標,觀測治理的成果。通過目標驅動RD使用治理工作臺進行各類問題下具體治理項的治理。

圖片圖片

4.2 過程評估模塊展示

本模塊呈現(xiàn)各RD當前存在問題的資產(chǎn)明細,通過點擊資產(chǎn)名稱,可跳轉查看具體問題項。也可通過控件篩選查詢當前關注的治理項。

圖片圖片

資產(chǎn)問題治理項明細:

圖片圖片

通過治理報告可觀測當前目標的達成情況,及本周或本月的治理進展。并且通過新增資產(chǎn)監(jiān)控實現(xiàn)增量問題的管控。

圖片圖片

4.3 階段性治理收益

過去一年,我們通過數(shù)倉評估體系驅動的數(shù)據(jù)治理,重點還是在于數(shù)倉內部的治理。偏向于完備度、復用率、穩(wěn)定性和規(guī)范性。磨刀不誤砍柴工,勤修煉內功,為后續(xù)的效率和質量治理奠定基礎。

治理收益如下:

圖片圖片

  • 驅動完備度從年初的50.2%提升至93.97%,凈提升43.77%
  • 驅動復用率從年初的51.65%提升至88.61%,凈提升36.96%
  • 驅動穩(wěn)定性從年初的76.27%提升至94.45%,凈提升18.18%
  • 驅動規(guī)范性從年初的76.56%提升至94.61%,凈提升18.05%

給數(shù)倉帶來的核心變化是:

完備度治理驅動24年新上線模型達到上一年2.6倍,增長161%,對應的符合復用標準的模型數(shù)不降反升,說明模型更貼合當前的業(yè)務場景及業(yè)務過程且復用程度更高,另外治理過程整合下線無用模型,一定程度上減少了存儲空間占用。??最終完備度達到95%,則說明內部承接的需求,95%都可以通過模型層滿足,過往只能滿足50%左右。??在規(guī)范性上,之前一直存在的跨層穿透問題、回流引用問題、引用外部門表問題、注釋缺失問題、缺依賴問題等存量問題基本治理完畢并得到了控制,后續(xù)持續(xù)觀測即可。

5 未來規(guī)劃

  • 通過定期復盤,持續(xù)迭代和完善治理項,使評估更準確、更全面
  • 慢慢由內部的治理,轉向外部效率&質量治理提升
  • 挖掘成本存在浪費的業(yè)務或個人,通過治理驅動降本增效
  • 逐步推廣至倉外評估和治理

關于作者

邱狄凡,轉轉大數(shù)據(jù)開發(fā)工程師,C2&新媒體數(shù)倉負責人,數(shù)據(jù)治理數(shù)倉主R。

責任編輯:武曉燕 來源: 轉轉技術
相關推薦

2025-03-28 02:00:00

后臺配置鴻蒙

2023-04-07 07:14:34

2022-11-03 07:51:54

運維體系監(jiān)控

2023-11-03 12:54:00

KAFKA探索中間件

2022-12-07 09:01:14

布局容器VStack?

2021-08-27 07:06:10

IOJava抽象

2024-02-20 21:34:16

循環(huán)GolangGo

2023-08-04 08:20:56

DockerfileDocker工具

2022-05-24 08:21:16

數(shù)據(jù)安全API

2023-08-10 08:28:46

網(wǎng)絡編程通信

2023-09-10 21:42:31

2023-06-30 08:18:51

敏捷開發(fā)模式

2023-09-21 08:16:56

JDK 21向量計算計算

2022-02-14 07:03:31

網(wǎng)站安全MFA

2022-06-26 09:40:55

Django框架服務

2022-10-28 07:27:17

Netty異步Future

2023-04-26 07:30:00

promptUI非結構化

2022-04-06 08:23:57

指針函數(shù)代碼

2023-12-28 09:55:08

隊列數(shù)據(jù)結構存儲

2022-11-12 12:33:38

CSS預處理器Sass
點贊
收藏

51CTO技術棧公眾號