關于數據治理,你需要知道些什么?
每個有效的數據庫都需要精心設計的模式(Schema),以保持數據干凈,避免沖突,滿足用戶的各種需求,適應未來的擴展。同樣,每個有效的企業(yè)數據計劃都離不開數據治理,也就是精心設計的政策,以明確職責、解決不同利益相關方之間的沖突,提供維護和擴展,保護敏感信息。
數據治理的關注點通常包括:
- 長遠規(guī)劃:識別戰(zhàn)略需求,尋求管理層對數據計劃的支持,獲得多年的預算承諾,除新功能之外還提供維護和升級。
- 架構:預見并調和不同企業(yè)部門之間的數據策略沖突。
- 職責:明確研發(fā)、運營、基礎設施、商業(yè)智能和各條業(yè)務線等能力領域之間的維護、更新和擴展職責。
- 數據收集:把來自各條業(yè)務線的數據整合進公司總體策略,從源頭上確保數據干凈。
- 安全和合規(guī):識別敏感數據及其相關的監(jiān)管和專業(yè)要求,執(zhí)行技術和管理保障措施。
數據管理方面的權威西米恩·施瓦茨(Simeon Schwarz)分享過一個思維實驗:假設你正在為某券商創(chuàng)建新的客戶關系管理(CRM)分析系統,你問該系統的各個利益相關方,在他們眼中什么是“賬戶”?答案各不相同:
- 營銷部:“賬戶是被轉化的銷售線索。”
- 財務部:“就財務報表而言,賬戶是擁有存款、能和我們交易的客戶。”
- 會計部:“賬戶是我們結算室、賬簿和記錄系統中的記錄條目。”
- 法律部:“賬戶是我們通過和客戶簽署的法律協議,向客戶提供的結構化產品。”
雖然每個定義在其利益相關方的眼中都是正確的,但這些定義可能無法調和成單一的一個定義。沒有數據治理計劃,各個部門的工作流程可能會以不同的方式來對待記錄。結果將是各個部門的工作流程產生不同版本的真相,具有不同的監(jiān)管和合規(guī)風險。報告和分析變得不可靠,并使沖突加劇。
營銷部通過網頁表單收集銷售線索,并為每條線索創(chuàng)建一條新的賬戶記錄,但網頁表單上可能有錯字。法律部從頭開始為每份協議創(chuàng)建一條新的記錄,導致某些數據重復,如果其數據與包含錯字的營銷部數據產生沖突,那么還需要進行清理。
由于可追溯至大型主機時代的一個傳統,運行整個系統的硬件設施也許是由會計部管理,而會計部可能不想花錢改進營銷部的數據收集系統。營銷部的人在策劃宣傳活動時,習慣了直接查看會計部數據庫的原始客戶記錄,這會產生監(jiān)管和安全風險。
數據治理計劃不僅為解決這些問題和預見新的問題提供了知識和制度基礎,還根據企業(yè)戰(zhàn)略計劃的推進提供相應的擴展。
關鍵的術語和趨勢
如今首席數據官(CDO)這個職位越來越流行,其誕生就是為了應對數據治理的挑戰(zhàn)。負責數據治理的CDO加入企業(yè)高管行列,這表明了數據在企業(yè)價值和使命中的重要地位。
行業(yè)組織和供應商已經開發(fā)出各種各樣的數據治理框架,其中最著名的包括開放組群架構框架(TOGAF),它以美國國防部較早前一個項目為基礎發(fā)展而來。TOGAF遠遠超出了數據治理的范疇,但數據架構是該框架中一個被人們津津樂道的組成部分。此外還有數據治理框架(DGI),它也是從結構化的角度來看待數據治理。
除了上述幾種“框架”法以外,有些早期研究項目致力于元數據和情境服務在制定治理政策方面的潛在應用,這是從自下而上的角度來處理問題。