使用數(shù)據(jù)倉庫BI的六種策略
數(shù)據(jù)倉庫可以作為數(shù)據(jù)存儲的輔助工具,幫助數(shù)據(jù)的集成、匯總和轉(zhuǎn)換,以便更容易地為業(yè)務(wù)智能進行分析。團隊可以通過采用云架構(gòu)的新策略,最大限度地使用數(shù)據(jù)倉庫。
隨著云計算和用于數(shù)據(jù)集成、存儲和管理的新型數(shù)據(jù)基礎(chǔ)設(shè)施的興起,數(shù)據(jù)倉庫的性質(zhì)和用途都發(fā)生了巨大的轉(zhuǎn)變。即使一些企業(yè)醞釀使用數(shù)據(jù)湖來存儲一切,數(shù)據(jù)湖仍然在為常規(guī)分析提供更快的訪問和更一致的結(jié)構(gòu)方面提供了很大的價值。
此外,用于流分析、數(shù)據(jù)準(zhǔn)備和主數(shù)據(jù)管理的新工具可以幫助企業(yè)采用更好的數(shù)據(jù)倉庫策略。這里有六種策略,可以幫助企業(yè)充分使用新的云數(shù)據(jù)倉庫。
1. 識別過程中的瓶頸
數(shù)據(jù)分析咨詢公司Bartlett System的首席執(zhí)行官和創(chuàng)始人Adam Nathan,他參與實施BI系統(tǒng)已經(jīng)超過15年了。雖然在這期間,他發(fā)現(xiàn)了漸進式的進展,但他表示,“云服務(wù)的進步可能會從根本上改變BI專業(yè)人員挖掘數(shù)據(jù)倉庫的方式,從而使BI受益。”
Nathan指出,“獲取數(shù)據(jù)、清理數(shù)據(jù)、準(zhǔn)備數(shù)據(jù),并將其與不同的數(shù)據(jù)源進行集成,一直是IT團隊中數(shù)據(jù)工程師遇到的難題。”使這一挑戰(zhàn)變得更加嚴(yán)重的是,數(shù)據(jù)的所有者,那些真正了解信息語義價值的人,與數(shù)據(jù)本身是隔絕的。
他認(rèn)為,“那些幾乎沒有時間幫忙,而且只了解數(shù)據(jù)的人,恰恰無法快速得到我需要的東西。”
2. 賦予數(shù)據(jù)工程師權(quán)力
團隊現(xiàn)在可以在SQL中進行更多的數(shù)據(jù)準(zhǔn)備活動,包括大數(shù)據(jù)和半結(jié)構(gòu)化數(shù)據(jù)。根據(jù)Nathan的說法,隨著SQL技能變得無處不在,數(shù)據(jù)工程已經(jīng)變得大眾化了。
由于這些工具變得更容易使用,并且需要更少的分散技能,因此不太需要熟悉多種語言和技術(shù)的集中式專家。Nathan認(rèn)為,“這導(dǎo)致了數(shù)據(jù)工程師的崛起,反映了應(yīng)用開發(fā)、分析和其他領(lǐng)域的類似趨勢。”
數(shù)據(jù)共享也越來越容易。例如,Snowflake用戶可以將數(shù)據(jù)集以離散的、精心策劃的集合,公開給數(shù)據(jù)消費者,包括:合作伙伴、客戶、供應(yīng)商和其他人。
Nathan解釋說,“如果我是一名在人力資源方面擁有良好SQL技能的分析師,我就可以在不需要外部支持的情況下管理和分享我的團隊的數(shù)據(jù)。”
這一點很重要,因為它消除了IT在數(shù)據(jù)準(zhǔn)備過程中的瓶頸。IT團隊有更多的時間專注于準(zhǔn)備原始數(shù)據(jù)。
3. 建立分布式管理
接下來,團隊需要簡化正確的數(shù)據(jù)進入數(shù)據(jù)倉庫的方式。隨著IT部門的退出,團隊可以開始考慮將其數(shù)據(jù)作為企業(yè)中每個小組的個人、策劃、掌握和認(rèn)證數(shù)據(jù)集的集合。
想要人力資源數(shù)據(jù)的人可以去找人力資源部門共享的數(shù)據(jù)集。人力資源部門的專家了解如何收集數(shù)據(jù),為什么要收集數(shù)據(jù),保持這些數(shù)據(jù)的更新,管理工作,并可以為其他部門的用戶提供適當(dāng)?shù)谋尘?,希望使用這些數(shù)據(jù)進行不同的分析。Nathan認(rèn)為:“實際上,每個部門都在提供數(shù)據(jù)價值。”
其他人可以請求訪問權(quán)限,但無法更改。這種框架還可以更容易地集成來自給定部門的數(shù)據(jù),或者與企業(yè)內(nèi)可用的其他數(shù)據(jù)集,甚至外部數(shù)據(jù)集集成。
策劃管理策略將數(shù)據(jù)質(zhì)量監(jiān)督從一個中央部門轉(zhuǎn)移到單獨的團隊,可以提供更大的監(jiān)督效果。因此,我們可以相信,最好的人力資源數(shù)據(jù)來自于人力資源共享站點。“這是一個很小的問題,也更易于管理。”Nathan說道。
4. 制定數(shù)據(jù)合同
分布式管理也帶來了一個全新的挑戰(zhàn),即數(shù)據(jù)集需要保持一致,并以極其謹(jǐn)慎和安全的方式進行更改。“如果對數(shù)據(jù)的治理實施得不好,就會成為一種自由競爭,這可能是最大的風(fēng)險。”Nathan說。
數(shù)據(jù)管理團隊需要與每個部門合作,幫助制定數(shù)據(jù)合同,為他們提供的數(shù)據(jù)建立服務(wù)級別協(xié)議。合同有助于確定每個人對可靠性和及時性的期望。Nathan表示,“這可能會使IT部門感到痛苦,因為治理問題和角色的減少。”
5. 考慮不同的觀點
Capgemini公司全球洞察力和數(shù)據(jù)副總裁Avneet Dugal說,“數(shù)據(jù)倉庫有一個令人質(zhì)疑的名字,那就是它是大型的、難以操作的數(shù)據(jù)存儲庫,因此不適合實時分析和決策。”
她看到的挑戰(zhàn)是,團隊正在試圖將所有數(shù)據(jù)移入數(shù)據(jù)倉庫。將大量的數(shù)據(jù)轉(zhuǎn)移到另一個平臺,并重建經(jīng)驗上可信的數(shù)據(jù)是一項復(fù)雜的工作。例如,企業(yè)可以通過根據(jù)業(yè)務(wù)重點(供應(yīng)鏈、財務(wù)或營銷)來組織數(shù)據(jù),使其更容易查看和使用。
Dugal還發(fā)現(xiàn)將“增量”更新構(gòu)建為核心處理能力的一部分是有幫助的,這使得數(shù)據(jù)變化更容易出現(xiàn)在各種分析用例中,并減少了對所有數(shù)據(jù)的更改,以包括最后一天的更新需求。
6. 簡化數(shù)據(jù)工作流程
ScienceSoft的數(shù)據(jù)分析部門負(fù)責(zé)人Alex Bekker表示,“考慮戰(zhàn)略和戰(zhàn)術(shù)層面的管理之間的差距也很重要。”其中一個方面是建立一個精心設(shè)計的數(shù)據(jù)治理框架,以確保數(shù)據(jù)倉庫攝入高質(zhì)量的數(shù)據(jù),這些數(shù)據(jù)被安全地處理和存儲,并且只能根據(jù)用戶角色來訪問。
選擇具有大量集成功能的數(shù)據(jù)倉庫軟件也是很有幫助的,比如預(yù)建的數(shù)據(jù)源連接器和開放式API,以確保數(shù)據(jù)倉庫的可擴展性。這有助于添加新的數(shù)據(jù)源以解決不斷變化的業(yè)務(wù)需求。
另一個方面是圍繞集成、質(zhì)量、安全和備份,實現(xiàn)數(shù)據(jù)倉庫維護和管理活動的自動化。這降低了數(shù)據(jù)倉庫的運營成本,并確保高性能和可用性。
Fivetran公司首席分析技術(shù)產(chǎn)品經(jīng)理Veronica Zhai也建議,將關(guān)鍵業(yè)務(wù)邏輯集中到一個地方。例如,關(guān)鍵的業(yè)務(wù)邏輯,如 “什么是凈收入?”應(yīng)該在代碼中定義一次,放在一個有版本控制的地方,所有分析師和業(yè)務(wù)用戶都可以重復(fù)使用這段代碼。這也節(jié)省了時間,并確保報告的一致性。