簡述數(shù)據(jù)倉庫,數(shù)據(jù)集市,數(shù)據(jù)湖泊、和運營數(shù)據(jù)存儲
數(shù)據(jù)倉庫
互聯(lián)網(wǎng)和大規(guī)模技術(shù)開發(fā)使得當(dāng)今世界中數(shù)據(jù)的爆炸性增長。企業(yè)決策者希望研究數(shù)據(jù)之間的關(guān)系,點擊數(shù)據(jù)的隱藏功能并分析和探索更深層次的數(shù)據(jù)。
但在企業(yè)的不同數(shù)據(jù)庫之間,數(shù)據(jù)共享是不可能的,由于同一企業(yè)中的多個數(shù)據(jù)庫,數(shù)據(jù)庫之間的集成具有大量挑戰(zhàn),特別是在巨大數(shù)據(jù)的合并和存儲方面
操作數(shù)據(jù)庫可以分散在Microsoft SQL Server數(shù)據(jù)庫或Oracle數(shù)據(jù)庫周圍,數(shù)據(jù)倉庫目標(biāo)是提取多個數(shù)據(jù)庫并累積從數(shù)百個千兆字節(jié)的數(shù)據(jù)進行處理,以便根據(jù)所需格式,進程進入必要的轉(zhuǎn)換,清潔,清潔,最后將數(shù)據(jù)加載到倉庫中。
根據(jù)IBM研究人員(Barry devlin和Paul Murphy)“數(shù)據(jù)倉庫是一個主題導(dǎo)向的,集成,相對穩(wěn)定的數(shù)據(jù)收集,反映了歷史變化,用于支持管理決策”
- By Nature,數(shù)據(jù)倉庫用于補充管理的決策,它被用作業(yè)務(wù)數(shù)據(jù)操作的分析,但它與企業(yè)的運營數(shù)據(jù)庫不同。
- 數(shù)據(jù)倉庫是將多個異構(gòu)數(shù)據(jù)源的有效集成和管理到一個存儲庫中,它是在歷史數(shù)據(jù)方面組織的,并且在數(shù)據(jù)倉庫中,不需要對數(shù)據(jù)的交易修改。
在數(shù)據(jù)倉庫出現(xiàn)后,企業(yè)的信息需求已經(jīng)遠離關(guān)系數(shù)據(jù)庫到?jīng)Q策支持系統(tǒng)。該決策支持系統(tǒng)實際上是我們稱為商業(yè)智能(BI)。
數(shù)據(jù)庫
與數(shù)據(jù)倉庫數(shù)據(jù)集合的比較可以被理解為“小數(shù)據(jù)倉庫”,它不是根據(jù)異構(gòu)數(shù)據(jù)庫,而是僅在單個操作數(shù)據(jù)庫實例上,數(shù)據(jù)范圍不夠?qū)挕?/p>
數(shù)據(jù)集市專門針對數(shù)據(jù)集市的特定業(yè)務(wù)運營(銷售,生產(chǎn))用戶快速找到所需的數(shù)據(jù),在數(shù)據(jù)集市中,您只需要設(shè)計和構(gòu)建數(shù)據(jù)庫表,填充數(shù)據(jù)庫表與相關(guān)數(shù)據(jù),決定誰可以訪問數(shù)據(jù)集。
數(shù)據(jù)集市可分為兩種類型:
- 第一個是獨立數(shù)據(jù)集市,ETL架構(gòu)和數(shù)據(jù)庫的來源屬于一個實體。
- 第二個是依賴數(shù)據(jù)集市,在這種類型的數(shù)據(jù)集市中,進入數(shù)據(jù)主要來自其他來源,主要來自數(shù)據(jù)倉庫。Datamart可以簡單地為用戶提供數(shù)據(jù)倉庫的信息子集。
數(shù)據(jù)湖
它與自然狀態(tài)的流動水有多像流動的水,數(shù)據(jù)流從多個源系統(tǒng)到這個湖,用戶可以獲得他們想要的特定數(shù)據(jù),驗證,彌補和其他雙務(wù)任務(wù)將在數(shù)據(jù)湖外執(zhí)行。
數(shù)據(jù)湖可以以以下功能實現(xiàn)的方式開發(fā):
- 它將導(dǎo)入來自源系統(tǒng)的所有數(shù)據(jù),源系統(tǒng)沒有數(shù)據(jù)丟失。
- 數(shù)據(jù)存儲在其原始狀態(tài)下,而不會轉(zhuǎn)換原始數(shù)據(jù)。
- Data Lake Schema準(zhǔn)確符合數(shù)據(jù)分析要求。
- 數(shù)據(jù)湖有鎖,控制和治理
操作數(shù)據(jù)存儲
操作數(shù)據(jù)存儲(ODS)是用于交易處理數(shù)據(jù)的數(shù)據(jù)庫,ODS中的數(shù)據(jù)主要是原始數(shù)據(jù),來自O(shè)DS的數(shù)據(jù)總是向數(shù)據(jù)倉庫或數(shù)據(jù)集市移出以進行進一步處理。在ODS中,您可以查詢數(shù)據(jù),只能訪問業(yè)務(wù)運營中的最新開發(fā)
原文鏈接:
https://medium.com/dataprophet/data-warehouse-data-mart-data-lake-and-operational-data-storage-3a69f8701466