自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

數(shù)據(jù)倉庫中ODS基礎學習

數(shù)據(jù)庫 數(shù)據(jù)倉庫
本文是關于數(shù)據(jù)倉庫中的ODS基礎學習。

根據(jù)Bill.Inmon的定義,“數(shù)據(jù)倉庫是面向主題的、集成的、穩(wěn)定的、隨時間變化的,主要用于決策支持的數(shù)據(jù)庫系統(tǒng)”

ODS是一個面向主題的、集成的、可變的、當前的細節(jié)數(shù)據(jù)集合,用于支持企業(yè)對于即時性的、操作性的、集成的全體信息的需求。常常被作為數(shù)據(jù)倉庫的過渡,也是數(shù)據(jù)倉庫項目的可選項之一。

在Kimball的<<數(shù)據(jù)倉庫生命周期工具集The Data WareHouse Liftcycle Toolkit>>,他是這樣定義的:

1. 是操作型系統(tǒng)中的集成,用于當前,歷史以及其它細節(jié)查詢(業(yè)務系統(tǒng)的一部分);

2. 為決策支持提供當前細節(jié)數(shù)據(jù)(數(shù)據(jù)倉庫的一部分)。

因此操作數(shù)據(jù)存儲(ODS)是用于支持企業(yè)日常的全局應用的數(shù)據(jù)集合,ODS的數(shù)據(jù)具有面向主題、集成的、可變的和數(shù)據(jù)是當前的或是接近當前的4個基本特征。同樣也可以看出ODS是介于DB和DW 之間的一種數(shù)據(jù)存儲技術,和原來面向應用的分散的DB相比,ODS中的數(shù)據(jù)組織方式和數(shù)據(jù)倉庫(DW)一樣也是面向主題的和集成的,所以對進入ODS的數(shù) 據(jù)也象進入數(shù)據(jù)倉庫的數(shù)據(jù)一樣進行集成處理。另外ODS只是存放當前或接近當前的數(shù)據(jù),如果需要的話還可以對ODS中的數(shù)據(jù)進行增、刪和更新等操 作,雖然DW中的數(shù)據(jù)也是面向主題和集成的,但這些數(shù)據(jù)一般不進行修改,所以ODS和DW的區(qū)別主要體現(xiàn)數(shù)據(jù)的可變性、當前性、穩(wěn)定性、匯總度上。

由于ODS仍然存儲在普通的關系數(shù)據(jù)庫中,出于性能、存儲和備份恢復等數(shù)據(jù)庫的角度以及對源數(shù)據(jù)庫的性能影響角度,個人不建議ODS保存相當長周期的數(shù)據(jù),同樣ODS中的數(shù)據(jù)也盡量不做轉(zhuǎn)換,而是原封不動地與業(yè)務數(shù)據(jù)庫保持一致。即ODS只是業(yè)務數(shù)據(jù)庫的一個備份或者映像,目的是為了使數(shù)據(jù)倉庫的處理和決策支持要求與OLTP系統(tǒng)相隔離,減少決策支持要求對OLTP系統(tǒng)的影響。

為什么需要有一個ODS系統(tǒng)呢?一般在帶有ODS的系統(tǒng)體系結(jié)構(gòu)中,ODS都具備如下幾個作用:

1.在業(yè)務系統(tǒng)和數(shù)據(jù)倉庫之間形成一個隔離層

一般的數(shù)據(jù)倉庫應用系統(tǒng)都具有非常復雜的數(shù)據(jù)來源,這些數(shù)據(jù)存放在不同的地理位置、不同的數(shù)據(jù)庫、不同的應用之中,從這些業(yè)務系統(tǒng)對數(shù)據(jù)進行抽取并不是一件容易的事。因此,ODS用于存放從業(yè)務系統(tǒng)直接抽取出來的數(shù)據(jù),這些數(shù)據(jù)從數(shù)據(jù)結(jié)構(gòu)、數(shù)據(jù)之間的邏輯關系上都與業(yè)務系統(tǒng)基本保持一致,因此在抽取過程中極 大降低了數(shù)據(jù)轉(zhuǎn)化的復雜性,而主要關注數(shù)據(jù)抽取的接口、數(shù)據(jù)量大小、抽取方式等方面的問題。

2.轉(zhuǎn)移一部分業(yè)務系統(tǒng)細節(jié)查詢的功能

在數(shù)據(jù)倉庫建立之前,大量的報表、分析是由業(yè)務系統(tǒng)直接支持的,在一些比較復雜的報表生成過程中,對業(yè)務系統(tǒng)的運行產(chǎn)生相當大的壓力。ODS的數(shù)據(jù)從粒度、組織方式等各個方面都保持了與業(yè)務系統(tǒng)的一致,那么原來由業(yè)務系統(tǒng)產(chǎn)生的報表、細節(jié)數(shù)據(jù)的查詢自然能夠從ODS中進行,從而降低業(yè)務系統(tǒng)的查詢壓力。

3.完成數(shù)據(jù)倉庫中不能完成的一些功能

一般來說,帶有ODS的數(shù)據(jù)倉庫體系結(jié)構(gòu)中,DW層所存儲的數(shù)據(jù)都是進行匯總過的數(shù)據(jù)和運營指標,并不存儲每筆交易產(chǎn)生的細節(jié)數(shù)據(jù),但是在某些特殊的應用中,可能需要對交易細節(jié)數(shù)據(jù)進行查詢,這時就需要把細節(jié)數(shù)據(jù)查詢的功能轉(zhuǎn)移到ODS來完成,而且ODS的數(shù)據(jù)模型按照面向主題的方式進行存儲,可以方便地支持多維分析等查詢功能。即數(shù)據(jù)倉庫從宏觀角度滿足企業(yè)的決策支持要求,而ODS層則從微觀角度反映細節(jié)交易數(shù)據(jù)或者低粒度的數(shù)據(jù)查詢要求。

在一個沒有ODS層的數(shù)據(jù)倉庫應用系統(tǒng)體系結(jié)構(gòu)中,數(shù)據(jù)倉庫中存儲的數(shù)據(jù)粒度是根據(jù)需要而確定的,但一般來說,最為細節(jié)的業(yè)務數(shù)據(jù)也是需要保留的,實際上也就相當于ODS,但與ODS所不同的是,這時的細節(jié)數(shù)據(jù)不是“當前、不斷變化的”數(shù)據(jù),而是“歷史的,不再變化的”數(shù)據(jù)。這樣的數(shù)據(jù)倉庫的存儲壓力和性能壓力都是比較大的,因此對數(shù)據(jù)倉庫的物理設計和邏輯設計提出了更高的要求。

【編輯推薦】

  1. 關于航空公司信息整合和數(shù)據(jù)挖掘的一點思考
  2. 數(shù)據(jù)挖掘和知識發(fā)現(xiàn)的技術、方法及應用
  3. 數(shù)據(jù)挖掘技術在沃爾瑪?shù)膽?/A>
  4. 空間數(shù)據(jù)挖掘主要方法
  5. 基于數(shù)據(jù)挖掘技術的客戶關系管理
責任編輯:楊鵬飛 來源: 中國自學編程網(wǎng)
相關推薦

2009-01-19 14:08:35

ODS數(shù)據(jù)倉庫粒度

2013-03-20 16:23:53

數(shù)據(jù)清洗

2023-08-14 16:56:53

2016-08-15 12:57:01

數(shù)據(jù)倉庫索引架構(gòu)維度索引

2021-09-01 10:03:44

數(shù)據(jù)倉庫云數(shù)據(jù)倉庫數(shù)據(jù)庫

2022-06-24 09:38:43

數(shù)據(jù)庫大數(shù)據(jù)

2009-01-19 15:52:20

OracleOSFA數(shù)據(jù)倉庫

2017-02-28 09:21:56

HadoopHive數(shù)據(jù)倉庫

2023-10-08 16:26:23

數(shù)據(jù)倉庫

2021-05-14 09:00:00

機器學習數(shù)據(jù)集工具

2010-09-30 15:11:47

DB2數(shù)據(jù)倉庫

2018-07-24 09:28:18

存儲數(shù)據(jù)倉庫

2019-05-24 11:51:18

BI數(shù)據(jù)倉庫數(shù)據(jù)分析

2009-01-18 15:14:00

數(shù)據(jù)倉庫開發(fā)OLTP

2018-07-26 10:26:09

大數(shù)據(jù)傳統(tǒng)數(shù)據(jù)

2022-08-01 11:30:27

數(shù)據(jù)建模

2022-11-29 17:16:57

2020-01-03 09:40:13

大數(shù)據(jù)數(shù)據(jù)倉庫分層

2022-07-28 13:47:30

云計算數(shù)據(jù)倉庫

2013-10-29 13:28:13

數(shù)據(jù)
點贊
收藏

51CTO技術棧公眾號