數(shù)據(jù)倉(cāng)庫(kù)及其體系結(jié)構(gòu)建設(shè)
1 數(shù)據(jù)倉(cāng)庫(kù)的概念
數(shù)據(jù)倉(cāng)庫(kù)(Data Warehousing)的概念最早出現(xiàn)于20世紀(jì)80年代。而直到1993年,號(hào)稱“數(shù)據(jù)倉(cāng)庫(kù)之父”的William H.Inmon在其論著《Building the Data warehouse》一書中,***系統(tǒng)地闡述了數(shù)據(jù)倉(cāng)庫(kù)的思想和相關(guān)理論,為數(shù)據(jù)倉(cāng)庫(kù)的發(fā)展奠定了基石。他將數(shù)據(jù)倉(cāng)庫(kù)定義為:“一個(gè)面向主題的、集成的、反映歷史變化的、相對(duì)穩(wěn)定的數(shù)據(jù)集合,用于支持管理決策”。與傳統(tǒng)的事物處理系統(tǒng)有不同的是,數(shù)據(jù)倉(cāng)庫(kù)是一種過(guò)程,它是對(duì)分布在組織或企業(yè)內(nèi)部各處的業(yè)務(wù)數(shù)據(jù)進(jìn)行整合、加工和分析的過(guò)程。而不是一種可以購(gòu)買的產(chǎn)品。
1.1 面向主題(Subject-oriented)
“主題”是一個(gè)較為抽象的概念,是指用戶使用數(shù)據(jù)倉(cāng)庫(kù)進(jìn)行決策時(shí)所關(guān)心的重點(diǎn)方面。從信息管理的角度看,主題是在一個(gè)較高的管理層次上對(duì)數(shù)據(jù)進(jìn)行綜合、歸類所形成的分析對(duì)象;從數(shù)據(jù)組織的角度看,主題就是一些數(shù)據(jù)集合,這些數(shù)據(jù)集合對(duì)分析對(duì)象作了比較完整的、一致的描述,這種描述不僅涉及到數(shù)據(jù)本身,還涉及到數(shù)據(jù)之間的關(guān)系。
“面向主題”則表明了數(shù)據(jù)倉(cāng)庫(kù)中數(shù)據(jù)組織的基本原則,是指數(shù)據(jù)倉(cāng)庫(kù)內(nèi)的信息是按主題進(jìn)行組織的,而不像傳統(tǒng)事物處理系統(tǒng)那樣單一地按照業(yè)務(wù)功能及性能要求進(jìn)行組織。
1.2 集成(Integrated)
“集成”是指數(shù)據(jù)倉(cāng)庫(kù)中的信息并不是對(duì)各個(gè)數(shù)據(jù)源簡(jiǎn)單的選擇、抽取,而是首先進(jìn)行一系列的加工、整理和轉(zhuǎn)換等來(lái)消除源數(shù)據(jù)中的不一致;同時(shí)按照本行業(yè)的邏輯模型設(shè)計(jì)便于查詢及分析的數(shù)據(jù)倉(cāng)庫(kù)。然后按照組織或企業(yè)的需求,針對(duì)不同的主題對(duì)數(shù)據(jù)進(jìn)行某種程度的綜合、概括和聚集,將源數(shù)據(jù)加載進(jìn)數(shù)據(jù)倉(cāng)庫(kù)。經(jīng)過(guò)這樣的處理,數(shù)據(jù)就具有了集成性,可以用于決策分析。
1.3 反映歷史變化(Time-variant)
“反映歷史變化”是指數(shù)據(jù)倉(cāng)庫(kù)內(nèi)的信息并不只是反映企業(yè)當(dāng)前的狀態(tài),而是記錄了從過(guò)去某一時(shí)點(diǎn)到當(dāng)前各個(gè)階段的信息。通過(guò)這些信息,可以對(duì)企業(yè)的發(fā)展歷程和未來(lái)趨勢(shì)做出定量分析和預(yù)測(cè)。而信息本身相對(duì)穩(wěn)定,是指一旦某個(gè)數(shù)據(jù)進(jìn)入數(shù)據(jù)倉(cāng)庫(kù)以后,一般很少進(jìn)行修改,更多的是對(duì)信息進(jìn)行查詢操作。
1.4 相對(duì)穩(wěn)定(Non-volatile)
“相對(duì)穩(wěn)定”是指數(shù)據(jù)一旦進(jìn)入數(shù)據(jù)倉(cāng)庫(kù),一般情況下會(huì)被長(zhǎng)期保留,所涉及的數(shù)據(jù)操作也主要是查詢、分析,很少會(huì)被修改或刪除,通常也只需要定期地加載和刷新。相對(duì)穩(wěn)定性保證了數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)能夠真實(shí)地反映歷史變化。
2 數(shù)據(jù)倉(cāng)庫(kù)的產(chǎn)生
數(shù)據(jù)倉(cāng)庫(kù)是在數(shù)據(jù)庫(kù)基礎(chǔ)上發(fā)展而來(lái)的,通常包含三個(gè)部分內(nèi)容:數(shù)據(jù)倉(cāng)庫(kù)、聯(lián)機(jī)分析處理(0-LAP-On-Line Transaction Process)、數(shù)據(jù)挖掘(Data Mining)。從數(shù)據(jù)庫(kù)到數(shù)據(jù)倉(cāng)庫(kù)的源驅(qū)動(dòng)力來(lái)自組織或企業(yè)的業(yè)務(wù)發(fā)展需求。
早期的數(shù)據(jù)庫(kù)系統(tǒng)主要應(yīng)用于日常事務(wù)的操作性處理,即OLTP,重點(diǎn)在于完成事務(wù)處理,在短時(shí)間內(nèi)給予用戶響應(yīng),服務(wù)于操作型業(yè)務(wù)需求,可以稱之為“操作型數(shù)據(jù)庫(kù)”。
隨著業(yè)務(wù)應(yīng)用不斷拓展,以及市場(chǎng)競(jìng)爭(zhēng)不斷加劇,數(shù)據(jù)分析師和企業(yè)家們發(fā)現(xiàn)僅僅依靠聯(lián)機(jī)事務(wù)處理系統(tǒng)OLTP已經(jīng)不足以獲得市場(chǎng)競(jìng)爭(zhēng)的優(yōu)勢(shì),希望能夠從龐大的日常業(yè)務(wù)數(shù)據(jù)以及歷史歸檔數(shù)據(jù)中,分析發(fā)掘出潛在的、規(guī)律性的、更有價(jià)值的信息。用于對(duì)企業(yè)的業(yè)務(wù)運(yùn)作以及市場(chǎng)的行業(yè)態(tài)勢(shì)進(jìn)行分析判斷,從而做出正確的決策。這就推動(dòng)了數(shù)據(jù)倉(cāng)庫(kù)的產(chǎn)生,即服務(wù)于分析型業(yè)務(wù)需求的系統(tǒng),可以稱之為“分析型數(shù)據(jù)庫(kù)”。
將操作型(事務(wù)處理)數(shù)據(jù)庫(kù)系統(tǒng)與分析型(決策支持)數(shù)據(jù)庫(kù)系統(tǒng)分離,主要有以下五個(gè)原因:
(1)業(yè)務(wù)應(yīng)用的響應(yīng)時(shí)間不同
在操作型(事務(wù)處理)計(jì)算環(huán)境中,其業(yè)務(wù)應(yīng)用的處理特點(diǎn)是數(shù)據(jù)的存取操作頻率高,而每次操作處理的時(shí)間短。因此,用戶的業(yè)務(wù)請(qǐng)求往往在很短時(shí)間內(nèi)即可完成,使得系統(tǒng)在多用戶并發(fā)訪問(wèn)的情況下,也可以保持較高的實(shí)時(shí)響應(yīng)速度。
在分析型(決策支持)計(jì)算環(huán)境中,其決策分析問(wèn)題的解決,往往需要遍歷數(shù)據(jù)庫(kù)中的大部分?jǐn)?shù)據(jù),不僅需要消耗大量的系統(tǒng)資源,還可能導(dǎo)致長(zhǎng)達(dá)數(shù)小時(shí)的運(yùn)行。因此,用戶的業(yè)務(wù)請(qǐng)求并不要求瞬間響應(yīng),只要在允許的時(shí)間里給予響應(yīng)即可。
(2)數(shù)據(jù)需求的集成要求不同
在操作型數(shù)據(jù)庫(kù)中,數(shù)據(jù)往往是分散而非集成的。主要原因有操作型(事務(wù)處理)應(yīng)用分散的問(wèn)題、“蜘蛛網(wǎng)”問(wèn)題、數(shù)據(jù)不一致問(wèn)題、外部數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)等問(wèn)題。
在分析型數(shù)據(jù)庫(kù)中,首先需要解決的就是“數(shù)據(jù)集成”的問(wèn)題。只有全面、廣泛、準(zhǔn)確、相關(guān)的數(shù)據(jù)收集和有效集成,才有可能得到可信的分析結(jié)果。
(3)歷史數(shù)據(jù)的使用價(jià)值不同
操作型(事務(wù)處理)系統(tǒng)一般只處理當(dāng)前數(shù)據(jù),在數(shù)據(jù)庫(kù)中也只是短期存儲(chǔ)數(shù)據(jù),且不同數(shù)據(jù)的保存期限也不一樣,即使有一些歷史數(shù)據(jù)保存下來(lái)了,無(wú)特殊需求一般不再訪問(wèn)。
在分析型(決策支持)系統(tǒng)中,歷史數(shù)據(jù)是相當(dāng)重要的,因?yàn)槁?lián)機(jī)分析處理與數(shù)據(jù)挖掘都需要以大量的、詳細(xì)的、且有一定時(shí)間、空間跨度的歷史數(shù)據(jù)為基礎(chǔ),才可能發(fā)現(xiàn)潛在發(fā)展規(guī)律和趨勢(shì)走向。
(4)服務(wù)支持的用戶對(duì)象不同
操作型(事務(wù)處理)系統(tǒng)直接面向業(yè)務(wù)操作人員,提供數(shù)據(jù)處理支持。
分析型(決策支持)系統(tǒng)面向使用本系統(tǒng)的業(yè)務(wù)者和中高層管理人員,提供決策分析支持。
(5)數(shù)據(jù)的綜合問(wèn)題
在事務(wù)處理系統(tǒng)中積累了大量的細(xì)節(jié)數(shù)據(jù),一般而言,DSS并不對(duì)這些細(xì)節(jié)數(shù)據(jù)進(jìn)行分析。在分析前,往往需要對(duì)細(xì)節(jié)數(shù)據(jù)進(jìn)行不同程度的綜合。而事務(wù)處理系統(tǒng)不具備這種綜合能力,根據(jù)數(shù)據(jù)庫(kù)的規(guī)范化理論,這種綜合還往往因?yàn)槭且环N數(shù)據(jù)冗余而加以限制。這也是二者相矛盾的地方。
綜上所述,要提高分析和決策的有效性,必須把分析型數(shù)據(jù)從操作型(事務(wù)處理)環(huán)境中分離出來(lái),按照分析型(決策支持)系統(tǒng)處理的需要進(jìn)行重新組織,建立相應(yīng)的分析處理環(huán)境。數(shù)據(jù)倉(cāng)庫(kù)正是為了構(gòu)建這種新的分析處理環(huán)境而出現(xiàn)的一種數(shù)據(jù)存儲(chǔ)、組織和處理技術(shù)。#p#
3 數(shù)據(jù)倉(cāng)庫(kù)的概念模型與功能
數(shù)據(jù)倉(cāng)庫(kù)是一種體系結(jié)構(gòu)而不是一種技術(shù)。數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)庫(kù)及其他技術(shù)之間的關(guān)系就像體系結(jié)構(gòu)與技術(shù)本身之間的關(guān)系。數(shù)據(jù)倉(cāng)庫(kù)的概念結(jié)構(gòu)包含:數(shù)據(jù)源、數(shù)據(jù)準(zhǔn)備區(qū)、數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)庫(kù)、數(shù)據(jù)集市/知識(shí)挖掘庫(kù)以及各種管理工具和應(yīng)用工具等,如圖l所示。
從圖1可以看出,數(shù)據(jù)倉(cāng)庫(kù)的創(chuàng)建、應(yīng)用,可以利用各種數(shù)據(jù)倉(cāng)庫(kù)管理工具輔助完成。數(shù)據(jù)倉(cāng)庫(kù)建立之后,首先要從“數(shù)據(jù)源”中抽取相關(guān)的數(shù)據(jù)到“數(shù)據(jù)準(zhǔn)備區(qū)”;在“數(shù)據(jù)準(zhǔn)備區(qū)”中經(jīng)過(guò)凈化處理后,再加載到“數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)庫(kù)”;***根據(jù)用戶的需求將數(shù)據(jù)導(dǎo)入“數(shù)據(jù)集市”或“知識(shí)挖掘庫(kù)”中。用戶在使用數(shù)據(jù)倉(cāng)庫(kù)時(shí),主要利用兩類應(yīng)用工具:一類是聯(lián)機(jī)分析處理(On-Line Analvtica1 Processing),主要用于分析歷史發(fā)展變化;另一類是數(shù)據(jù)挖掘(Date Mining) ,主要用于預(yù)測(cè)未來(lái)趨勢(shì)走向。
圖2展示的是數(shù)據(jù)倉(cāng)庫(kù)的完整體系結(jié)構(gòu),一個(gè)數(shù)據(jù)倉(cāng)庫(kù)的實(shí)施是按照?qǐng)D2所示的過(guò)程進(jìn)行的,也可以將圖2看做是數(shù)據(jù)倉(cāng)庫(kù)的工程實(shí)施方法論。
圖2數(shù)據(jù)倉(cāng)庫(kù)的體系結(jié)構(gòu)
數(shù)據(jù)倉(cāng)庫(kù)的實(shí)施分?jǐn)?shù)據(jù)獲取、數(shù)據(jù)組織、數(shù)據(jù)應(yīng)用和數(shù)據(jù)展示四個(gè)功能區(qū)。
(1)數(shù)據(jù)獲取區(qū)
數(shù)據(jù)獲取區(qū)主要包含數(shù)據(jù)源、數(shù)據(jù)轉(zhuǎn)換區(qū)、數(shù)據(jù)質(zhì)量管理三個(gè)組成部分,實(shí)現(xiàn)數(shù)據(jù)倉(cāng)庫(kù)模型建設(shè)、數(shù)據(jù)質(zhì)量管理、數(shù)據(jù)源的定義、數(shù)據(jù)抽取、轉(zhuǎn)換清洗及加載等功能。
① 數(shù)據(jù)源
即數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)來(lái)源,既包含組織內(nèi)部的業(yè)務(wù)數(shù)據(jù)、歷史數(shù)據(jù)、辦公數(shù)據(jù)等,也包括互聯(lián)網(wǎng)卜的相關(guān)Web數(shù)據(jù),以及部分其他數(shù)據(jù)結(jié)構(gòu)的數(shù)據(jù)。
目前在國(guó)土資源行業(yè)中,就有大量的地政管理基礎(chǔ)數(shù)據(jù)庫(kù)和礦政管理基礎(chǔ)數(shù)據(jù)庫(kù):如 1:50萬(wàn)全國(guó)土地利用數(shù)據(jù)庫(kù)、***土地利用數(shù)據(jù)庫(kù)、土地利用遙感監(jiān)測(cè)數(shù)據(jù)庫(kù)、***建設(shè)用地?cái)?shù)據(jù)庫(kù)、全國(guó)礦業(yè)權(quán)管理數(shù)據(jù)庫(kù)、全國(guó)油氣礦產(chǎn)儲(chǔ)量數(shù)據(jù)庫(kù)等,還有一些歷史數(shù)據(jù)、辦公數(shù)據(jù)以及非結(jié)構(gòu)化的數(shù)據(jù)等,均可作為國(guó)土數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)源。
② 數(shù)據(jù)轉(zhuǎn)換區(qū)(ETL)
由于數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)來(lái)源十分復(fù)雜,這些數(shù)據(jù)在進(jìn)入數(shù)據(jù)倉(cāng)庫(kù)之前必須在數(shù)據(jù)轉(zhuǎn)換區(qū)內(nèi)進(jìn)行預(yù)處理,完成數(shù)據(jù)獲取、數(shù)據(jù)轉(zhuǎn)換、數(shù)據(jù)加載等工作,并實(shí)現(xiàn)數(shù)據(jù)質(zhì)量跟蹤監(jiān)控以及元數(shù)據(jù)抽取與創(chuàng)建等工作。
③ 數(shù)據(jù)質(zhì)量管理
數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)質(zhì)量不但影響數(shù)據(jù)抽取轉(zhuǎn)換的開(kāi)發(fā)周期和日常維護(hù),并且還直接影響到最終結(jié)果。因此在數(shù)據(jù)倉(cāng)庫(kù)的項(xiàng)目中,將數(shù)據(jù)質(zhì)量的評(píng)估、管理和清洗設(shè)計(jì)進(jìn)去,并融合在數(shù)據(jù)倉(cāng)庫(kù)和ETL的建設(shè)過(guò)程中。
(2)數(shù)據(jù)組織區(qū)和數(shù)據(jù)應(yīng)用區(qū)
數(shù)據(jù)組織區(qū)和數(shù)據(jù)應(yīng)用區(qū)主要實(shí)現(xiàn)數(shù)據(jù)的存儲(chǔ)與管理。數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)組織管理方式?jīng)Q定了其有別于傳統(tǒng)數(shù)據(jù)庫(kù)的特性,也決定了對(duì)外的數(shù)據(jù)表現(xiàn)形式。主要技術(shù)涉及多維數(shù)據(jù)庫(kù)、海量數(shù)據(jù)管理、數(shù)據(jù)索引與監(jiān)視、數(shù)據(jù)質(zhì)量管理、元數(shù)據(jù)管理等方面。
數(shù)據(jù)組織區(qū)包含了數(shù)據(jù)倉(cāng)庫(kù)建模,以及數(shù)據(jù)的集成與分解、概括與聚集、預(yù)算與推導(dǎo)、翻譯與格式化、轉(zhuǎn)換與映像等功能。元數(shù)據(jù)管理主要包含了元數(shù)據(jù)游覽與導(dǎo)航,元數(shù)據(jù)創(chuàng)建,創(chuàng)建詞匯表等功能。
數(shù)據(jù)倉(cāng)庫(kù)實(shí)體模型是直接反映數(shù)據(jù)倉(cāng)庫(kù)業(yè)務(wù)的邏輯視窗,根據(jù)組織的業(yè)務(wù)發(fā)展規(guī)劃與策略而制定。實(shí)體模型的設(shè)計(jì)應(yīng)由業(yè)務(wù)人員與模型專家共同完成,要統(tǒng)籌規(guī)劃、總體設(shè)計(jì)、分步實(shí)施,既要考慮模型的完整性、靈活性,也要關(guān)注擴(kuò)展能力和時(shí)效性,可以先從業(yè)務(wù)問(wèn)題緊迫、數(shù)據(jù)源較完備的主題入手。實(shí)體模型設(shè)計(jì)一般采用第三范式、星型模型、雪花狀模型等。
數(shù)據(jù)倉(cāng)庫(kù)的存取與使用主要為用戶提供決策分析和知識(shí)挖掘等功能,包括數(shù)據(jù)倉(cāng)庫(kù)存取與檢索、分析與報(bào)告兩部分功能。其中,數(shù)據(jù)倉(cāng)庫(kù)的存取與檢索為用戶提供了訪問(wèn)數(shù)據(jù)倉(cāng)庫(kù)或數(shù)據(jù)集市的功能,可以將用戶所檢索的數(shù)據(jù)轉(zhuǎn)換為多維數(shù)據(jù)并存入多維數(shù)據(jù)庫(kù),包含數(shù)據(jù)倉(cāng)庫(kù)的直接存取,數(shù)據(jù)集市存取,數(shù)據(jù)集市重整,轉(zhuǎn)換為多維結(jié)構(gòu),創(chuàng)建局部存儲(chǔ)等功能;數(shù)據(jù)倉(cāng)庫(kù)的分析與報(bào)告為用戶使用數(shù)據(jù)倉(cāng)庫(kù)提供了一組工具,用于幫助用戶對(duì)數(shù)據(jù)倉(cāng)庫(kù)或數(shù)據(jù)集市進(jìn)行聯(lián)機(jī)分析或數(shù)據(jù)挖掘,包括報(bào)表處理、分析與決策支持、業(yè)務(wù)建模與分析、數(shù)據(jù)挖掘等工具。
(3)數(shù)據(jù)展示區(qū)
數(shù)據(jù)展示區(qū)是數(shù)據(jù)倉(cāng)庫(kù)的人機(jī)會(huì)話接口,包含了多維分析、數(shù)理統(tǒng)計(jì)、報(bào)表查詢、即席查詢、關(guān)鍵績(jī)效指標(biāo)監(jiān)控和數(shù)據(jù)挖掘等功能,并通過(guò)報(bào)表、圖形和其它分析工具,方便用戶簡(jiǎn)便、快捷地訪問(wèn)數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)中的各種數(shù)據(jù),得到分析結(jié)果。
數(shù)據(jù)展示區(qū)常用的標(biāo)準(zhǔn)報(bào)表和即席查詢報(bào)表是基于各類結(jié)構(gòu)化數(shù)據(jù)的報(bào)表輸出,而各類結(jié)構(gòu)化數(shù)據(jù)的內(nèi)容包含關(guān)系型數(shù)據(jù)庫(kù)、多維數(shù)據(jù)庫(kù)、XML、文本及其他數(shù)據(jù)結(jié)構(gòu)等。
4 數(shù)據(jù)倉(cāng)庫(kù)的相關(guān)技術(shù)
數(shù)據(jù)倉(cāng)庫(kù)構(gòu)建了數(shù)據(jù)集市,這是面向某一主題、某一業(yè)務(wù)過(guò)程或者某一組業(yè)務(wù)過(guò)程應(yīng)用的“數(shù)據(jù)倉(cāng)庫(kù)”,是企業(yè)級(jí)數(shù)據(jù)倉(cāng)庫(kù)的一個(gè)子集。
聯(lián)系源數(shù)據(jù)與數(shù)據(jù)倉(cāng)庫(kù)的是數(shù)據(jù)登臺(tái)區(qū),它是一個(gè)數(shù)據(jù)獲取過(guò)程,主要由數(shù)據(jù)抽取(Extract)、轉(zhuǎn)換(Transform)、清洗(Cleansing)、裝載(Load)等一系列工作構(gòu)成,用于從數(shù)據(jù)源抽取出所需的數(shù)據(jù),經(jīng)過(guò)數(shù)據(jù)清洗,按照預(yù)先定義好的數(shù)據(jù)倉(cāng)庫(kù)模型,將數(shù)據(jù)加載到數(shù)據(jù)倉(cāng)庫(kù)中去。
聯(lián)機(jī)分析處理主要用于對(duì)歷史發(fā)展規(guī)律進(jìn)行分析,滿足在多維環(huán)境下特定的查詢和報(bào)表需求,提供決策支持。聯(lián)機(jī)分析處理(On-Line Analytical Processing)是一種普遍查詢過(guò)程,能夠根據(jù)分析人員的要求,迅速、靈活地對(duì)大量數(shù)據(jù)進(jìn)行復(fù)雜的查詢處理,并以直觀、容易理解的形式將查詢結(jié)果提交給決策人員。
數(shù)據(jù)挖掘是一種決策支持過(guò)程,基于人工智能、機(jī)器學(xué)習(xí)、神經(jīng)計(jì)算、統(tǒng)計(jì)分析等技術(shù),能夠自動(dòng)化地分析數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù),進(jìn)行歸納性推理和聯(lián)想,尋找數(shù)據(jù)間的某種內(nèi)在聯(lián)系,從中發(fā)掘出潛在的、對(duì)信息預(yù)測(cè)和決策行為起著十分重要作用的模式,輔助決策支持。數(shù)據(jù)挖掘主要用于對(duì)未來(lái)發(fā)展趨勢(shì)進(jìn)行預(yù)測(cè)。元數(shù)據(jù)作為數(shù)據(jù)的數(shù)據(jù),主要用于對(duì)數(shù)據(jù)倉(cāng)庫(kù)中的各種數(shù)據(jù)進(jìn)行詳細(xì)的描述和說(shuō)明,主要分為靜態(tài)元數(shù)據(jù)和動(dòng)態(tài)元數(shù)據(jù)兩大類:靜態(tài)元數(shù)據(jù)主要與數(shù)據(jù)結(jié)構(gòu)有關(guān),包含名稱、描述、格式、數(shù)據(jù)類型、關(guān)系、域、業(yè)務(wù)規(guī)則等類;動(dòng)態(tài)元數(shù)據(jù)主要與數(shù)據(jù)的狀態(tài)及使用方法有關(guān),包括數(shù)據(jù)質(zhì)量、統(tǒng)計(jì)信息、狀態(tài)、處理等類。
Ad hoc query:即席查詢,數(shù)據(jù)庫(kù)應(yīng)用最普遍的一種查詢,利用數(shù)據(jù)倉(cāng)庫(kù)技術(shù),可以讓用戶隨時(shí)可以面對(duì)數(shù)據(jù)庫(kù),獲取所希望的數(shù)據(jù)。
【編輯推薦】