如何輕松掌握數(shù)據(jù)庫和聯(lián)機(jī)處理
導(dǎo)讀:Microsoft SQL Server 2000提供可用于生成數(shù)據(jù)倉庫或數(shù)據(jù)集市的組件。數(shù)據(jù)倉庫或數(shù)據(jù)集市可用于先進(jìn)的企業(yè)智能系統(tǒng),以處理發(fā)現(xiàn)趨勢(shì)和分析關(guān)鍵因素所需的查詢。這些系統(tǒng)稱為聯(lián)機(jī)分析處理 (OLAP) 系統(tǒng)。數(shù)據(jù)倉庫和數(shù)據(jù)集市中的數(shù)據(jù)組織方式與傳統(tǒng)的事務(wù)處理數(shù)據(jù)庫不同。
企業(yè)級(jí)關(guān)系數(shù)據(jù)庫管理軟件(如 SQL Server 2000)最初旨在集中存儲(chǔ)由大公司或政府機(jī)構(gòu)中的日常事務(wù)所產(chǎn)生的數(shù)據(jù)。在過去的幾十年中,這些數(shù)據(jù)庫已發(fā)展成為記錄執(zhí)行企業(yè)日常操作所需數(shù)據(jù)的高效系統(tǒng)。由于這些系統(tǒng)基于計(jì)算機(jī)并記錄企業(yè)的業(yè)務(wù)事務(wù),因此被稱為聯(lián)機(jī)事務(wù)處理 (OLTP) 系統(tǒng)。
OLTP 系統(tǒng)
OLTP 系統(tǒng)中的數(shù)據(jù)主要被組織為支持如下事務(wù):
- 記錄來自銷售點(diǎn)終端或通過 Web 站點(diǎn)輸入的定單。
- 當(dāng)庫存水平降到定義的水平時(shí),訂購更多的貨物。
- 跟蹤在制造廠被組裝為成品的組件。
- 記錄職員數(shù)據(jù)。
- 記錄執(zhí)照的持有者,如餐館營(yíng)業(yè)執(zhí)照或駕駛執(zhí)照。
個(gè)別事務(wù)能夠很快地完成,并且只需訪問相對(duì)較少的數(shù)據(jù)。OLTP 系統(tǒng)旨在處理同時(shí)輸入的成百上千的事務(wù)。
盡管 OLTP 系統(tǒng)擅長(zhǎng)記錄支持日常操作所需的數(shù)據(jù),但是 OLTP 數(shù)據(jù)的組織方式不能很容易地為管理人員提供計(jì)劃單位工作所需的信息。管理人員需要對(duì)信息進(jìn)行匯總,以獲取分析影響單位或小組的趨勢(shì)所需的信息。他們需要找出影響單位成功的關(guān)鍵因素,以及如何最好地調(diào)整那些提高企業(yè)成功的因素。他們需要找出企業(yè)的工作負(fù)荷如何受季節(jié)和年度趨勢(shì)的影響,以便可以預(yù)測(cè)完成將來的工作所需的職員和資源數(shù)量。
OLAP 系統(tǒng)
旨在處理發(fā)現(xiàn)趨勢(shì)和關(guān)鍵因素所需的查詢的系統(tǒng)稱為聯(lián)機(jī)分析處理 (OLAP) 系統(tǒng)。OLAP 查詢通常需要大量的數(shù)據(jù)。例如,政府機(jī)動(dòng)車輛執(zhí)照部的領(lǐng)導(dǎo)可能需要一份報(bào)告,顯示過去二十年中每年由該部門注冊(cè)的車輛的牌號(hào)和型號(hào)。對(duì) OLTP 系統(tǒng)中的原始詳細(xì)數(shù)據(jù)運(yùn)行這類查詢有兩個(gè)結(jié)果:
- 查詢需要花很長(zhǎng)時(shí)間聚合 (sum) 過去二十年的全部詳細(xì)記錄,所以報(bào)告不能及時(shí)準(zhǔn)備好。
- 查詢產(chǎn)成很大的工作負(fù)荷,至少會(huì)減慢系統(tǒng)的普通用戶以正常水平記錄事務(wù)的速度。
另一個(gè)問題是許多大企業(yè)并不是只使用一個(gè) OLTP 系統(tǒng)記錄所有的事務(wù)數(shù)據(jù)。多數(shù)大企業(yè)有多個(gè) OLTP 系統(tǒng),在這些系統(tǒng)中,有許多是在不同的時(shí)間使用不同的軟件和硬件開發(fā)出來的。在許多情況下,一個(gè)系統(tǒng)中用于標(biāo)識(shí)項(xiàng)目的代碼和名稱與另一個(gè)系統(tǒng)中所使用的代碼和名稱是不同的。管理人員在運(yùn)行 OLAP 查詢時(shí),通常需要能從其中的幾個(gè) OLTP 系統(tǒng)中引用數(shù)據(jù)。
OLAP 數(shù)據(jù)被組織到多維數(shù)據(jù)集中。與組織到關(guān)系表中的數(shù)據(jù)相比,多維數(shù)據(jù)集中的數(shù)據(jù)結(jié)構(gòu)為 OLAP 查詢提供了更好的性能。多維數(shù)據(jù)集的基本單元稱為度量值。度量值是所分析數(shù)據(jù)的組成單元。例如,一家經(jīng)營(yíng)硬件商店的公司想分析出售的不同產(chǎn)品的收入和折扣。度量值就是售出的部件數(shù)、收入以及折扣總和。度量值是按維度組織的。在這個(gè)例子中,一個(gè)三維數(shù)據(jù)集可以有三個(gè)維度:時(shí)間、商店和產(chǎn)品。設(shè)想這三個(gè)維度形成三維虛擬數(shù)據(jù)集的邏輯 x、y 和 z 軸。
每個(gè)維度被劃分為稱為成員的單元。維度的成員通常被組織到層次結(jié)構(gòu)中。相似的成員組合在一起,構(gòu)成層次結(jié)構(gòu)的層次。例如,時(shí)間維度層次結(jié)構(gòu)的頂層可以是年,下一層是月,然后是周、日,最后位于層次結(jié)構(gòu)底層的是小時(shí)。在這三個(gè)維度的交叉點(diǎn),記錄與這三個(gè)維度值相匹配的度量值。例如,假設(shè)開始于 2000 年 2 月 19 日、星期六下午一點(diǎn)的小時(shí)是時(shí)間維度成員,New York 州 Albany 市的 Store #2 店是商店維度成員,Easy-Clean Mops 是產(chǎn)品維度成員。在這三個(gè)維度的交叉點(diǎn),單元中記錄著售出了 10 個(gè)拖把,收入為 $90,00,平均折扣為 $1,00。
在任何一個(gè) OLAP 系統(tǒng)中,為多維數(shù)據(jù)集定義的特定維度和度量值都取決于各種分析,而這些分析對(duì)企業(yè)很重要。將關(guān)系表中的 OLTP 數(shù)據(jù)轉(zhuǎn)換為 OLAP 多維數(shù)據(jù)集,以及多維數(shù)據(jù)集的設(shè)計(jì),這些都是非常復(fù)雜的領(lǐng)域,許多第三方書籍對(duì)此有專門論述。
OLAP 系統(tǒng)在數(shù)據(jù)倉庫或數(shù)據(jù)集市中的 OLAP 數(shù)據(jù)上操作。數(shù)據(jù)倉庫存儲(chǔ)企業(yè)級(jí) OLAP 數(shù)據(jù),而數(shù)據(jù)集市較小,通常只適用于組織內(nèi)的一項(xiàng)功能。
關(guān)于輕松掌握數(shù)據(jù)庫和聯(lián)機(jī)處理就為大家介紹到這,以后如果有更新的這方面內(nèi)容,我會(huì)繼續(xù)及時(shí)為大家更新,希望文中講到的內(nèi)容都能對(duì)大家有所幫助。
【編輯推薦】