SQL Server 2000 數(shù)據(jù)倉庫中使用分區(qū)之分區(qū)的優(yōu)點
下面的文章主要介紹的是在SQL Server 2000 數(shù)據(jù)倉庫中使用分區(qū)之分區(qū)的優(yōu)點,SQL Server 2000 數(shù)據(jù)倉庫中使用分區(qū)在實際操作中是經(jīng)常出現(xiàn)的,如果你對其相關(guān)知識有興趣了解的話,你就可以瀏覽以下的文章了。
分區(qū)視圖主要是聯(lián)接來自一組成員的水平分區(qū)的相關(guān)數(shù)據(jù),使數(shù)據(jù)看起來象來自同一張表。SQL Server 2000 區(qū)分本地分區(qū)視圖和分布式分區(qū)視圖。
在本地分區(qū)視圖中,所有相關(guān)表和視圖駐留在 SQL Server 的同一實例上。在分布式分區(qū)視圖中,相關(guān)表中至少有一張表駐留在其他某個(遠程)服務器上。建議您不要將分布式分區(qū)視圖用于數(shù)據(jù)倉庫應用程序。
矢量SQL Server 2000 數(shù)據(jù)倉庫圍繞事實(標量)和矢量構(gòu)建,從物理上通常表示為星形架構(gòu)和雪花形架構(gòu),極少有同時包含事實和矢量的完全非正交化的平面表。由于矢量架構(gòu)是最常見的關(guān)系型數(shù)據(jù)倉庫結(jié)構(gòu),本文集中討論這類架構(gòu)的分區(qū)。下面的建議也適用于其他通用數(shù)據(jù)倉庫架構(gòu)。
分區(qū)的優(yōu)點 :
數(shù)據(jù)修剪:
許多數(shù)據(jù)倉庫管理員會定期將陳舊的數(shù)據(jù)歸檔。例如,一個單擊流SQL Server 2000 數(shù)據(jù)倉庫可能只將詳細數(shù)據(jù)聯(lián)機保留三至四個月。其他常見的規(guī)則可能是聯(lián)機保留 13 個月、37 個月或 10 年,當舊數(shù)據(jù)不在活動窗口中時就歸檔并從數(shù)據(jù)庫中刪除。這種滾動窗口結(jié)構(gòu)是大數(shù)據(jù)倉庫通常采取的做法。
在沒有分區(qū)表的情況下,從數(shù)據(jù)庫中刪除舊數(shù)據(jù)的進程需要一個很大的 DELETE 語句,例如:
DELETE FROM fact_table WHERE date_key < 19990101
執(zhí)行該語句開銷會非常大,可能比同一張表的加載進程需要更多的時間。相反,對于分區(qū)表,管理員重新定義 UNION ALL 視圖以排除最舊的表,然后將該表從數(shù)據(jù)庫中刪除(假設(shè)已確保備份該表),這個過程幾乎可以在瞬間完成。
后面我們會討論到,維護分區(qū)表的費用也很高。如果數(shù)據(jù)修剪是采用分區(qū)的唯一原因,設(shè)計者應考慮以數(shù)據(jù)分解的方式從未分區(qū)的表中刪除舊數(shù)據(jù)。在低優(yōu)先級進程上連續(xù)運行一個每次刪除 1000 行(用“set rowcount 1000”命令)的腳本,直至刪除所有希望刪除的數(shù)據(jù)。該技術(shù)可在大系統(tǒng)上有效運用,比創(chuàng)建必要的分區(qū)管理系統(tǒng)更為直接。根據(jù)加載量和系統(tǒng)使用狀況,該技術(shù)適合于某些系統(tǒng),并應該考慮在系統(tǒng)上進行基準測試。
加載速度:
加載數(shù)據(jù)最快的方法是將數(shù)據(jù)加載至空表或沒有索引的表。通過加載至較小的分區(qū)表,漸變加載進程的效率將大大提高。
可維護性:
一旦已建成支持分區(qū)的SQL Server 2000 數(shù)據(jù)倉庫分階段應用程序,整個系統(tǒng)將變得容易維護。維護活動(包括加載數(shù)據(jù)、備份和還原表)可以并行地執(zhí)行,這樣可以極大地改善性能。漸變填充下行數(shù)據(jù)流多維數(shù)據(jù)集的進程可以被加速和簡化。
查詢速度:
查詢速度不應該作為對數(shù)據(jù)倉庫關(guān)系型數(shù)據(jù)庫進行分區(qū)的理由。對于分區(qū)和未分區(qū)的事實表,查詢性能都差不多。在正確設(shè)計的分區(qū)數(shù)據(jù)庫中,關(guān)系引擎僅在查詢計劃中包括解析查詢所需的相關(guān)分區(qū)。例如,如果數(shù)據(jù)庫按月分區(qū),查詢條件為 2000 年 1 月,則查詢計劃僅包括 2000 年 1 月的分區(qū)。結(jié)果查詢將對分區(qū)表正確執(zhí)行,與在分區(qū)鍵上帶有簇索引的已索引合并表上執(zhí)行的大體相同。
【編輯推薦】
- 配置Tomcat+SQL Server2000連接池流程
- 正確分析MS SQL Server函數(shù)的2種用法
- SQL Server Model增加一些變化,很簡單!
- 易混淆的SQL Server數(shù)據(jù)類型列舉
- SQL Server 2000的安全配置流程與基礎(chǔ)