數(shù)據(jù)庫中表分割和表分區(qū)的區(qū)別比較
在數(shù)據(jù)庫操作中,我們常常會(huì)聽到表分區(qū)和表分割這兩個(gè)術(shù)語,那么它們是做什么的呢?它們之間的區(qū)別又是什么呢?本文我們就來介紹這一部分內(nèi)容。
個(gè)人認(rèn)為理論上使用表分割在性能上應(yīng)該和建立表分區(qū)查不多,但是,表分割對(duì)于所有的數(shù)據(jù)庫都適用,而表分區(qū)只能用于oracle這樣的特定的數(shù)據(jù)庫;表分區(qū)屬于數(shù)據(jù)庫物理設(shè)計(jì),表分割屬于邏輯設(shè)計(jì)。
表分區(qū):
表分區(qū)是ORACLE對(duì)于非常大的表進(jìn)行優(yōu)化的一種有效方法, 是非常有效的一種手段, 在很多情況下,比你說的表分割更有效,比如,有一個(gè)代碼表,使用分區(qū)表把100萬紀(jì)錄分在10個(gè)分區(qū)中(ID 每從1到10萬為一個(gè)分區(qū)),那樣寫查詢語句的時(shí)候,只要給出查詢條件中所需要的代碼,ORACLE自動(dòng)會(huì)定位到對(duì)應(yīng)的分區(qū)進(jìn)行查詢,大大降低的查詢時(shí)間. 而采用表分割,那必須先根據(jù)查詢的代碼指定所要查詢的表,才能找到相應(yīng)的紀(jì)錄. 而且,如果有下面這樣的語句,查詢的條件是跨分區(qū)的:
SELECT * FROM MYTABLE WHERE ID BETWEEN 99000 AND 10111;
在分區(qū)表中是非常容易實(shí)現(xiàn)的,ORACLE會(huì)自動(dòng)在兩個(gè)分區(qū)中查詢;而采用表分割的話是否必須寫成兩個(gè)查詢語句在UNION ALL。
事實(shí)上,大型的數(shù)據(jù)庫都有對(duì)大表的特殊處理方式(類似于分區(qū)表),如果太強(qiáng)調(diào)可移植性而放棄這些最重要的特性的話,那性能很可能受到很大的影響.
即便是oracle數(shù)據(jù)庫,當(dāng)數(shù)據(jù)量很大時(shí),用分表比用表分區(qū)要快些,尤其是在表用到group by求和等操作。
我也認(rèn)為表分區(qū)要好一些,也就是一般說來的分區(qū)表,對(duì)這些表操作起來有很多強(qiáng)大的功能,說他強(qiáng)大主要是體現(xiàn)在對(duì)與表中有海量數(shù)據(jù)的情況之下的,試問大家一個(gè)其中有1億條記錄的表你是否會(huì)經(jīng)常的將其移植到其他數(shù)據(jù)庫系統(tǒng)當(dāng)中去呢?
表分區(qū)基于物理存儲(chǔ),還有就是基于分區(qū)的索引可以使用,很不錯(cuò)的,當(dāng)然,這些都是在海量數(shù)據(jù)情況之下的比較,但是如果真要是數(shù)據(jù)量不大的情況下比較,我想要比較分區(qū)表和表分割就沒什么意思了。
表分區(qū)的效果對(duì)硬件有所依賴,而且效果恐怕不如諸位想象中那么好。我做過一點(diǎn)測(cè)試,很失望。
而表分割的效率提升在很多時(shí)候(不是所有時(shí)候)是很明顯的。
當(dāng)然這都是在巨型表的前提下討論,縮小表和索引的規(guī)模有利于提高效率,這正是分割表的特點(diǎn)。
表分割:
1、水平分割:根據(jù)一列或多列數(shù)據(jù)的值把數(shù)據(jù)行放到兩個(gè)獨(dú)立的表中。
水平分割通常在下面的情況下使用:A 表很大,分割后可以降低在查詢時(shí)需要讀的數(shù)據(jù)和索引的頁數(shù),同時(shí)也降低了索引的層數(shù),提高查詢速度。B 表中的數(shù)據(jù)本來就有獨(dú)立性,例如表中分別記錄各個(gè)地區(qū)的數(shù)據(jù)或不同時(shí)期的數(shù)據(jù),特別是有些數(shù)據(jù)常用,而另外一些數(shù)據(jù)不常用。C需要把數(shù)據(jù)存放到多個(gè)介質(zhì)上。
例如法規(guī)表law就可以分成兩個(gè)表active-law和 inactive-law。activea-authors表中的內(nèi)容是正生效的法規(guī),是經(jīng)常使用的,而inactive-law表則使已經(jīng)作廢的法規(guī),不常被查詢。水平分割會(huì)給應(yīng)用增加復(fù)雜度,它通常在查詢時(shí)需要多個(gè)表名,查詢所有數(shù)據(jù)需要union操作。在許多數(shù)據(jù)庫應(yīng)用中,這種復(fù)雜性會(huì)超過它帶來的優(yōu)點(diǎn),因?yàn)橹灰饕P(guān)鍵字不大,則在索引用于查詢時(shí),表中增加兩到三倍數(shù)據(jù)量,查詢時(shí)也就增加讀一個(gè)索引層的磁盤次數(shù)。
2、垂直分割:把主碼和一些列放到一個(gè)表,然后把主碼和另外的列放到另一個(gè)表中。
如果一個(gè)表中某些列常用,而另外一些列不常用,則可以采用垂直分割,另外垂直分割可以使得數(shù)據(jù)行變小,一個(gè)數(shù)據(jù)頁就能存放更多的數(shù)據(jù),在查詢時(shí)就會(huì)減少I/O 次數(shù)。其缺點(diǎn)是需要管理冗余列,查詢所有數(shù)據(jù)需要join操作。
關(guān)于數(shù)據(jù)庫中表分割和表分區(qū)的知識(shí)就介紹到這里了,希望本次的介紹能夠?qū)δ兴斋@。
【編輯推薦】






