Oracle數(shù)據(jù)庫里重復(fù)沒有用的數(shù)據(jù)如何刪除
在實(shí)際操作中對Oracle數(shù)據(jù)庫進(jìn)行操作的過程中我們經(jīng)常會(huì)碰到一些不良的情況,例如表中的相關(guān)數(shù)據(jù)有可能會(huì)重復(fù)的出現(xiàn),導(dǎo)致數(shù)據(jù)庫的相關(guān)操作的過程中產(chǎn)生很多的不便,那么怎么刪除這些重復(fù)沒有用的數(shù)據(jù)呢?
重復(fù)數(shù)據(jù)刪除技術(shù)可以提供更大的備份容量,實(shí)現(xiàn)更長時(shí)間的數(shù)據(jù)保留,還能實(shí)現(xiàn)備份數(shù)據(jù)的持續(xù)驗(yàn)證,進(jìn)步數(shù)據(jù)恢復(fù)服務(wù)水平,方便實(shí)現(xiàn)數(shù)據(jù)容災(zāi)等。 重復(fù)的數(shù)據(jù)可能有這樣兩種情況,***種時(shí)表中只有某些字段一樣,第二種是兩行記錄完全一樣。
Oracle數(shù)據(jù)庫重復(fù)數(shù)據(jù)刪除技術(shù)有如下優(yōu)勢:更大的備份容量、數(shù)據(jù)能得到持續(xù)驗(yàn)證、有更高的數(shù)據(jù)恢復(fù)服務(wù)水平、方便實(shí)現(xiàn)備份數(shù)據(jù)的容災(zāi)。
一、刪除部分字段重復(fù)數(shù)據(jù)
先來談?wù)勅绾尾樵冎貜?fù)的數(shù)據(jù)吧。
下面語句可以查詢出那些數(shù)據(jù)是重復(fù)的:
select 字段1,字段2,count(*) from 表名 group by 字段1,字段2 having count(*) > 1
將上面的>號改為=號就可以查詢出沒有重復(fù)的數(shù)據(jù)了。
想要?jiǎng)h除這些重復(fù)的數(shù)據(jù),可以使用下面語句進(jìn)行刪除
delete from 表名 a where 字段1,字段2 in
(select 字段1,字段2,count(*) from 表名 group by 字段1,字段2 having count(*) > 1)
上面的語句非常簡單,就是將查詢到的數(shù)據(jù)刪除掉。不過這種刪除執(zhí)行的效率非常低,對于大數(shù)據(jù)量來說,可能會(huì)將Oracle數(shù)據(jù)庫吊死。所以我建議先將查詢到的重復(fù)的數(shù)據(jù)插入到一個(gè)暫時(shí)表中,然后對進(jìn)行刪除,這樣,執(zhí)行刪除的時(shí)候就不用再進(jìn)行一次查詢了。如下:
create TABLE 暫時(shí)表 AS
(select 字段1,字段2,count(*) from 表名 group by 字段1,字段2 having count(*) > 1)
上面這句話就是建立了暫時(shí)表,并將查詢到的數(shù)據(jù)插入其中。
下面就可以進(jìn)行這樣的刪除操作了:
delete from 表名 a where 字段1,字段2 in (select 字段1,字段2 from 暫時(shí)表);
這種先建暫時(shí)表再進(jìn)行刪除的操作要比直接用一條語句進(jìn)行刪除要高效得多。
這個(gè)時(shí)候,大家可能會(huì)跳出來說,什么?你叫我們執(zhí)行這種語句,那不是把所有重復(fù)的全都刪除嗎?而我們想保留重復(fù)數(shù)據(jù)中***的一條記錄啊!大家不要急,下面我就講一下如何進(jìn)行這種操作。
在Oracle中,有個(gè)隱藏了自動(dòng)rowid,里面給每條記錄一個(gè)唯一的rowid,我們假如想保留***的一條記錄,
我們就可以利用這個(gè)字段,保留重復(fù)數(shù)據(jù)中rowid***的一條記錄就可以了。
下面是查詢重復(fù)數(shù)據(jù)的一個(gè)例子:
以下是引用片段:
- selecta.rowid,a.*from表名a
- wherea.rowid!=
- (
- selectmax(b.rowid)from表名b
- wherea.字段1=b.字段1and
- a.字段2=b.字段2
- )
下面我就來講解一下,上面括號中的語句是查詢出重復(fù)數(shù)據(jù)中rowid***的一條記錄。
而外面就是查詢出除了rowid***之外的其他重復(fù)的數(shù)據(jù)了。由此,我們要?jiǎng)h除重復(fù)數(shù)據(jù),只保留***的一條數(shù)據(jù),就可以這樣寫了:
- deletefrom表名a
- wherea.rowid!=
- (
- selectmax(b.rowid)from表名b
- wherea.字段1=b.字段1and
- a.字段2=b.字段2
- )
隨便說一下,上面語句的執(zhí)行效率是很低的,可以考慮建立暫時(shí)表,講需要判定重復(fù)的字段、rowid插入暫時(shí)表中,然后刪除的時(shí)候在進(jìn)行比較。
- createtable暫時(shí)表as
- selecta.字段1,a.字段2,MAX(a.ROWID)dataidfrom正式表aGROUPBYa.字段1,a.字段2;
- deletefrom表名a
- wherea.rowid!=
- (
- selectb.dataidfrom暫時(shí)表b
- wherea.字段1=b.字段1and
- a.字段2=b.字段2
- );
上述的相關(guān)內(nèi)容主要是教你如何刪除Oracle數(shù)據(jù)庫中重復(fù)沒用的數(shù)據(jù)的部分內(nèi)容的介紹。
【編輯推薦】