SQL Server數(shù)據(jù)庫對上億表的操作
導(dǎo)讀:SQL Server數(shù)據(jù)庫的功能性很好,盡管如此,在面對上億表的操作時,SQL Server數(shù)據(jù)庫還是不行,速度很明顯就慢下來啦,那么如何讓SQL Server數(shù)據(jù)庫在處理上億表時,仍能夠?qū)崿F(xiàn)很高的工作效率呢?
大數(shù)量的操作帶來的影響:
1.我確實做了一個很大的查詢,涉及的數(shù)據(jù)表有兩億條記錄,而且有一個group by操作,造成CPU、內(nèi)存和磁盤開銷均很大。后來和微軟的人重新實驗了一下,我的查詢確實會造成系統(tǒng)反應(yīng)變慢。后來我們也實驗了一下,在這個2億的表上統(tǒng)計一下行數(shù),即select count(*) from table1,用了1分鐘,內(nèi)存漲了5G左右,磁盤子系統(tǒng)負荷很大,CPU也突然提高。這說明這種上億的表的操作會非常嚴重的降低效率。
2.整個服務(wù)器的磁盤分配是這樣的,網(wǎng)站訪問的數(shù)據(jù)庫庫位于磁盤陣列中,而我們的統(tǒng)計臨時庫位于D盤中,C和D好像是一個磁盤組,也就相當(dāng)于是在C盤。我們的數(shù)據(jù)庫的大量磁盤I/O會導(dǎo)致系統(tǒng)的反應(yīng)變慢。因此當(dāng)我的查詢很大的時候,就會使服務(wù)器整個系統(tǒng)變慢。
3.數(shù)據(jù)庫的數(shù)據(jù)文件的自增長方式為每次1024k,數(shù)據(jù)文件的空間已經(jīng)接近用光,而要發(fā)生增長,而增長空間要求應(yīng)該比較大,所以就會不停的申請增長,造成磁盤開銷較大。
4.操作中涉及到delete操作,會形成大量的日志,而上周擴容后,發(fā)現(xiàn)日志文件比以前縮小了,估計是重建了,昨天的操作會導(dǎo)致日志文件也要不斷增長,也會造成磁盤的負荷加大。
解決辦法:
針對一:
避免大表操作,所有的操作均可以按省或者時間分開,這樣無論從時間或者地域維度,基本上可以將大表拆成30張以上的小表操作,甚至更多。然后再對結(jié)果進行合并,應(yīng)該可以避免上述問題。
針對二:
無解決方案,只是建議將我們的數(shù)據(jù)庫也單獨分到一組磁盤上去,不要跟系統(tǒng)競爭。
針對三:
及時刪除無用的臨時數(shù)據(jù),保障數(shù)據(jù)庫空間,同時也可以做上空間監(jiān)控,一旦數(shù)據(jù)文件空間發(fā)生增長時,給DBA一個預(yù)警郵件,我們收到郵件后可以立即做相應(yīng)處理。
針對四:
日志文件目前已經(jīng)漲得較大,我們執(zhí)行一下截斷日志的動作,將日志文件的空間使用保持在一個較低水平。
上文中首先是為大家分析出了這個問題的所在,緊接著,又為大家總結(jié)出了解決方案,相信已經(jīng)是非常清楚明白啦,希望能夠?qū)Υ蠹矣兴鶐椭?/p>
【編輯推薦】