自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

詳解如何挑戰(zhàn)4秒內(nèi)百萬級(jí)數(shù)據(jù)導(dǎo)入SQL Server

數(shù)據(jù)庫 SQL Server 數(shù)據(jù)庫運(yùn)維
本文將挑戰(zhàn)的是4秒鐘內(nèi)倒入百萬級(jí)的數(shù)據(jù)進(jìn)入SQL Server數(shù)據(jù)庫中。所使用的版本包括2000與2008。

對(duì)于大數(shù)據(jù)量的導(dǎo)入,是DBA們經(jīng)常會(huì)碰到的問題,在這里我們討論的是SQL Server環(huán)境下百萬級(jí)數(shù)據(jù)量的導(dǎo)入,希望對(duì)大家有所幫助。51CTO編輯向您推薦《SQL Server入門到精通》專題。

實(shí)際工作中有時(shí)候需要把大量數(shù)據(jù)導(dǎo)入數(shù)據(jù)庫,然后用于各種程序計(jì)算,本實(shí)驗(yàn)將使用5中方法完成這個(gè)過程,并詳細(xì)記錄各種方法所耗費(fèi)的時(shí)間。

本實(shí)驗(yàn)中所用到工具為Visual Studio 2008和SQL Server 2000、SQL Server 2008,分別使用5中方法將100萬條數(shù)據(jù)導(dǎo)入SQL Server 2000與SQL Server 2008中,實(shí)驗(yàn)環(huán)境是DELL 2850雙2.0GCPU,2G內(nèi)存的服務(wù)器。感興趣的朋友可以下載源代碼自己驗(yàn)證一下所用時(shí)間。

還要有一點(diǎn)需要進(jìn)行說明,本實(shí)驗(yàn)中執(zhí)行SQL語句的地方使用了IsLine FrameWork框架中的DataProvider模塊,這個(gè)模塊只是對(duì)SQL配置的讀取和封裝,并不會(huì)對(duì)最終結(jié)果有本質(zhì)性的影響,關(guān)于IsLine FrameWork框架方面的知識(shí),請(qǐng)參考“IsLine FrameWork”框架系列文章。

下面進(jìn)入正題,分別使用基本的Insert 語句、使用BULK INSERT語句、在多線程中使用BULK INSERT、使用SqlBulkCopy類、在多線程中使用SqlBulkCopy類五種方法,挑戰(zhàn)4秒極限。

數(shù)據(jù)庫方面使用SQL Server 2000與SQL Server 2008,表名TableB,字段名稱為Value1,數(shù)據(jù)庫名可以在App.config中修改,默認(rèn)為test。

試驗(yàn)中的5種方法

圖1 試驗(yàn)中的5種方法

方法一.使用基本的Insert 語句

這種方法是最基本的方法,大多數(shù)人一開始都會(huì)想到這種方法。但是Insert語句似乎并不適合大批量的操作,是不是這樣呢?

本方法中將100萬數(shù)據(jù)分為10個(gè)批次,每個(gè)批次10萬條,每10萬條1個(gè)事務(wù),分10次導(dǎo)入數(shù)據(jù)庫。

-->基本語句:

  1. Insert Into TableB (Value1) values (‘”+i+”’); 

說明:語句中的i是宿主程序中的一個(gè)累加變量,用于填充數(shù)據(jù)庫字段中的值。

SQL Server 2000 耗時(shí):901599

SQL Server 2008耗時(shí):497638

方法二.使用BULK INSERT語句

這個(gè)類的效果,在本實(shí)驗(yàn)中可以說是最令人滿意的了,它的使用最簡(jiǎn)便、靈活,速度很快。

“BULK INSERT”語句似乎不是很常用, Aicken聽說Oracle中有一種可以將外部文件映射為Oracle臨時(shí)表,然后直接將臨時(shí)表中的數(shù)據(jù)導(dǎo)入Oracle其他表中的方法,這種方法的速度非常令人滿意,SQL SERVER的BULK INSERT是不是同樣令人滿意呢?

--> 基本語句:

 
  1. BULK INSERT TableB FROM 'c:\\sql.txt' 
  2. WITH (FIELDTERMINATOR = ',',ROWTER /.,mbMINATOR='|',BATCHSIZE = 100000) 
說明:“c:\\sql.txt”是一個(gè)預(yù)先生成的包含100條數(shù)據(jù)的文件,這些數(shù)據(jù)以“|”符號(hào)分隔,每10萬條數(shù)據(jù)一個(gè)事務(wù)。

SQL Server 2000耗時(shí):4009

SQL Server 2008耗時(shí):10722

方法三.在多線程中使用BULK INSERT

在方法二的基礎(chǔ)上,將100萬條數(shù)據(jù)分五個(gè)線程,每個(gè)線程負(fù)責(zé)20萬條數(shù)據(jù),每5萬條一個(gè)事物,五個(gè)線程同時(shí)啟動(dòng),看看這樣的效果吧。

SQL Server 2000耗時(shí):21099

SQL Server 2008耗時(shí):10997

方法四.使用SqlBulkCopy類

這種方法速度也很快,但是要依賴內(nèi)存,對(duì)于幾千萬條、多字段的復(fù)雜數(shù)據(jù),可能在內(nèi)存方面會(huì)有較大的消耗,不過可以使用64位解決方案處理這個(gè)問題。

幾千萬條、多字段的數(shù)據(jù)的情況一般在一些業(yè)務(wù)場(chǎng)景中會(huì)遇到,比如計(jì)算全球消費(fèi)者某個(gè)業(yè)務(wù)周期消費(fèi)額時(shí),要先獲得主數(shù)據(jù)庫表中的會(huì)員消費(fèi)記錄快照,并將快照儲(chǔ)存至臨時(shí)表中,然后供計(jì)算程序使用這些數(shù)據(jù)。并且有些時(shí)候消費(fèi)者的消費(fèi)數(shù)據(jù)并不在一臺(tái)數(shù)據(jù)庫服務(wù)器中,而是來自多個(gè)國(guó)家的多臺(tái)服務(wù)器,這樣我們就必須借助內(nèi)存或外存設(shè)備中轉(zhuǎn)這些數(shù)據(jù),然后清洗、合并、檢測(cè),最后導(dǎo)入專用表供計(jì)算程序使用。

基本語句:

  1. using (System.Data.SqlClient.SqlBulkCopy sqlBC = new System.Data.SqlClient.SqlBulkCopy(conn))   
  2. { sqlBC.BatchSize = 100000;   
  3. sqlBC.BulkCopyTimeout = 60;   
  4. sqlBC.DestinationTableName = "dbo.TableB";   
  5. sqlBC.ColumnMappings.Add("valueA""Value1");   
  6. sqlBC.WriteToServer(dt);   

說明:

BatchSize = 100000; 指示每10萬條一個(gè)事務(wù)并提交

BulkCopyTimeout = 60; 指示60秒按超時(shí)處理

DestinationTableName = "dbo.TableB"; 指示將數(shù)據(jù)導(dǎo)入TableB表

ColumnMappings.Add("valueA", "Value1"); 指示將內(nèi)存中valueA字段與TableB中的Value1字段匹配

WriteToServer(dt);寫入數(shù)據(jù)庫。其中dt是預(yù)先構(gòu)建好的DataTable,其中包含valueA字段。

SQL Server 2000耗時(shí):4989

SQL Server 2008耗時(shí):10412

方法五.在多線程中使用SqlBulkCopy類

基于方法四,將100萬條數(shù)據(jù)分五個(gè)線程,每個(gè)線程負(fù)責(zé)20萬條數(shù)據(jù),每5萬條一個(gè)事物,五個(gè)線程同時(shí)啟動(dòng),看看這樣的效果吧。

SQL 2000耗時(shí):7682

SQL 2008耗時(shí):10870

總結(jié)

數(shù)據(jù)庫

測(cè)試方式

SQL 2000

SQL 2008

基本Insert Into

901599

497638

單線程Bulk Insert

4209

10722

多線程Bulk Insert

21099

10997

單線程SqlBulkCopy

4989

10412

多線程SqlBulkCopy

7682

10870

以上就是這幾天的實(shí)驗(yàn)結(jié)果了,比較令人失望的是SQL SERVER 2008導(dǎo)入數(shù)據(jù)的性能似乎并不想我們想象的那樣優(yōu)秀。

源碼地址:http://files.cnblogs.com/isline/sqltest.rar

測(cè)試數(shù)據(jù)下載地址:http://files.cnblogs.com/isline/Data.rar

【編輯推薦】

  1. 實(shí)戰(zhàn)SQL Server 2005鏡像配置全過程
  2. SQL Server 2005實(shí)現(xiàn)數(shù)據(jù)庫緩存依賴
  3. SQL Server 2005中數(shù)據(jù)挖掘算法擴(kuò)展方法
  4. SQL Server 2005中數(shù)據(jù)挖掘算法擴(kuò)展方法
  5. 淺談SQL Server 2008中的行壓縮
責(zé)任編輯:彭凡 來源: 博客園
相關(guān)推薦

2010-09-01 13:28:15

C#

2015-08-14 13:37:46

DEFCON磁盤安全

2011-04-20 14:28:38

SQL優(yōu)化

2024-05-06 10:11:51

2022-07-14 09:39:51

Linux工具性能

2010-07-15 13:09:07

SQL Server成

2010-07-16 10:12:21

SQL Server導(dǎo)

2010-06-24 09:47:47

SQL Server

2018-01-26 10:10:45

Linux服務(wù)器性能

2024-04-09 13:20:00

Excel數(shù)據(jù)庫數(shù)據(jù)

2024-08-05 09:51:00

2015-10-22 23:14:54

2021-03-17 11:03:07

人工智能地震監(jiān)測(cè)中國(guó)科學(xué)技術(shù)

2019-10-10 16:49:18

Python鏡音雙子腳本語言

2024-09-27 15:57:08

2011-03-11 13:26:23

SQL Server數(shù)導(dǎo)入數(shù)據(jù)

2010-09-17 16:17:13

SQL內(nèi)連接

2018-03-02 10:58:17

人工智能AI律師

2014-07-18 09:33:53

數(shù)據(jù)庫數(shù)據(jù)庫優(yōu)化
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)