SQL Server 2008數(shù)據(jù)集成服務(wù)簡介
將企業(yè)數(shù)據(jù)轉(zhuǎn)化為有意義的和可操作信息的能力,是企業(yè)在當(dāng)今商業(yè)世界中獲得競爭優(yōu)勢的***最重要的來源。通過控制數(shù)據(jù)爆炸來更好地了解過去并獲得未來的發(fā)展方向,已成為全球范圍內(nèi)企業(yè)的信息技術(shù)部門所面臨的最富挑戰(zhàn)性的風(fēng)險之一。與數(shù)據(jù)集成相關(guān)的問題可劃分為三個大類:
◆技術(shù)挑戰(zhàn)
◆組織問題
◆經(jīng)濟挑戰(zhàn)
在本文中,我們將詳細(xì)探討這些挑戰(zhàn)并討論如何使用 Microsoft® SQL Server™ 2008 Integration Services (SSIS) 解決它們。首先,讓我們先看一個真實世界案例中存在的這些挑戰(zhàn)。
真實世界案例
一家大型的全球型運輸公司利用其數(shù)據(jù)倉庫來分析運營績效和預(yù)測其計劃交貨中存在的差異。
數(shù)據(jù)源
這家公司的主要數(shù)據(jù)來源包括基于 DB2 的訂單輸入系統(tǒng)的訂單數(shù)據(jù),基于 SQL Server 的客戶關(guān)系管理(CRM)系統(tǒng)的客戶資料,以及基于 Oracle 的 ERP 系統(tǒng)的供應(yīng)商數(shù)據(jù)。除了來自這些主要系統(tǒng)的數(shù)據(jù)以外,也有從跟蹤“特別”事件的電子表格合并到數(shù)據(jù)倉庫中的數(shù)據(jù),這些數(shù)據(jù)由發(fā)貨管理員手動輸入。目前,該公司在合并各種來源的文本文件(如天氣信息、交通狀況和供應(yīng)商詳細(xì)資料(針對轉(zhuǎn)包交付)等外部數(shù)據(jù))時存在延遲。
數(shù)據(jù)使用
不僅這些數(shù)據(jù)的來源多種多樣,消費者的需求和他們的地理位置也多種多樣。這種多樣性導(dǎo)致了本地系統(tǒng)的擴張。信息技術(shù)部門的主要工作之一就是,至少要為客戶資料建立一個“真實的單一版本”。
數(shù)據(jù)集成要求
鑒于數(shù)據(jù)、業(yè)務(wù)需求和用戶需求的多樣性,信息技術(shù)部門已指定了以下一組數(shù)據(jù)集成要求:
◆他們提供的從各種內(nèi)部和外部來源合并的歷史數(shù)據(jù)和當(dāng)前數(shù)據(jù)必須可靠且一致。
◆為減少數(shù)據(jù)采集的滯后問題,來自提供者和供應(yīng)商的數(shù)據(jù)必須能夠通過 Web 服務(wù)或一些其他直接機制(如 FTP)獲取 。
◆他們需要清理及刪除重復(fù)的數(shù)據(jù)以確保數(shù)據(jù)質(zhì)量。
【編輯推薦】