企業(yè)級數(shù)據(jù)倉庫建模思想在商務(wù)智能領(lǐng)域的應(yīng)用
隨著企業(yè)信息化程度的不斷提高,各類應(yīng)用系統(tǒng)同時并存并支撐著企業(yè)的業(yè)務(wù)應(yīng)用。越來越多企業(yè)的信息化主管在開發(fā)企業(yè)應(yīng)用時已經(jīng)考慮到數(shù)據(jù)集成和將來對數(shù)據(jù)的整體有效利用,因此,在實施了ERP解決方案之后,很多企業(yè)選擇實施數(shù)據(jù)倉庫產(chǎn)品來避免信息孤島,實現(xiàn)應(yīng)用的內(nèi)部聯(lián)系和信息的共享。
實施數(shù)據(jù)倉庫的企業(yè),用何種標(biāo)準(zhǔn)去衡量本企業(yè)的數(shù)據(jù)倉庫建模是成功的呢?也許很多負責(zé)企業(yè)信息化建設(shè)的主管自己也不是很清楚。原因是:起初企業(yè)決定要實施數(shù)據(jù)倉庫的初衷大都因為一些跨模塊的報表開發(fā)不能夠?qū)崿F(xiàn),企業(yè)實施了ERP之后,財務(wù)報表,銷售分析的報表都很容易可以通過報表開發(fā)實現(xiàn)了,但一些跨模塊的集成報表變得十分復(fù)雜,例如一個服裝制造企業(yè),高層主管需要看到每個零售店鋪的銷售凈利潤,但零售店鋪的幾乎所有信息都在零售系統(tǒng)中,而財務(wù)的相關(guān)信息在企業(yè)的ERP中,此時就需要將信息集成在企業(yè)級的中央數(shù)據(jù)倉庫中,去滿足此類集成的報表數(shù)據(jù)需求。在數(shù)據(jù)倉庫的建模過程中,實施人員往往會從滿足報表需求的角度出發(fā),考慮如何搭建數(shù)據(jù)模型,而項目實施成功后的交付品就是實現(xiàn)了這樣的報表需求,信息化主管此時也滿意的結(jié)束了數(shù)據(jù)倉庫的項目,這樣就算是成功的實施了數(shù)據(jù)倉庫建模嗎?
請各位思考以下幾點問題:
1.隨著競爭加劇,企業(yè)也需要加速改變架構(gòu)及行銷策略,如果企業(yè)組織架構(gòu)發(fā)生了變化,也就意味著數(shù)據(jù)倉庫中的主數(shù)據(jù)發(fā)生了變化,目前的模型中是否能靈活應(yīng)對主數(shù)據(jù)的變化?
2.隨著企業(yè)業(yè)務(wù)量的上升,源系統(tǒng)中的數(shù)據(jù)量也增大,數(shù)據(jù)倉庫在抽取數(shù)據(jù)的過程中是否會降低業(yè)務(wù)系統(tǒng)的運行效率?
3.不同的業(yè)務(wù)數(shù)據(jù)源是否能夠重復(fù)利用,如果有新增的報表需求,能否在現(xiàn)有建模的基礎(chǔ)上靈活實現(xiàn)?
以上提到的幾個問題與數(shù)據(jù)建模的思想息息相關(guān),運用的得當(dāng),則企業(yè)在現(xiàn)在及未來都獲益不少,否則,對于企業(yè)而言可能在兩三年,甚至幾個月后就需要推到現(xiàn)行的項目重新要在軟、硬件上投資了。
針對上述問題,數(shù)據(jù)倉庫領(lǐng)域提出了EDW的數(shù)據(jù)建模思想,通過數(shù)據(jù)分層和在數(shù)據(jù)倉庫中保留企業(yè)的范圍內(nèi)一致的原子層數(shù)據(jù)為企業(yè)建立靈活,可靠的數(shù)據(jù)倉庫解決方案。全球ERP市場的領(lǐng)先者SAP在其***數(shù)據(jù)倉庫產(chǎn)品SAPBI7.0對EDW提供了完善的支持,SAP的核心合作伙伴IDSScheer(愛迪斯)已經(jīng)成功采用這種思想為多個客戶實施了基于EDW的數(shù)據(jù)倉庫。
EDW的建模思想將數(shù)據(jù)倉庫區(qū)分為三個層次:
1.ExtractLayer(數(shù)據(jù)提取層)
SAPBW將數(shù)據(jù)倉庫的數(shù)據(jù)源分為兩種:SAP數(shù)據(jù)源和Non-SAP數(shù)據(jù)源。SAPBW和mysap.com的組件完全集成,將各組件的數(shù)據(jù)源由預(yù)定義的提取機構(gòu)及程序傳輸?shù)紹W的數(shù)據(jù)提取層。對于Non-SAP的數(shù)據(jù)源,BW有開放的架構(gòu),通過BAPI接口傳輸數(shù)據(jù)。
提取層的數(shù)據(jù)保留了來自源系統(tǒng)的原始數(shù)據(jù),存儲在二維的表中,以便于下一步的數(shù)據(jù)清洗、整合。其優(yōu)點是:一次抽取到BW后,如果模型作了更改,不需要重復(fù)去源系統(tǒng)中抽取,而直接從BW表中抽取,提高數(shù)據(jù)倉庫的提取效率,降低對源系統(tǒng)的資源占用,解決了上述第二個問題。
2.IntegrationLayer(數(shù)據(jù)合并層)
將提取層的原始數(shù)據(jù)進行清洗和整合,其實質(zhì)就是建立數(shù)據(jù)源之間的關(guān)聯(lián),把有用的相關(guān)數(shù)據(jù)統(tǒng)一放在二維表中,例如:把FI,CO的數(shù)據(jù)源整合到一個表中,以便于下一層的建模的使用。數(shù)據(jù)合并層能夠?qū)⑻崛拥脑紨?shù)據(jù)自由組合,滿足多變的業(yè)務(wù)需求,解決了上述***個問題
3.DataMartLayer(數(shù)據(jù)集市層)
最終的報表將在這層膜型上建立,所以,該層將使用星型數(shù)據(jù)模型(BW中稱之為InfoCube)創(chuàng)建不同的分析緯度,提高查詢的效率。
數(shù)據(jù)上載的流程從源系統(tǒng)到數(shù)據(jù)提取層,在由數(shù)據(jù)合并層清洗、整合后傳輸?shù)綌?shù)據(jù)集市層建立多維模型。EDW建模思想的優(yōu)勢在于:將未來企業(yè)可能發(fā)生的業(yè)務(wù)變化,用三個層面的模型靈活處理。例如:當(dāng)企業(yè)組織架構(gòu)變化,即主數(shù)據(jù)發(fā)生變化后,BW可以在數(shù)據(jù)合并層應(yīng)對主數(shù)據(jù)的變化。
【編輯推薦】