動(dòng)態(tài)數(shù)據(jù)倉(cāng)庫(kù)漸興起 推動(dòng)BI走到前端
數(shù)據(jù)倉(cāng)庫(kù)技術(shù)自誕生至今,經(jīng)歷了五個(gè)發(fā)展階段。第一個(gè)階段就是利用批處理技術(shù),把機(jī)構(gòu)內(nèi)不同來(lái)源的信息集成到一個(gè)單一的倉(cāng)庫(kù)中,形成報(bào)表,為公司跨職能或跨產(chǎn)品的決策提供重要參考。而在數(shù)據(jù)倉(cāng)庫(kù)應(yīng)用的第二階段,決策者關(guān)心的重點(diǎn)發(fā)生了轉(zhuǎn)移,從單純的“發(fā)生了什么”轉(zhuǎn)向“為什么會(huì)發(fā)生”,這個(gè)階段數(shù)據(jù)倉(cāng)庫(kù)所做的工作主要是分析。分析活動(dòng)的目的就是了解報(bào)表數(shù)據(jù)的涵義,需要對(duì)更詳細(xì)的數(shù)據(jù)進(jìn)行各種角度的分析。第二階段的數(shù)據(jù)倉(cāng)庫(kù)對(duì)數(shù)據(jù)庫(kù)要提交的問(wèn)題事先一無(wú)所知,采用的方法主要是隨機(jī)分析。而當(dāng)一個(gè)公司的決策過(guò)程得到量化以后,對(duì)經(jīng)營(yíng)動(dòng)態(tài)的情況以及這種情況為什么發(fā)生都會(huì)有所體驗(yàn),下一步就是要將信息用于預(yù)測(cè)了。很明顯,掌握公司即將發(fā)生的動(dòng)向意味著更為積極地管理和實(shí)施公司戰(zhàn)略。數(shù)據(jù)倉(cāng)庫(kù)發(fā)展的第三階段就是提供數(shù)據(jù)采集工具,以便利用歷史資料創(chuàng)建預(yù)測(cè)模型。
而數(shù)據(jù)倉(cāng)庫(kù)演變的第四階段就是動(dòng)態(tài)數(shù)據(jù)倉(cāng)庫(kù)。從第一到第三階段的數(shù)據(jù)倉(cāng)庫(kù)都以支持企業(yè)內(nèi)部戰(zhàn)略性決策為重點(diǎn),第四階段則重在戰(zhàn)術(shù)性決策支持。數(shù)據(jù)倉(cāng)庫(kù)對(duì)戰(zhàn)略性決策的支持是為企業(yè)長(zhǎng)期決策提供必需的信息,包括市場(chǎng)細(xì)分、產(chǎn)品管理戰(zhàn)略、獲利性分析、預(yù)測(cè)和其他信息。戰(zhàn)術(shù)性決策支持的重點(diǎn)則在企業(yè)外部,為執(zhí)行公司戰(zhàn)略的員工提供支持。隨著動(dòng)態(tài)數(shù)據(jù)倉(cāng)庫(kù)在決策支持領(lǐng)域中的角色越來(lái)越重要,企業(yè)實(shí)現(xiàn)決策自動(dòng)化的積極性就越高。在人工操作效果不明顯時(shí),為了尋求決策的有效性和連續(xù)性,企業(yè)就會(huì)趨向于采取自動(dòng)決策。這種對(duì)自動(dòng)化決策提供支持的數(shù)據(jù)庫(kù)就是目前數(shù)據(jù)倉(cāng)庫(kù)技術(shù)發(fā)展的最高階段,即第五個(gè)階段。
動(dòng)態(tài)數(shù)據(jù)倉(cāng)庫(kù)支持運(yùn)營(yíng)智能
在近日舉行的2007 Teradata 數(shù)據(jù)倉(cāng)庫(kù)峰會(huì)上,記者發(fā)現(xiàn),目前,動(dòng)態(tài)數(shù)據(jù)倉(cāng)庫(kù)正在得到越來(lái)越多的認(rèn)可和應(yīng)用。因?yàn)?,企業(yè)競(jìng)爭(zhēng)的加劇,使得企業(yè)希望不僅能制定出好的長(zhǎng)期戰(zhàn)略,還要能通過(guò)運(yùn)營(yíng)過(guò)程中一個(gè)個(gè)小的執(zhí)行層面的恰當(dāng)決策來(lái)保證戰(zhàn)略的實(shí)現(xiàn)。
Teradata公司首席技術(shù)官寶立明先生認(rèn)為,傳統(tǒng)的數(shù)據(jù)倉(cāng)庫(kù)技術(shù)重點(diǎn)用于支持企業(yè)決策者的戰(zhàn)略智能,它對(duì)實(shí)時(shí)性的要求相對(duì)低一些,而動(dòng)態(tài)數(shù)據(jù)倉(cāng)庫(kù)技術(shù)則重點(diǎn)用于支持企業(yè)一線員工的運(yùn)營(yíng)智能分析,它對(duì)數(shù)據(jù)的實(shí)時(shí)性要求更高。
動(dòng)態(tài)數(shù)據(jù)倉(cāng)庫(kù)有兩大特點(diǎn),一是動(dòng)態(tài)訪問(wèn)。它是指一線用戶可以動(dòng)態(tài),或者說(shuō)實(shí)時(shí)地訪問(wèn)他所需要的信息。傳統(tǒng)數(shù)據(jù)倉(cāng)庫(kù)用戶只針對(duì)高端管理層,一個(gè)銀行也許是有幾十個(gè)到幾百個(gè)用戶可以訪問(wèn)。而成千上萬(wàn)的客戶經(jīng)理和客戶代表如果要實(shí)現(xiàn)同時(shí)訪問(wèn),對(duì)傳統(tǒng)數(shù)據(jù)倉(cāng)庫(kù)來(lái)講是一個(gè)很大的壓力。所以動(dòng)態(tài)數(shù)據(jù)倉(cāng)庫(kù)采取相同的技術(shù)架構(gòu), 卻使用不同的技術(shù)手段,從而實(shí)現(xiàn)動(dòng)態(tài)訪問(wèn)。
二是動(dòng)態(tài)數(shù)據(jù)加載。傳統(tǒng)數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)加載與動(dòng)態(tài)數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)加載所需的技術(shù)設(shè)施幾乎相同。不同的是傳統(tǒng)的數(shù)據(jù)加載不是實(shí)時(shí)和連續(xù)的,只能是以批量的形式加載。而動(dòng)態(tài)數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)則能連續(xù)加載并實(shí)現(xiàn)一分鐘或者幾秒鐘間隔的近實(shí)時(shí)加載,從而體現(xiàn)動(dòng)態(tài)。
因此,一般而言,動(dòng)態(tài)數(shù)據(jù)倉(cāng)庫(kù)的“運(yùn)作”是指為現(xiàn)場(chǎng)當(dāng)時(shí)決策提供信息,例如及時(shí)庫(kù)存補(bǔ)給、包裹發(fā)運(yùn)的日程安排、路徑選擇等。許多零售商都傾向于由供貨方管理庫(kù)存,自己則擁有一條零售鏈和眾多作為伙伴的供貨廠商,其目的是通過(guò)更有效的供貨鏈管理來(lái)降低庫(kù)存成本。為了使這種合作獲得成功,他就必須向供貨商提供有關(guān)銷售、促銷推廣、庫(kù)內(nèi)存貨等詳細(xì)信息的知情權(quán),之后便可以根據(jù)每個(gè)商店和每個(gè)單品對(duì)庫(kù)存的要求建立并實(shí)施有效的生產(chǎn)和交貨計(jì)劃。
以物流行業(yè)為例,統(tǒng)籌安排貨運(yùn)車輛和運(yùn)輸路線,這需要進(jìn)行非常復(fù)雜的決策。常常需要將一輛卡車上的部分貨物轉(zhuǎn)移到另一輛車上,即重新進(jìn)行配載,以便以最高的整體效率送抵各自的目的地。當(dāng)某些卡車晚點(diǎn)時(shí),就要做出決定:是讓后繼的運(yùn)輸車等待遲到的貨物,還是讓其按時(shí)出發(fā)。如果后繼車輛按時(shí)出發(fā)而未等待遲到的包裹,那么遲到包裹的服務(wù)等級(jí)就會(huì)大打折扣。反過(guò)來(lái)說(shuō),等待遲到的包裹則將損害在后繼運(yùn)輸車上其他待運(yùn)包裹的服務(wù)等級(jí)。
在金融業(yè),動(dòng)態(tài)數(shù)據(jù)倉(cāng)庫(kù)的應(yīng)用主要是預(yù)先預(yù)防和控管某些風(fēng)險(xiǎn),而不是等到風(fēng)險(xiǎn)發(fā)生之后再報(bào)告,從而將原來(lái)的被動(dòng)管理轉(zhuǎn)化為現(xiàn)在的主動(dòng)防范。金融行業(yè)動(dòng)態(tài)數(shù)據(jù)倉(cāng)庫(kù)的一個(gè)應(yīng)用實(shí)例是上海證券交易所,除了風(fēng)險(xiǎn)控管,還涉及到交易行為是否合乎某些規(guī)定的問(wèn)題。上證所通過(guò)對(duì)數(shù)據(jù)的分析和整理來(lái)判定自己的交易行為,或者是客戶的交易行為是否符合法律法規(guī)的要求,就也是動(dòng)態(tài)數(shù)據(jù)倉(cāng)庫(kù)合規(guī)性的一種體現(xiàn)。
物流行業(yè)應(yīng)用
在物流行業(yè),有一個(gè)重要的服務(wù),就是實(shí)時(shí)查詢功能,它不僅可以讓客戶隨時(shí)知道自己的包裹已經(jīng)送到什么位置,更主要的是可以幫助物流企業(yè)隨時(shí)調(diào)度,實(shí)現(xiàn)資源的最優(yōu)配置。而這就需要利用動(dòng)態(tài)數(shù)據(jù)倉(cāng)庫(kù)技術(shù)的支持。
因此,無(wú)論是在國(guó)外還是國(guó)內(nèi),物流行業(yè)都比較早地應(yīng)用了動(dòng)態(tài)數(shù)據(jù)倉(cāng)庫(kù)技術(shù)。在2007 Teradata 數(shù)據(jù)倉(cāng)庫(kù)峰會(huì)上,中國(guó)郵政集團(tuán)公司信息技術(shù)局技術(shù)推進(jìn)部主任高軍和DHL首席軟件工程師 Karlo Borboa,都談到了他們應(yīng)用動(dòng)態(tài)數(shù)據(jù)倉(cāng)庫(kù)的效果。中國(guó)郵政的第三代速遞系統(tǒng)采用了動(dòng)態(tài)數(shù)據(jù)倉(cāng)庫(kù)技術(shù),用于追蹤包裹的去向。中國(guó)郵政采用ESB(企業(yè)服務(wù)總線)技術(shù),將各各業(yè)務(wù)系統(tǒng)連接到全國(guó)中心,全國(guó)中心有6個(gè)數(shù)據(jù)倉(cāng)庫(kù)節(jié)點(diǎn),用于實(shí)施數(shù)據(jù)查詢。包裹從一點(diǎn)送到另一點(diǎn),在提取包裹的時(shí)候要用掃描器獲取數(shù)據(jù),提取之后把包裹放在運(yùn)輸車上又要再用一次掃描儀獲取數(shù)據(jù)。每個(gè)環(huán)節(jié)都有獲取數(shù)據(jù)的過(guò)程,數(shù)據(jù)獲取后,只要幾秒鐘就可以進(jìn)入全國(guó)數(shù)據(jù)中心的數(shù)據(jù)倉(cāng)庫(kù)中,這樣工作人員就能獲得關(guān)于這個(gè)包裹非常詳細(xì)的信息,從而追蹤包裹的去向。目前,平均每天有50萬(wàn)件包裹的行蹤在不斷被客戶查詢,而每次查詢的相應(yīng)時(shí)間都在2秒鐘以內(nèi),并且每次查詢都可以提供20個(gè)以上的反饋條目。
另外,DHL的新一代擴(kuò)展跟蹤查詢系統(tǒng)——NeXtt也同樣采用了Teradata的動(dòng)態(tài)數(shù)據(jù)倉(cāng)庫(kù)技術(shù)。目前這一系統(tǒng)已經(jīng)覆蓋全球,從事件發(fā)生到進(jìn)入數(shù)據(jù)倉(cāng)庫(kù),整個(gè)過(guò)程不超過(guò)15分鐘。首先,在事件的發(fā)生地捕捉數(shù)據(jù); 然后傳送給分布在全球三個(gè)不同地方的報(bào)文服務(wù)器; 報(bào)文服務(wù)器每隔5分鐘就通過(guò)FTP的方式傳輸?shù)綌?shù)據(jù)倉(cāng)庫(kù)的ETL服務(wù)器;最后數(shù)據(jù)經(jīng)過(guò)清洗后即可加載到數(shù)據(jù)倉(cāng)庫(kù)中,以供查詢。
【編輯推薦】