自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

數(shù)據(jù)工程要從全局性數(shù)據(jù)架構(gòu)考慮

大數(shù)據(jù)
說(shuō)到數(shù)據(jù)工程,給人的感覺(jué)往往是空間數(shù)據(jù)的采集、核查、規(guī)整、入庫(kù)等過(guò)程。這些過(guò)程,距離主流IT所說(shuō)的“數(shù)據(jù)工程”還是有些差異的。

說(shuō)到數(shù)據(jù)工程,給人的感覺(jué)往往是空間數(shù)據(jù)的采集、核查、規(guī)整、入庫(kù)等過(guò)程。這些過(guò)程,距離主流IT所說(shuō)的“數(shù)據(jù)工程”還是有些差異的。

主流IT對(duì)“數(shù)據(jù)工程”的定義是:“以工程化作為基本出發(fā)點(diǎn)的數(shù)據(jù)處理、分析和應(yīng)用方法與技術(shù),是計(jì)算機(jī)科學(xué)與技術(shù)學(xué)科的重要內(nèi)容、核心與趨勢(shì)”。

在這個(gè)定義中,特別強(qiáng)調(diào)了“工程”兩個(gè)字。“工程”是以解決問(wèn)題、實(shí)現(xiàn)價(jià)值為導(dǎo)向的,往往受限于具體業(yè)務(wù)場(chǎng)景,通常需要綜合權(quán)衡考慮,并具有實(shí)踐性較強(qiáng)的、需要與用戶反復(fù)交互的“服務(wù)”方式,而不是以市場(chǎng)為導(dǎo)向的“產(chǎn)品”模式。

 

[[274758]]

一、需不需要全局性數(shù)據(jù)架構(gòu)?

很多人會(huì)說(shuō),“我們只是做數(shù)據(jù)處理、數(shù)據(jù)遷移等,不需要數(shù)據(jù)架構(gòu)”、“我們只是做數(shù)據(jù)分析展現(xiàn),其他事情不需要考慮那么多”……

如果站在項(xiàng)目實(shí)施的某個(gè)局部角度,只需考慮某項(xiàng)數(shù)據(jù)處理工作的局部范圍和具體要求的話,確實(shí)可以這么說(shuō)。但是,如果站在項(xiàng)目全局的角度,或項(xiàng)目規(guī)模較大,就不得不從全局視角統(tǒng)籌考慮數(shù)據(jù)工程了。否則,就會(huì)出現(xiàn)各種各樣的問(wèn)題。比如,產(chǎn)生“數(shù)據(jù)孤島”、數(shù)據(jù)之間無(wú)法關(guān)聯(lián)、數(shù)據(jù)統(tǒng)計(jì)結(jié)果是否真實(shí)可信等問(wèn)題。

二、在什么階段考慮全局性數(shù)據(jù)架構(gòu)?

還有一種觀點(diǎn)比較常見(jiàn):“我們只是做業(yè)務(wù)系統(tǒng),暫時(shí)不考慮分析類(lèi)應(yīng)用,在以后搭建商務(wù)智能(BI)、數(shù)據(jù)倉(cāng)庫(kù)應(yīng)用時(shí),我們?cè)賮?lái)考慮數(shù)據(jù)架構(gòu)”。

如果只有少數(shù)幾個(gè)業(yè)務(wù)系統(tǒng),是否有獨(dú)立的數(shù)據(jù)架構(gòu),影響可能不大。但是,如果業(yè)務(wù)系統(tǒng)累積到五個(gè)以上時(shí),這種“重系統(tǒng)輕數(shù)據(jù)”、“重流程輕分析”的導(dǎo)向,會(huì)帶來(lái)很多問(wèn)題。沒(méi)有統(tǒng)一的數(shù)據(jù)架構(gòu)和數(shù)據(jù)治理機(jī)制,多個(gè)系統(tǒng)之間會(huì)出現(xiàn)數(shù)據(jù)標(biāo)準(zhǔn)不統(tǒng)一,數(shù)據(jù)內(nèi)容不一致,數(shù)據(jù)同名不同義和同義不同名等現(xiàn)象,數(shù)據(jù)質(zhì)量無(wú)法保證,數(shù)據(jù)集成非常困難,必然影響業(yè)務(wù)應(yīng)用系統(tǒng)效能的正常發(fā)揮。如果業(yè)務(wù)系統(tǒng)本身數(shù)據(jù)質(zhì)量就有問(wèn)題,即使數(shù)據(jù)抽取處理、數(shù)據(jù)分析展現(xiàn)系統(tǒng)做得再好,也是枉然。所以,對(duì)于大型的、復(fù)雜的業(yè)務(wù)應(yīng)用系統(tǒng),必須考慮全局的數(shù)據(jù)架構(gòu);至于數(shù)據(jù)分析型應(yīng)用,沒(méi)有數(shù)據(jù)架構(gòu)和數(shù)據(jù)治理機(jī)制,將寸步難行。

三、全局性數(shù)據(jù)架構(gòu)怎么做?

做全局性數(shù)據(jù)架構(gòu),就是要回答用戶的問(wèn)題:用戶的數(shù)據(jù)資產(chǎn)應(yīng)該如何組織,才能管得住、用得好?針對(duì)這個(gè)問(wèn)題,可以從數(shù)據(jù)資源目錄、數(shù)據(jù)標(biāo)準(zhǔn)、數(shù)據(jù)模型、數(shù)據(jù)分布等多個(gè)維度加以考慮。在具體落地時(shí),還要考慮元數(shù)據(jù)管理、數(shù)據(jù)集成、數(shù)據(jù)共享等要素。下圖是我們?cè)谀硞€(gè)具體項(xiàng)目中的全局性數(shù)據(jù)架構(gòu)設(shè)計(jì)考慮。

 

數(shù)據(jù)工程要從全局性數(shù)據(jù)架構(gòu)考慮
某項(xiàng)目的全局?jǐn)?shù)據(jù)架構(gòu)邏輯圖

從全局整體角度,把數(shù)據(jù)按照應(yīng)用方向,劃分幾個(gè)庫(kù):

1、業(yè)務(wù)庫(kù)

在“業(yè)務(wù)應(yīng)用域”,主要面向的是“業(yè)務(wù)辦理人員”。從數(shù)據(jù)角度,一個(gè)庫(kù)里有多個(gè)數(shù)據(jù)域,與其相對(duì)的,一個(gè)平臺(tái)多個(gè)應(yīng)用,即一個(gè)業(yè)務(wù)平臺(tái)上面承載多個(gè)業(yè)務(wù)應(yīng)用,整個(gè)“業(yè)務(wù)應(yīng)用域”就是一個(gè)系統(tǒng)一個(gè)庫(kù),從根本上解決以前十幾個(gè)系統(tǒng)十幾個(gè)庫(kù)而導(dǎo)致的“煙囪系統(tǒng)”的問(wèn)題。另外,這個(gè)業(yè)務(wù)庫(kù)的數(shù)據(jù)組織形式,是以“辦理事項(xiàng)”進(jìn)行數(shù)據(jù)建模組織的,數(shù)據(jù)操作主要是數(shù)據(jù)增、刪、改、查,屬于典型的事務(wù)性數(shù)據(jù)庫(kù)(OLTP)。

2、分析庫(kù)

在“數(shù)據(jù)分析域”中,主要面向的是“分析決策人員”。因此,需要建立數(shù)據(jù)倉(cāng)庫(kù)。數(shù)據(jù)倉(cāng)庫(kù)根據(jù)不同應(yīng)用場(chǎng)景分層,包括:操作性數(shù)倉(cāng)(ODS)、核心數(shù)倉(cāng)(DW)、數(shù)據(jù)集市(DM)等,同樣與之相對(duì),搭建相應(yīng)的“數(shù)據(jù)應(yīng)用平臺(tái)”和一系列的數(shù)據(jù)應(yīng)用。分析庫(kù)按照“分析主題”組織數(shù)據(jù)。所謂“分析主題”,就是針對(duì)某種業(yè)務(wù)對(duì)象或者某個(gè)事項(xiàng)的分析需求,比如建設(shè)項(xiàng)目情況分析、房源籌集和分配情況分析等。

3、治理庫(kù)

顧名思義,“數(shù)據(jù)治理域”主要面向“數(shù)據(jù)治理人員”。通過(guò)數(shù)據(jù)治理,管理好全局的所有數(shù)據(jù)。其中,“主數(shù)據(jù)”是按照“核心業(yè)務(wù)對(duì)象”組織的數(shù)據(jù),它提供可共享的核心數(shù)據(jù)底板,具有統(tǒng)一、完整、準(zhǔn)確、及時(shí)的特點(diǎn)。比如,在公共住房領(lǐng)域,房源就是一種主數(shù)據(jù)。“元數(shù)據(jù)”則用來(lái)對(duì)數(shù)據(jù)進(jìn)行描述的數(shù)據(jù),包括數(shù)據(jù)的類(lèi)型、關(guān)系、流動(dòng)、變化(血緣)和業(yè)務(wù)含義等。“參考數(shù)據(jù)”是指一些重要的數(shù)據(jù)字典,比如,在公共住房領(lǐng)域,租賃狀態(tài)、出冊(cè)原因、交租方式、房屋狀態(tài)等,都需要采用字典來(lái)描述。

4、其他庫(kù)

除以上核心庫(kù)外,還有一些其他數(shù)據(jù)。包括:用于內(nèi)外數(shù)據(jù)交換的交換數(shù)據(jù),用于空間定位和空間分析的空間數(shù)據(jù),以及各種文檔材料、電子檔案等非結(jié)構(gòu)化數(shù)據(jù)等。

全局性數(shù)據(jù)邏輯架構(gòu)的最大價(jià)值在于:從全局上搞清楚有哪些數(shù)據(jù)?數(shù)據(jù)和系統(tǒng)之間、不同類(lèi)型的數(shù)據(jù)之間,存在什么關(guān)系?各種不同數(shù)據(jù)是怎么存儲(chǔ)管理的?除此之外,數(shù)據(jù)架構(gòu)還包括:數(shù)據(jù)模型,它從靜態(tài)視角,描述數(shù)據(jù)之間的具體關(guān)系,指導(dǎo)后續(xù)數(shù)據(jù)庫(kù)的邏輯設(shè)計(jì)、物理設(shè)計(jì);數(shù)據(jù)分布,它從動(dòng)態(tài)視角,描述數(shù)據(jù)在業(yè)務(wù)應(yīng)用系統(tǒng)上的分布、數(shù)據(jù)流動(dòng)的全景視圖等。由于篇幅所限,在此不一一列舉。

責(zé)任編輯:未麗燕 來(lái)源: 今日頭條
相關(guān)推薦

2010-12-20 13:36:45

2010-05-20 17:12:23

IIS安全

2022-11-22 10:52:49

數(shù)據(jù)中心

2013-07-17 18:25:42

數(shù)據(jù)中心網(wǎng)絡(luò)架構(gòu)因素

2012-01-05 09:45:31

微軟云數(shù)據(jù)庫(kù)SQL Azure

2020-08-14 11:31:05

人工智能

2024-01-18 15:47:37

數(shù)字化轉(zhuǎn)型數(shù)據(jù)治理

2011-10-25 10:28:55

數(shù)據(jù)中心基礎(chǔ)架構(gòu)服務(wù)器

2023-06-15 14:53:59

大數(shù)據(jù)

2019-12-09 10:53:10

數(shù)據(jù)庫(kù)選型運(yùn)維

2020-06-19 11:43:09

戴爾

2021-07-02 10:35:09

數(shù)據(jù)庫(kù)互聯(lián)網(wǎng)架構(gòu)

2012-08-24 09:01:02

IBMdW

2022-02-07 18:28:06

數(shù)據(jù)網(wǎng)格數(shù)據(jù)發(fā)現(xiàn)數(shù)據(jù)

2021-01-29 15:13:08

數(shù)據(jù)中心云計(jì)算綠色數(shù)據(jù)中心

2017-05-25 09:23:18

大數(shù)據(jù)架構(gòu)Hadoop

2014-09-29 10:41:07

MDMMIM企業(yè)移動(dòng)安全

2017-09-08 08:47:26

HPC數(shù)據(jù)中心高性能計(jì)算

2010-04-08 10:44:28

Oracle數(shù)據(jù)庫(kù)

2023-07-10 15:47:05

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)