自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

創(chuàng)建有效大數(shù)據(jù)模型的六個(gè)技巧

大數(shù)據(jù)
大數(shù)據(jù)(現(xiàn)在占管理數(shù)據(jù)的很大一部分)不能在關(guān)系數(shù)據(jù)庫上運(yùn)行。它在NoSQL等非關(guān)系數(shù)據(jù)庫上運(yùn)行。這讓人們相信不需要?jiǎng)?chuàng)建大數(shù)據(jù)模型。

數(shù)據(jù)建模是一門復(fù)雜的科學(xué),它涉及組織數(shù)據(jù)以滿足業(yè)務(wù)流程的需求。它要求設(shè)計(jì)邏輯關(guān)系,以便數(shù)據(jù)能夠相互關(guān)聯(lián)并支持業(yè)務(wù)。然后將邏輯設(shè)計(jì)轉(zhuǎn)換為物理模型,其中包括存儲(chǔ)設(shè)備、數(shù)據(jù)庫和存儲(chǔ)數(shù)據(jù)的文件。

在以往,企業(yè)一直使用SQL等關(guān)系數(shù)據(jù)庫技術(shù)來開發(fā)數(shù)據(jù)模型,因?yàn)樗貏e適合靈活地將數(shù)據(jù)集和數(shù)據(jù)類型鏈接在一起,以支持業(yè)務(wù)流程的信息需求。

不幸的是,大數(shù)據(jù)(現(xiàn)在占管理數(shù)據(jù)的很大一部分)不能在關(guān)系數(shù)據(jù)庫上運(yùn)行。它在NoSQL等非關(guān)系數(shù)據(jù)庫上運(yùn)行。這讓人們相信不需要?jiǎng)?chuàng)建大數(shù)據(jù)模型。問題是,如果想充分利用大數(shù)據(jù)的潛力,確實(shí)需要對(duì)其進(jìn)行數(shù)據(jù)建模。以下是以可訪問且有效的方式建模大數(shù)據(jù)的6個(gè)技巧:

1.不要試圖將傳統(tǒng)的建模技術(shù)強(qiáng)加于大數(shù)據(jù)

傳統(tǒng)的固定記錄數(shù)據(jù)在增長過程中是穩(wěn)定和可預(yù)測(cè)的。這使得大數(shù)據(jù)建模相對(duì)容易。相比之下,大數(shù)據(jù)的指數(shù)級(jí)增長是不可預(yù)測(cè)的,其無數(shù)形式和來源也是不可預(yù)測(cè)的。當(dāng)網(wǎng)站考慮對(duì)大數(shù)據(jù)建模時(shí),建模工作應(yīng)該集中在構(gòu)建開放和彈性的數(shù)據(jù)接口上,因?yàn)榭赡苡肋h(yuǎn)不知道什么時(shí)候會(huì)出現(xiàn)新的數(shù)據(jù)源或數(shù)據(jù)形式。在傳統(tǒng)的固定記錄數(shù)據(jù)世界中,這并不是優(yōu)先考慮的問題。

2.設(shè)計(jì)系統(tǒng)而不是模型

在傳統(tǒng)數(shù)據(jù)領(lǐng)域中,關(guān)系數(shù)據(jù)庫模型可以涵蓋業(yè)務(wù)信息支持所需的數(shù)據(jù)之間的大多數(shù)關(guān)系和鏈接。大數(shù)據(jù)則不是這樣,它可能沒有數(shù)據(jù)庫,或者可能使用NoSQL這樣的數(shù)據(jù)庫,而后者不需要數(shù)據(jù)庫模型。

正因?yàn)槿绱耍髷?shù)據(jù)模型應(yīng)該建立在系統(tǒng)上,而不是數(shù)據(jù)庫上。大數(shù)據(jù)模型應(yīng)該包含的系統(tǒng)組件包括業(yè)務(wù)信息需求、企業(yè)治理和安全、用于數(shù)據(jù)的物理存儲(chǔ)、所有類型數(shù)據(jù)的集成和開放接口,以及處理各種不同數(shù)據(jù)類型的能力。

3.尋找大數(shù)據(jù)建模工具

如今有許多支持Hadoop的商業(yè)數(shù)據(jù)建模工具,以及像Tableau這樣的大數(shù)據(jù)報(bào)告軟件。在考慮大數(shù)據(jù)工具和方法時(shí),IT決策者應(yīng)該將為大數(shù)據(jù)構(gòu)建數(shù)據(jù)模型的能力作為他們的需求之一。

4.關(guān)注對(duì)企業(yè)業(yè)務(wù)至關(guān)重要的數(shù)據(jù)

每天都有大量的數(shù)據(jù)涌入企業(yè),其中很多都是無關(guān)緊要的數(shù)據(jù)。創(chuàng)建包含所有數(shù)據(jù)的模型是沒有意義的。更好的方法是識(shí)別對(duì)企業(yè)至關(guān)重要的大數(shù)據(jù),并僅對(duì)這些數(shù)據(jù)建模。

5.交付高質(zhì)量的數(shù)據(jù)

如果企業(yè)專注于為他們的數(shù)據(jù)開發(fā)完善的定義和詳盡的元數(shù)據(jù)(描述數(shù)據(jù)的來源、目的等),就可以為大數(shù)據(jù)建立高級(jí)的數(shù)據(jù)模型和關(guān)系。對(duì)數(shù)據(jù)了解得越多,就越能將其正確地放入支持業(yè)務(wù)的數(shù)據(jù)模型中。

6.尋找對(duì)數(shù)據(jù)的關(guān)鍵切入點(diǎn)

當(dāng)今大數(shù)據(jù)中最常用的向量之一是地理位置。根據(jù)企業(yè)的業(yè)務(wù)和所在的行業(yè)的不同,還有其他用戶想要的大數(shù)據(jù)通用密鑰。越能識(shí)別數(shù)據(jù)中的這些常見入口點(diǎn),就越能更好地設(shè)計(jì)支持企業(yè)關(guān)鍵信息訪問路徑的數(shù)據(jù)模型。

責(zé)任編輯:姜華 來源: 企業(yè)網(wǎng)D1Net
相關(guān)推薦

2018-05-08 10:00:00

大數(shù)據(jù)模型技巧

2022-06-28 10:17:23

安全職位首席信息安全官

2023-07-06 14:29:11

2021-09-28 13:32:01

大數(shù)據(jù)大數(shù)據(jù)戰(zhàn)略數(shù)據(jù)策略

2020-06-18 10:35:44

存儲(chǔ)數(shù)據(jù)技術(shù)

2024-03-06 10:50:30

云計(jì)算云實(shí)例云提供商

2016-12-15 09:53:07

自學(xué)編程技巧

2022-04-29 17:03:37

WordPress開發(fā)者網(wǎng)站安全

2021-10-28 15:58:25

數(shù)據(jù)科學(xué)交叉驗(yàn)證

2023-02-08 17:00:07

IF 語句技巧代碼

2023-10-10 18:24:46

PostgreSQL性能RDBMS

2024-07-15 08:10:57

2015-07-30 14:43:04

導(dǎo)航欄iOS開發(fā)

2021-01-21 16:20:14

數(shù)據(jù)采集數(shù)據(jù)采集工具大數(shù)據(jù)

2021-10-09 10:00:52

遠(yuǎn)程招聘技巧招聘

2023-01-29 07:45:06

DevOps

2019-08-26 09:39:53

Hadoop發(fā)行版大數(shù)據(jù)

2015-03-05 14:24:00

大數(shù)據(jù)分析大數(shù)據(jù)大數(shù)據(jù)分析工具

2019-08-26 09:20:43

Hadoop大數(shù)據(jù)數(shù)據(jù)庫

2023-03-24 12:37:16

數(shù)字供應(yīng)鏈數(shù)字化轉(zhuǎn)型
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)