自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

大數(shù)據(jù)分析需要什么技術(shù)架構(gòu)?

大數(shù)據(jù) 數(shù)據(jù)分析
對(duì)于企業(yè)而言,坐擁龐大的數(shù)據(jù)資源,想要實(shí)現(xiàn)大數(shù)據(jù)分析,首要的就是要搭建起自身的大數(shù)據(jù)系統(tǒng)平臺(tái),而每個(gè)公司都有自己特定的業(yè)務(wù)場(chǎng)景,因此在大數(shù)據(jù)平臺(tái)上的需求是不一樣的。今天我們僅從通用的角度,來(lái)聊聊大數(shù)據(jù)分析需要什么技術(shù)架構(gòu)?

 對(duì)于企業(yè)而言,坐擁龐大的數(shù)據(jù)資源,想要實(shí)現(xiàn)大數(shù)據(jù)分析,首要的就是要搭建起自身的大數(shù)據(jù)系統(tǒng)平臺(tái),而每個(gè)公司都有自己特定的業(yè)務(wù)場(chǎng)景,因此在大數(shù)據(jù)平臺(tái)上的需求是不一樣的。今天我們僅從通用的角度,來(lái)聊聊大數(shù)據(jù)分析需要什么技術(shù)架構(gòu)?

[[342605]]

我們熟悉的以BAT為首的互聯(lián)網(wǎng)大廠,都擁有自身的大數(shù)據(jù)系統(tǒng)平臺(tái),但是各自面臨的業(yè)務(wù)場(chǎng)景是不同的,比如說(shuō)騰訊,主要是社交業(yè)務(wù)場(chǎng)景;百度,主要是搜索業(yè)務(wù)場(chǎng)景;而阿里,主要是電商業(yè)務(wù)場(chǎng)景。

 

這樣不同的業(yè)務(wù)場(chǎng)景下,需要根據(jù)實(shí)際的業(yè)務(wù)需求,選擇適合自己的技術(shù)框架,來(lái)搭建自己的大數(shù)據(jù)架構(gòu)體系。但是從技術(shù)架構(gòu)體系的共性來(lái)說(shuō),是可以從通用的技術(shù)模塊去理解,來(lái)幫助我們更好地學(xué)習(xí)和掌握大數(shù)據(jù)技術(shù)架構(gòu)的。

大數(shù)據(jù)分析技術(shù)架構(gòu)通用模塊:

數(shù)據(jù)收集模塊:主要負(fù)責(zé)收集各種數(shù)據(jù)源的數(shù)據(jù),包括日志文件、網(wǎng)絡(luò)請(qǐng)求、數(shù)據(jù)庫(kù)、消息隊(duì)列等,并將這些數(shù)據(jù)轉(zhuǎn)換為文件或者消息向后傳遞。

數(shù)據(jù)轉(zhuǎn)存模塊:主要負(fù)責(zé)將數(shù)據(jù)定時(shí)傳遞到分布式存儲(chǔ)或者實(shí)時(shí)傳遞給下游的數(shù)據(jù)處理程序。

ETL模塊:主要負(fù)責(zé)數(shù)據(jù)的清洗、格式和內(nèi)容的處理和轉(zhuǎn)換、數(shù)據(jù)分級(jí)分揀、加載至數(shù)據(jù)倉(cāng)庫(kù)等。

數(shù)據(jù)倉(cāng)庫(kù)模塊:這是整個(gè)架構(gòu)的核心,數(shù)據(jù)倉(cāng)庫(kù)是數(shù)據(jù)有組織的集中存儲(chǔ)的地方,負(fù)責(zé)數(shù)據(jù)的存取和管理。

元數(shù)據(jù)管理模塊:主要負(fù)責(zé)記錄和約束數(shù)據(jù)倉(cāng)庫(kù)中數(shù)據(jù)的含義和格式,控制著數(shù)據(jù)的生命周期和數(shù)據(jù)質(zhì)量。

分析引擎模塊:數(shù)據(jù)分析師交互最多的模塊,主要負(fù)責(zé)執(zhí)行各種分析語(yǔ)句或代碼,完成各種分析任務(wù)。

作業(yè)管理與調(diào)度模塊:負(fù)責(zé)分析作業(yè)的管理和定時(shí)調(diào)度,包括作業(yè)的增刪改查、查看修改歷史、設(shè)置調(diào)度定時(shí)和執(zhí)行引擎等。

資源分配與調(diào)度模塊:主要負(fù)責(zé)在多作業(yè)同時(shí)運(yùn)行的場(chǎng)景下,有效協(xié)調(diào)和分配集群的資源,使資源利用率最大化。

 

關(guān)于大數(shù)據(jù)分析需要什么技術(shù)架構(gòu),以上就為大家做了一個(gè)簡(jiǎn)單的介紹了。大數(shù)據(jù)技術(shù)架構(gòu)需要結(jié)合實(shí)際業(yè)務(wù)來(lái)考量,學(xué)習(xí)階段,先從通用層面去掌握,實(shí)際工作當(dāng)中還需持續(xù)積累經(jīng)驗(yàn),才能真正地掌握扎實(shí),融會(huì)貫通。

責(zé)任編輯:華軒 來(lái)源: 今日頭條
相關(guān)推薦

2020-07-22 11:41:14

數(shù)據(jù)架構(gòu)大數(shù)據(jù)技術(shù)

2021-04-08 10:45:37

大數(shù)據(jù)技術(shù)安全

2015-11-06 10:21:50

2022-03-29 14:49:14

大數(shù)據(jù)數(shù)據(jù)分析

2012-11-01 14:03:49

Teradata 大數(shù)據(jù)天睿

2020-02-24 08:58:46

數(shù)據(jù)架構(gòu)技術(shù)

2012-11-30 14:49:58

IBMGartnerHadoop

2021-01-27 09:18:50

大數(shù)據(jù)數(shù)據(jù)收集大數(shù)據(jù)分析

2015-08-25 10:32:07

健康大數(shù)據(jù)

2017-04-28 08:13:08

大數(shù)據(jù)框架HDFS

2015-08-21 13:54:38

大數(shù)據(jù)

2015-07-08 15:07:23

大數(shù)據(jù)分析多少種工具

2015-01-07 14:04:25

2019-04-15 15:32:12

大數(shù)據(jù)開(kāi)發(fā)數(shù)據(jù)分析數(shù)據(jù)科學(xué)

2016-12-13 09:33:13

大數(shù)據(jù)數(shù)據(jù)挖掘數(shù)字化運(yùn)營(yíng)

2023-06-05 16:45:52

2015-06-17 14:39:23

大數(shù)據(jù)大數(shù)據(jù)分析

2012-11-27 09:46:36

大數(shù)據(jù)運(yùn)算云計(jì)算

2022-08-03 14:30:52

大數(shù)據(jù)數(shù)據(jù)分析數(shù)據(jù)收集

2011-09-02 10:59:02

大數(shù)據(jù)數(shù)據(jù)分析Hadoop
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)