自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

深入淺出解析大數(shù)據(jù)平臺架構(gòu)

數(shù)據(jù)庫
“就像望遠(yuǎn)鏡讓我們能夠感受宇宙,顯微鏡讓我們能夠觀測微生物一樣,大數(shù)據(jù)正在改變我們的生活以及理解世界的方式……”。

 大數(shù)據(jù)的4V特征-來源

大數(shù)據(jù)

公司的“大數(shù)據(jù)”

隨著公司業(yè)務(wù)的增長,大量和流程、規(guī)則相關(guān)的非結(jié)構(gòu)化數(shù)據(jù)也爆發(fā)式增長。比如:

1、業(yè)務(wù)系統(tǒng)現(xiàn)在平均每天存儲20萬張圖片,磁盤空間每天消耗100G;

2、平均每天產(chǎn)生簽約視頻文件6000個,每個平均250M,磁盤空間每天消耗1T;

……

三國里的“大數(shù)據(jù)”

“草船借箭”和大數(shù)據(jù)有什么關(guān)系呢?對天象的觀察是基于一種對風(fēng)、云、溫度、濕度、光照和所處節(jié)氣的綜合分析這些數(shù)據(jù)來源于多元化的“非結(jié)構(gòu)”類型,并且數(shù)據(jù)量較大,只不過這些數(shù)據(jù)輸入到的不是電腦,而是人腦并最終通過計算分析得出結(jié)論。

[[116813]]

Google分布式計算的三駕馬車

  • Google File System用來解決數(shù)據(jù)存儲的問題,采用N多臺廉價的電腦,使用冗余(也就是一份文件保存多份在不同的電腦之上)的方式,來取得讀寫速度與數(shù)據(jù)安全并存的結(jié)果。

  • Map-Reduce說穿了就是函數(shù)式編程,把所有的操作都分成兩類,map與reduce,map用來將數(shù)據(jù)分成多份,分開處理,reduce將處理后的結(jié)果進(jìn)行歸并,得到最終的結(jié)果。

  • BigTable是在分布式系統(tǒng)上存儲結(jié)構(gòu)化數(shù)據(jù)的一個解決方案,解決了巨大的Table的管理、負(fù)載均衡的問題。

Hadoop體系架構(gòu)

Hadoop

 

Hadoop核心設(shè)計

Hadoop

 

HDFS介紹-文件讀流程

Hadoop

 

Client向NameNode發(fā)起文件讀取的請求。

NameNode返回文件存儲的DataNode的信息。

Client讀取文件信息。

 

HDFS介紹-文件寫流程

HDFS

 

Client向NameNode發(fā)起文件寫入的請求。

NameNode根據(jù)文件大小和文件塊配置情況,返回給Client它所管理部分DataNode的信息。

Client將文件劃分為多個Block,根據(jù)DataNode的地址信息,按順序?qū)懭氲矫恳粋€DataNode塊中。

 

MapReduce——映射、化簡編程模型

輸入數(shù)據(jù)->Map分解任務(wù)->執(zhí)行并返回結(jié)果->Reduce匯總結(jié)果->輸出結(jié)果

HDFS

 

Hbase——分布式數(shù)據(jù)存儲系統(tǒng)

HDFS

 

Client:使用HBase RPC機(jī)制與HMaster和HRegionServer進(jìn)行通信

Zookeeper:協(xié)同服務(wù)管理,HMaster通過Zookeepe可以隨時感知各個HRegionServer的健康狀況

HMaster: 管理用戶對表的增刪改查操作

HRegionServer:HBase中最核心的模塊,主要負(fù)責(zé)響應(yīng)用戶I/O請求,向HDFS文件系統(tǒng)中讀寫數(shù)據(jù)

HRegion:Hbase中分布式存儲的最小單元,可以理解成一個Table

HStore:HBase存儲的核心。由MemStore和StoreFile組成。

HLog:每次用戶操作寫入Memstore的同時,也會寫一份數(shù)據(jù)到HLog文件

還有哪些NoSQL產(chǎn)品?

NoSQL

 

為什么要使用NoSQL?

一個高并發(fā)網(wǎng)站的DB進(jìn)化史

NoSQL

關(guān)系模型>聚合數(shù)據(jù)模型的轉(zhuǎn)換-基本變換

NoSQL

 

關(guān)系模型>聚合數(shù)據(jù)模型的轉(zhuǎn)換-內(nèi)嵌變換

NoSQL

 

關(guān)系模型>聚合數(shù)據(jù)模型的轉(zhuǎn)換-分割變換

NoSQL

 

關(guān)系模型>聚合數(shù)據(jù)模型的轉(zhuǎn)換-內(nèi)聯(lián)變換

 

36大數(shù)據(jù)

 #p#

Hadoop2.0

MapReduce:

JobTracker:協(xié)調(diào)作業(yè)的運(yùn)行。

TaskTracker:運(yùn)行作業(yè)劃分后的任務(wù)。

Hadoop2.0

 

大數(shù)據(jù)的技術(shù)領(lǐng)域

 

Hadoop2.0

 

騰訊大數(shù)據(jù)現(xiàn)狀(資料來自2014.4.11 騰訊分享日大會)

Hadoop2.0

 

 騰訊大數(shù)據(jù)

 

騰訊大數(shù)據(jù)平臺產(chǎn)品架構(gòu)

Hadoop2.0

 

騰訊大數(shù)據(jù)平臺與業(yè)務(wù)平臺的關(guān)系

Hadoop2.0

 

公司數(shù)據(jù)處理平臺的基礎(chǔ)架構(gòu)

大數(shù)據(jù)

 

公司大數(shù)據(jù)平臺架構(gòu)圖

大數(shù)據(jù)

應(yīng)用一數(shù)據(jù)分析

大數(shù)據(jù)

 

應(yīng)用二視頻存儲

 

 大數(shù)據(jù)

應(yīng)用三離線日志分析

大數(shù)據(jù)

 

應(yīng)用五在線數(shù)據(jù)分析

參考資料:京東基于Samza的流式計算實踐

大數(shù)據(jù)

 

責(zé)任編輯:彭凡 來源: 36大數(shù)據(jù)
相關(guān)推薦

2017-01-05 17:35:18

百度云天算

2021-03-16 08:54:35

AQSAbstractQueJava

2011-07-04 10:39:57

Web

2022-01-12 08:54:52

Spring編程架構(gòu)設(shè)計

2023-05-05 18:33:15

2021-07-20 15:20:02

FlatBuffers阿里云Java

2017-07-02 18:04:53

塊加密算法AES算法

2019-01-07 15:29:07

HadoopYarn架構(gòu)調(diào)度器

2012-05-21 10:06:26

FrameworkCocoa

2017-07-17 11:52:54

jQuery源碼分析前端框架類庫

2022-01-13 09:38:25

Android架構(gòu)設(shè)計

2022-09-26 09:01:15

語言數(shù)據(jù)JavaScript

2019-11-21 09:16:14

OpenStack安全組MAC

2023-05-18 08:54:22

OkHttp源碼解析

2023-01-06 12:50:46

ChatGPT

2022-01-11 07:52:22

CSS 技巧代碼重構(gòu)

2009-11-30 16:46:29

學(xué)習(xí)Linux

2019-11-11 14:51:19

Java數(shù)據(jù)結(jié)構(gòu)Properties

2019-12-04 10:13:58

Kubernetes存儲Docker

2022-11-09 08:06:15

GreatSQLMGR模式
點贊
收藏

51CTO技術(shù)棧公眾號