自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<abbr id="hrn1a"><tt id="hrn1a"></tt></abbr>

<cite id="hrn1a"><rp id="hrn1a"></rp></cite>

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認證廠商認證 IT技術(shù)PMP項目管理免費題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設(shè)置退出

大數(shù)據(jù)的核心是云技術(shù)和BI

作者：佚名 2018-07-19 20:35:42

大數(shù)據(jù)

整體來看，未來的趨勢是，云計算作為計算資源的底層，支撐著上層的大數(shù)據(jù)處理，而大數(shù)據(jù)的發(fā)展趨勢是，實時交互式的查詢效率和分析能力，當前的大數(shù)據(jù)處理一直在向著近似于傳統(tǒng)數(shù)據(jù)庫體驗的方向發(fā)展。

關(guān)于大數(shù)據(jù)和云計算的關(guān)系人們通常會有誤解。而且也會把它們混起來說，分別做一句話直白解釋就是：云計算就是硬件資源的虛擬化;大數(shù)據(jù)就是海量數(shù)據(jù)的高效處理。如果做一個更形象的解釋，云計算相當于我們的計算機和操作系統(tǒng)，將大量的硬件資源虛擬化之后再進行分配使用;大數(shù)據(jù)則相當于海量數(shù)據(jù)的“數(shù)據(jù)庫”。

整體來看，未來的趨勢是，云計算作為計算資源的底層，支撐著上層的大數(shù)據(jù)處理，而大數(shù)據(jù)的發(fā)展趨勢是，實時交互式的查詢效率和分析能力，當前的大數(shù)據(jù)處理一直在向著近似于傳統(tǒng)數(shù)據(jù)庫體驗的方向發(fā)展。

大數(shù)據(jù)的4V特性，即類型復(fù)雜，海量，快速和價值，其總體架構(gòu)包括三層，數(shù)據(jù)存儲，數(shù)據(jù)處理和數(shù)據(jù)分析。類型復(fù)雜和海量由數(shù)據(jù)存儲層解決，快速和時效性要求由數(shù)據(jù)處理層解決，價值由數(shù)據(jù)分析層解決。數(shù)據(jù)先要通過存儲層存儲下來，然后根據(jù)數(shù)據(jù)需求和目標來建立相應(yīng)的數(shù)據(jù)模型和數(shù)據(jù)分析指標體系對數(shù)據(jù)進行分析產(chǎn)生價值。而中間的時效性又通過中間數(shù)據(jù)處理層提供的強大的并行計算和分布式計算能力來完成。三層相互配合，讓大數(shù)據(jù)最終產(chǎn)生價值。

數(shù)據(jù)存儲層

數(shù)據(jù)有很多分法，有結(jié)構(gòu)化，半結(jié)構(gòu)化，非結(jié)構(gòu)化;也有元數(shù)據(jù)，主數(shù)據(jù)，業(yè)務(wù)數(shù)據(jù);還可以分為GIS，視頻，文件，語音，業(yè)務(wù)交易類各種數(shù)據(jù)。傳統(tǒng)的結(jié)構(gòu)化數(shù)據(jù)庫已經(jīng)無法滿足數(shù)據(jù)多樣性的存儲要求，因此在RDBMS基礎(chǔ)上增加了兩種類型，一種是hdfs可以直接應(yīng)用于非結(jié)構(gòu)化文件存儲，一種是nosql類數(shù)據(jù)庫，可以應(yīng)用于結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù)存儲。

從存儲層的搭建來說，關(guān)系型數(shù)據(jù)庫，NoSQL數(shù)據(jù)庫和hdfs分布式文件系統(tǒng)三種存儲方式都需要。業(yè)務(wù)應(yīng)用根據(jù)實際的情況選擇不同的存儲模式，但是為了業(yè)務(wù)的存儲和讀取方便性，我們可以對存儲層進一步的封裝，形成一個統(tǒng)一的共享存儲服務(wù)層，簡化這種操作。從用戶來講并不關(guān)心底層存儲細節(jié)，只關(guān)心數(shù)據(jù)的存儲和讀取的方便性，通過共享數(shù)據(jù)存儲層可以實現(xiàn)在存儲上的應(yīng)用和存儲基礎(chǔ)設(shè)置的徹底解耦。

數(shù)據(jù)處理層

數(shù)據(jù)處理層核心解決問題在于數(shù)據(jù)存儲出現(xiàn)分布式后帶來的數(shù)據(jù)處理上的復(fù)雜度，海量存儲后帶來了數(shù)據(jù)處理上的時效性要求，這些都是數(shù)據(jù)處理層要解決的問題。

在傳統(tǒng)的云相關(guān)技術(shù)架構(gòu)上，可以將hive，pig和hadoop-mapreduce框架相關(guān)的技術(shù)內(nèi)容全部劃入到數(shù)據(jù)處理層的能力。原來我思考的是將hive劃入到數(shù)據(jù)分析層能力不合適，因為hive重點還是在真正處理下的復(fù)雜查詢的拆分，查詢結(jié)果的重新聚合，而mapreduce本身又實現(xiàn)真正的分布式處理能力。

mapreduce只是實現(xiàn)了一個分布式計算的框架和邏輯，而真正的分析需求的拆分，分析結(jié)果的匯總和合并還是需要hive層的能力整合。最終的目的很簡單，即支持分布式架構(gòu)下的時效性要求。

數(shù)據(jù)分析層

***回到分析層，分析層重點是真正挖掘大數(shù)據(jù)的價值所在，而價值的挖掘核心又在于數(shù)據(jù)分析和挖掘。那么數(shù)據(jù)分析層核心仍然在于傳統(tǒng)的BI分析的內(nèi)容。包括數(shù)據(jù)的維度分析，數(shù)據(jù)的切片，數(shù)據(jù)的上鉆和下鉆，cube等。

數(shù)據(jù)分析我只關(guān)注兩個內(nèi)容，一個就是傳統(tǒng)數(shù)據(jù)倉庫下的數(shù)據(jù)建模，在該數(shù)據(jù)模型下需要支持上面各種分析方法和分析策略;其次是根據(jù)業(yè)務(wù)目標和業(yè)務(wù)需求建立的KPI指標體系，對應(yīng)指標體系的分析模型和分析方法。解決這兩個問題基本解決數(shù)據(jù)分析的問題。

傳統(tǒng)的BI分析通過大量的ETL數(shù)據(jù)抽取和集中化，形成一個完整的數(shù)據(jù)倉庫，而基于大數(shù)據(jù)的BI分析，可能并沒有一個集中化的數(shù)據(jù)倉庫，或者將數(shù)據(jù)倉庫本身也是分布式的了，BI分析的基本方法和思路并沒有變化，但是落地到執(zhí)行的數(shù)據(jù)存儲和數(shù)據(jù)處理方法卻發(fā)生了大變化。

談了這么多，核心還是想說明大數(shù)據(jù)兩大核心為云技術(shù)和BI，離開云技術(shù)大數(shù)據(jù)沒有根基和落地可能，離開BI和價值，大數(shù)據(jù)又變化為舍本逐末，丟棄關(guān)鍵目標。簡單總結(jié)就是大數(shù)據(jù)目標驅(qū)動是BI，大數(shù)據(jù)實施落地式云技術(shù)。

責(zé)任編輯：未麗燕來源：西部數(shù)碼

大數(shù)據(jù)云計算 BI

51CTO技術(shù)棧公眾號

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營

<s id="9hoyl"><li id="9hoyl"></li></s>

<sub id="9hoyl"><p id="9hoyl"></p></sub>

<cite id="9hoyl"><rp id="9hoyl"></rp></cite>