自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

對比MapReduce 流處理框架沒有所謂的查詢層

云計算
當著手實時大數(shù)據時,SPF不失為MapReduce很好的替代。取代對數(shù)據進行批處理,它們在數(shù)據出現(xiàn)時就會進行處理;如果你處理的是事件流,使用SPF顯然會比MapReduce來的合理。而類似Storm(Twitter)和S4(Yahoo!)這樣的框架,顯然更適合擴展類似(流處理)的計算。

Mikio L. Braun柏林工業(yè)大學機器學習學博士后,TWIMPACT聯(lián)合創(chuàng)始人兼首席數(shù)據科學家。在其個人博客上簡述了主流SPF(Stream Processing Framework)與MapReduce的區(qū)別 —— 并沒有查詢層。

以下為譯文:

當著手實時大數(shù)據時,SPF不失為MapReduce很好的替代。取代對數(shù)據進行批處理,它們在數(shù)據出現(xiàn)時就會進行處理;如果你處理的是事件流,使用SPF顯然會比MapReduce來的合理。而類似Storm(Twitter)和S4(Yahoo!)這樣的框架,顯然更適合擴展類似(流處理)的計算。類似于MapReduce作業(yè),你只要指定小的工作線程,然后這線線程會被自動的監(jiān)視和部署從而提供穩(wěn)健的擴展性。

所以開始你會覺得“SPF是基于MapReduce的事件版本”,然而這里存在著顯著的差別:在流處理中是沒有查詢層的(最少在Storm和S4中是沒有的)。

查詢層,你可以通過指令查詢出你想要的結果;然而就流處理來說,意味著指令會一直運行,因為你處理的是一個隨時都有新時間加入的事件流。

舉個例子,著眼隨處可見的“單詞計數(shù)用例”,絡繹不絕的導入句子(比如說,推特),那么你該如何查詢出在一個指定的時間某個指定單詞的個數(shù)。

答案可能與大部分人所想的不同:沒有任何方法可以計算出結果(至少在現(xiàn)有的SPF中)。原因是:每個線程都會被分配數(shù)據流的一部分,然而卻沒有方法去訪問這些信息。取而代之的是:結果只能定期的輸出,不管是到屏幕或者是持久化儲存。

 

 

不錯,這只是一個比較業(yè)余的例子;然而這同樣意味著現(xiàn)實中的應用程序,你需要一些數(shù)據庫后端做結果的儲存。取決于你處理的數(shù)據量和你所做的聚合程度(或者是不做),這同樣意味著你的持久化數(shù)據庫MySQL可能滿足不了流處理集群。

在MapReduce中也同樣如此,對數(shù)據進行一些定期的修改,而區(qū)別在于MapReduce需要做兩倍流處理額外后端的儲存方案。

 

 

Mikio L. Braun認為以下的幾個環(huán)境適合流處理:

針對高頻度的事件流

每個獨立的事件都需要處理高復雜度的分析

高聚合度,以至于數(shù)據的體積會大量的減少

而在以下的情況可能就不會很適用:

每個時間你都需要做許多的持久層修改

在分析進行的同時,可能會去做某些結果的查詢

顯然在IT領域沒有通吃的算法及框架,把握自己的程序及數(shù)據類型,為其選擇合適的分析工具才是王道。

責任編輯:王程程 來源: 博客
相關推薦

2013-05-09 09:26:59

軟件開發(fā)開發(fā)方法

2017-11-20 13:54:55

FlinkStorm框架

2017-11-21 15:50:09

FlinkStorm性能

2014-01-17 09:38:07

Twitter開源流處理

2019-07-05 12:16:26

大數(shù)據IT互聯(lián)網

2024-12-27 14:45:59

2013-01-21 13:22:56

IBMdW

2022-05-12 09:37:03

測試JUnit開發(fā)

2011-12-02 10:58:55

交換機

2023-07-10 13:51:45

測試并行計算框架

2012-06-07 09:20:33

ibmdw

2019-08-14 17:13:23

大數(shù)據MapReduce框架

2012-06-19 09:28:46

Hadoop

2024-07-29 08:02:07

Service類型開發(fā)

2019-11-08 14:31:45

MapReduce數(shù)據集數(shù)據結構

2020-04-14 15:18:16

SparkFlink框架

2016-11-17 14:49:59

云端試驗預期

2021-05-24 10:32:04

鴻蒙HarmonyOS應用

2018-11-08 15:30:04

JavaScriptES6異步

2020-06-02 09:56:40

阿里要性
點贊
收藏

51CTO技術棧公眾號