自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

觀點(diǎn):流式計(jì)算推動(dòng)實(shí)時(shí)處理商業(yè)變革

云計(jì)算
隨著大量實(shí)時(shí)計(jì)算需求的增加,分布式流式計(jì)算將會(huì)成為分布式計(jì)算的下一個(gè)主要研究重點(diǎn),將會(huì)成為類似Hadoop這類MapReduce框架的有力補(bǔ)充。

 

[[54978]]

在這一年,我們看到眾多廠商工作重點(diǎn)主要是圍繞整合Hadoop或NoSQL數(shù)據(jù)處理引擎以及改善基本的數(shù)據(jù)存儲(chǔ)。Hadoop最成功的一點(diǎn)就是其采用了MapReduce。MapReduce是一種處理超大型數(shù)據(jù)集并生成相關(guān)執(zhí)行的編程模型,MapReduce的核心思想主要是借鑒了函數(shù)是編程語言以及矢量變成語言里的特性。

現(xiàn)今包括Microsoft、IBM、Oracle、Cloudera、MapR等眾多廠商相繼推出了與自身相結(jié)合的Hadoop產(chǎn)品。例如Oracle NoSQL Database,其是Oracle在全球大會(huì)上發(fā)布的Big Data Appliance的其中一個(gè)組件,Big Data Appliance還包括了Hadoop、Oracle數(shù)據(jù)庫(kù)Hadoop適配器、Oracle數(shù)據(jù)庫(kù)Hadoop裝載器及R語言的系統(tǒng)。

同時(shí)在本月微軟也公布了針對(duì)Windows Azure的基于Apache Hadoop的預(yù)覽發(fā)行版,據(jù)微軟透露其可使Hadoop應(yīng)用程序在幾小時(shí)即可部署完成,而以往這需要數(shù)天。而這種趨勢(shì)在未來一年還會(huì)持續(xù)下去。正如我們所看到的,Hadoop技術(shù)在眾多領(lǐng)域正廣泛得到部署。

 

[[54979]]

但Hadoop也面臨一些相當(dāng)棘手的狀況,眾所周知,Hadoop的批量化處理是人們喜愛它的地方,但這在某些領(lǐng)域仍顯不足,尤其是在例如移動(dòng)、Web客戶端或金融、網(wǎng)頁(yè)廣告等需要實(shí)時(shí)計(jì)算的領(lǐng)域。這些領(lǐng)域產(chǎn)生的數(shù)據(jù)量極大,沒有足夠的存儲(chǔ)空間來存儲(chǔ)每個(gè)業(yè)務(wù)收到的數(shù)據(jù)。而流計(jì)算則可以實(shí)時(shí)對(duì)數(shù)據(jù)進(jìn)行分析,并決定是否拋棄無用的數(shù)據(jù),而這無需經(jīng)過Map/Reduce的環(huán)節(jié)。

從實(shí)時(shí)計(jì)算的角度看,Yahoo!的分布式流計(jì)算平臺(tái)S4則要比Hadoop更具優(yōu)勢(shì)。MapReduce系統(tǒng)主要解決的是對(duì)靜態(tài)數(shù)據(jù)的批量處理,即當(dāng)前的MapReduce系統(tǒng)實(shí)現(xiàn)啟動(dòng)計(jì)算時(shí),一般數(shù)據(jù)已經(jīng)到位(比如保存到了分布式文件系統(tǒng)上)。

而流式計(jì)算系統(tǒng)在啟動(dòng)時(shí),一般數(shù)據(jù)并沒有完全到位,而是源源不斷地流入,并且不像批處理系統(tǒng)重視的是總數(shù)據(jù)處理的吞吐,而是對(duì)數(shù)據(jù)處理的latency,即希望進(jìn)入的數(shù)據(jù)越快處理越好。

 

 

Yahoo!S4的設(shè)計(jì)大量借鑒了IBM的Stream Processing Core(SPC)中間件的設(shè)計(jì)。只是SPC采用的是Subscription Model,而S4結(jié)合了MapReduce和Actors Model。而簡(jiǎn)單的編程接口;高可用+高可擴(kuò)展;盡力避免Disk IO,盡量使用Local Memory,以便減少處理latency;使用去中心化和對(duì)稱架構(gòu),所有的節(jié)點(diǎn)的責(zé)任相同,方便部署和維護(hù);功能可插拔,使得平臺(tái)通用化的同時(shí),做到可以定制化以及設(shè)計(jì)要科學(xué)、易用和靈活是Yahoo!S4的設(shè)計(jì)目標(biāo)。

而Storm作為Twitter公司實(shí)時(shí)數(shù)據(jù)處理平臺(tái)也受到廣泛關(guān)注(Twitter也在9月19日圣路易斯市舉行的Strange Loop會(huì)議上公布其源代碼)。Storm的發(fā)展勢(shì)頭相當(dāng)強(qiáng)勁,Twitter開發(fā)的相應(yīng)工具已使其功能變得更加強(qiáng)大。

Storm的作用主要在以下三個(gè)領(lǐng)域:信息流處理(Stream processing)Storm可用來實(shí)時(shí)處理新數(shù)據(jù)和更新數(shù)據(jù)庫(kù),兼具容錯(cuò)性和可擴(kuò)展性;連續(xù)計(jì)算(Continuous computation)Storm可進(jìn)行連續(xù)查詢并把結(jié)果即時(shí)反饋給客戶端。比如把Twitter上的熱門話題發(fā)送到瀏覽器中;分布式遠(yuǎn)程程序調(diào)用(Distributed RPC)Storm可用來并行處理密集查詢。Storm的拓?fù)浣Y(jié)構(gòu)是一個(gè)等待調(diào)用信息的分布函數(shù),當(dāng)它收到一條調(diào)用信息后,會(huì)對(duì)查詢進(jìn)行計(jì)算,并返回查詢結(jié)果。舉個(gè)例子Distributed RPC可以做并行搜索或者處理大集合的數(shù)據(jù)。

 

[[54981]]

另一個(gè)知名的分布式流式系統(tǒng)是Brandeis University、Brown University和MIT合作開發(fā)的Borealis,Borealis由之前的流式系統(tǒng)Aurora、Medusa演化而來。目前Borealis系統(tǒng)已經(jīng)停止維護(hù),***的Release版本停止在2008年。

Borealis具有豐富的論文、完整的用戶/開發(fā)者文檔,系由是C++實(shí)現(xiàn)并運(yùn)行于x86-based Linux平臺(tái)。同時(shí)系統(tǒng)是開源的,且使用了較多的第三方開源組件,包括用于查詢語言翻譯的ANTLR、C++的網(wǎng)絡(luò)編程框架庫(kù)NMSTL等。

Borealis系統(tǒng)的流式模型和其他流式系統(tǒng)基本一致:接受多元的數(shù)據(jù)流和輸出,為了容錯(cuò),采用確定性計(jì)算,對(duì)于容錯(cuò)性要求高的系統(tǒng),會(huì)對(duì)輸入流使用算子進(jìn)行定序。

隨著大量實(shí)時(shí)計(jì)算需求的增加,分布式流式計(jì)算將會(huì)成為分布式計(jì)算的下一個(gè)主要研究重點(diǎn),將會(huì)成為類似Hadoop這類MapReduce框架的有力補(bǔ)充。

 

責(zé)任編輯:鳶瑋 來源: CSDN
相關(guān)推薦

2017-08-31 16:36:26

2015-06-15 09:45:36

聯(lián)想互聯(lián)網(wǎng)

2017-11-21 14:14:04

PHPnode.js圖片訪問

2017-08-09 13:30:21

大數(shù)據(jù)Apache Kafk實(shí)時(shí)處理

2013-07-23 15:58:30

技術(shù)

2019-09-04 09:31:40

日志Flink監(jiān)控

2017-02-14 15:37:32

KappaLambda

2014-12-15 09:32:17

StormSpark

2025-03-04 08:00:00

JavaiTextPDFPDF

2022-10-14 14:48:57

2021-10-28 16:37:31

邊緣計(jì)算醫(yī)療保健云技術(shù)

2013-04-27 12:18:58

大數(shù)據(jù)全球技術(shù)峰會(huì)京東

2017-11-03 15:05:56

Storm數(shù)據(jù)處理服務(wù)器

2023-08-18 09:29:59

Java數(shù)據(jù)流

2016-03-23 18:04:08

中國(guó)網(wǎng)

2016-11-08 12:49:27

大數(shù)據(jù)分布式系統(tǒng)Druid-IO

2020-09-18 10:30:23

5G

2013-04-27 10:32:51

大數(shù)據(jù)全球技術(shù)峰會(huì)大數(shù)據(jù)流計(jì)算

2014-03-25 12:04:37

IBM論壇云計(jì)算商業(yè)模式

2012-07-26 13:48:32

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)