自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

Storm的“翻版”:LinkedIn開源實時數(shù)據(jù)處理系統(tǒng)Samza

云計算
Storm和Samza極其相似,就像LinkedIn的Chris Riccomini在博客中闡述的那樣:“[Samza]可以幫助你構(gòu)建應(yīng)用,處理消息隊列——更新數(shù)據(jù)庫、計數(shù)以及其他的聚合、轉(zhuǎn)換消息等等?!倍@些其實都是很經(jīng)典的Storm應(yīng)用,只不過遷移到Samza之上了,Samza文檔也對比了這兩個系統(tǒng)。

近日,LinkedIn開源了一項技術(shù)——Samza,它是一個分布式流處理框架,專用于實時數(shù)據(jù)的處理,非常像Twitter的流處理系統(tǒng)Storm。不同的是Samza基于Hadoop,而且使用了LinkedIn自家的Kafka分布式消息系統(tǒng)。

Storm和Samza極其相似,就像LinkedIn的Chris Riccomini在博客中闡述的那樣:“[Samza]可以幫助你構(gòu)建應(yīng)用,處理消息隊列——更新數(shù)據(jù)庫、計數(shù)以及其他的聚合、轉(zhuǎn)換消息等等。”而這些其實都是很經(jīng)典的Storm應(yīng)用,只不過遷移到Samza之上了,Samza文檔也對比了這兩個系統(tǒng)。

上個月,Samza在各種論壇和社區(qū)上被廣泛傳播,其中有評論指出了Samza可能帶來的好處:

“跟很多人一樣,我們使用Storm來處理基于Kafka的流數(shù)據(jù),然后,再將這些數(shù)據(jù)發(fā)送到Hadoop上進(jìn)行離線分析。如果能把這三個環(huán)境整合到一起,就是一個很大的勝利。“

表面上看,這似乎是一個很不錯的想法。Apache軟件基金會的項目主頁,介紹了搭配使用Kafka和YARN的特點和優(yōu)勢。

高容錯: 如果服務(wù)器或者處理器出現(xiàn)故障,Samza將與YARN一起重新啟動流處理器。

高可靠性:Samza使用Kafka來保證所有消息都會按照寫入分區(qū)的順序進(jìn)行處理,絕對不會丟失任何消息。

可擴(kuò)展性:Samza在各個等級進(jìn)行分割和分布;Kafka提供一個有序、可分割、可重部署、高容錯的系統(tǒng);YARN提供了一個分布式環(huán)境供Samza容器來運行。

 

 

Samza的未來

至于Samza能不能像Storm一樣吸引大量的用戶和社區(qū)參與創(chuàng)新,還有待觀察。但是LinkedIn肯定會像Twitter開發(fā)Storm一樣來保證Samza的發(fā)展,而且后者在可用性上更具優(yōu)勢,畢竟運行在YARN或者M(jìn)esos框架上的Samza多了一些靈活性。

如果Samza未來有一個很好的前景,那么YARN也對得起Hadoop社區(qū)在過去18月的“炒作”,它不僅可以運行Storm,還可以運行Samza,甚至還可以運行其他很多的東西。這點很重要,畢竟很多軟件廠商都把大數(shù)據(jù)的“期貨”(甚至整個未來)壓在了Hadoop上,他們希望這個平臺能成為最后的贏家。

 

 

以往對MapReduce技術(shù)的依賴限制了Hadoop的適用性,但是YARN已經(jīng)開放了對大規(guī)模的流處理、交互式SQL查詢、機(jī)器學(xué)習(xí)和圖像處理負(fù)載的支持。隨著技術(shù)的日新月異,Hadoop成為支撐所有大數(shù)據(jù)應(yīng)用庫的想法變得更加現(xiàn)實。

責(zé)任編輯:王程程 來源: GigaOM
相關(guān)推薦

2019-08-21 09:48:37

數(shù)據(jù)處理

2016-12-13 11:56:09

大數(shù)據(jù)Hadoop計算框架

2016-11-01 09:15:43

大數(shù)據(jù)處理系統(tǒng)

2016-11-07 14:59:45

大數(shù)據(jù)數(shù)據(jù)處理系統(tǒng)

2013-02-21 16:27:07

開源開源流計算

2015-03-16 14:54:06

大數(shù)據(jù)流式大數(shù)據(jù)大數(shù)據(jù)處理

2012-12-06 10:59:51

大數(shù)據(jù)

2022-03-01 08:40:34

StormHadoop批處理

2015-06-16 16:49:25

AWSKinesis實時數(shù)據(jù)處理

2015-10-08 10:35:47

架構(gòu)師開源實時流處理

2022-11-09 10:26:48

智慧城市物聯(lián)網(wǎng)

2012-05-18 10:49:36

SAP大數(shù)據(jù)HANA

2023-10-11 14:37:21

工具開發(fā)

2023-11-21 08:11:48

Kafka的分區(qū)策略

2014-06-05 10:38:39

LinkedIn數(shù)據(jù)架構(gòu)

2023-09-26 09:29:08

Java數(shù)據(jù)

2021-07-29 08:00:00

開源數(shù)據(jù)技術(shù)

2014-01-17 09:38:07

Twitter開源流處理

2024-07-05 10:17:08

數(shù)據(jù)流系統(tǒng)CPU

2015-11-09 09:58:31

大數(shù)據(jù)Lambda架構(gòu)
點贊
收藏

51CTO技術(shù)棧公眾號