自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

大數(shù)據(jù)管道技術(shù) 推動(dòng)Hadoop架構(gòu)與開(kāi)發(fā)模式的變革

大數(shù)據(jù) Hadoop
快速數(shù)據(jù)分析和實(shí)時(shí)處理的興起,可能會(huì)給大數(shù)據(jù)管道帶來(lái)一定的變革,微服務(wù)架構(gòu)正在融入Hadoop領(lǐng)域。

快速數(shù)據(jù)分析和實(shí)時(shí)處理的興起,可能會(huì)給大數(shù)據(jù)管道帶來(lái)一定的變革,微服務(wù)架構(gòu)正在融入Hadoop領(lǐng)域。

Hadoop

最近幾年,開(kāi)源Hadoop風(fēng)格的數(shù)據(jù)開(kāi)發(fā)已經(jīng)獲得了很大的關(guān)注,但讓主流企業(yè)采用這種開(kāi)發(fā)模式依然用了很長(zhǎng)時(shí)間。它在處理大數(shù)據(jù)的海量性及多樣性上有很大的價(jià)值。但它也具有一定的復(fù)雜性,它會(huì)導(dǎo)致數(shù)據(jù)處理系統(tǒng)構(gòu)建方式的巨大變革。

而在數(shù)據(jù)處理的速度方面,就相對(duì)簡(jiǎn)單了。企業(yè)需要迅速處理數(shù)據(jù),速度是企業(yè)對(duì)大數(shù)據(jù)管道產(chǎn)生廣泛興趣的主要原因,企業(yè)需要從批處理的數(shù)據(jù)處理方式轉(zhuǎn)變?yōu)閷?shí)時(shí)處理和即時(shí)數(shù)據(jù)分析。

過(guò)去十年中,對(duì)計(jì)算性能提升的主要目的是為了更好地應(yīng)對(duì)復(fù)雜性。隨著開(kāi)發(fā)者社區(qū)的興起,容器和Docker,微服務(wù)已經(jīng)可以提供松散耦合的,輕便的面向服務(wù)架構(gòu)來(lái)應(yīng)對(duì)各種復(fù)現(xiàn)性需求。并在數(shù)據(jù)一側(cè)的開(kāi)發(fā)上也投入了一定的努力,這意味著Hadoop上的編程模式可能會(huì)產(chǎn)生一些變化,而在Hadoop 2上,這些變動(dòng)可能更大,因?yàn)樵贖adoop 2上可以開(kāi)發(fā)更廣泛的分布式Hadoop附加組件。

容器的變革

如今,我們看到了實(shí)時(shí)分析應(yīng)用程序所帶來(lái)的影響,它結(jié)合了不同的框架部分。 Spark,Kafka和Cassandra是其中最常見(jiàn)的,它們和其他技術(shù)一起組成了流式大數(shù)據(jù)管道。容器和微服務(wù)都更適合于整體架構(gòu),更為重要的是,讓這些框架能夠協(xié)同工作不是一件容易的事。不僅如此,在他們一同工作的同時(shí),還需要對(duì)其進(jìn)行調(diào)整和更新,以實(shí)現(xiàn)更好的融合。

在大數(shù)據(jù)架構(gòu)中應(yīng)用容器和微服務(wù)的舉措正變得越來(lái)越普遍。BlueData最近在其EPIC平臺(tái)上新增了用于管理Docker容器的應(yīng)用,這些容器用于創(chuàng)建Hadoop和Spark集群。 MapR編程架構(gòu)是將微服務(wù)技術(shù)應(yīng)用于流和實(shí)時(shí)分析應(yīng)用程序架構(gòu)的先驅(qū)。Pachyderm構(gòu)造了一個(gè)容器化的處理引擎,在最近的Strata + Hadoop 2016 大會(huì)上該技術(shù)獨(dú)占鰲頭。

Mesosphere也在密切關(guān)注著相關(guān)技術(shù)的發(fā)展,它已經(jīng)建立了一個(gè)系統(tǒng),用于運(yùn)行容器和數(shù)據(jù)服務(wù)。該公司的產(chǎn)品是構(gòu)建在一個(gè)開(kāi)源的分布式系統(tǒng)內(nèi)核或群集管理器Apache Mesos上。它已經(jīng)被Airbnb,蘋(píng)果,Twitter和其他一些公司所采用。

數(shù)據(jù)點(diǎn)

也許對(duì)于Spark和Mesos容器服務(wù)在一起出現(xiàn),我們并不用感到十分驚訝,因?yàn)镾park的創(chuàng)始人Matei Zaharia與Mesos的研發(fā)也有著一定的淵源。 事實(shí)上,今年Mesosphere開(kāi)展的針對(duì)500名Mesos用戶的研究發(fā)現(xiàn),43%的受訪者在Mesos上使用Spark;32%的受訪者在Mesos平臺(tái)上使用Kafka,24%的用戶則使用Cassandra。

另一個(gè)專注于數(shù)據(jù)分析和微服務(wù)的新興公司是Lightbend,該公司的創(chuàng)始人包括Scala(Spark和Akka開(kāi)發(fā)所使用語(yǔ)言)的***,Akka是Apache Flink中分布式通信的核心,也是大數(shù)據(jù)管道的另一個(gè)新興的元素。

Lightbend發(fā)現(xiàn)了用于快速實(shí)時(shí)數(shù)據(jù)處理應(yīng)用的容器和框架之間的重大關(guān)聯(lián)。 今年早些時(shí)候,公司進(jìn)行的一項(xiàng)調(diào)查顯示,在Java虛擬機(jī)上運(yùn)行應(yīng)用程序的2100個(gè)開(kāi)發(fā)人員中,34%的受訪者進(jìn)行實(shí)時(shí)大部分?jǐn)?shù)據(jù)處理,22%的受訪者進(jìn)行等量的批處理和實(shí)時(shí)處理。

在生產(chǎn)環(huán)境中使用了微服務(wù)的受訪者中,30%的人使用了Kafka,21%的人運(yùn)行著Spark Streaming,這再次證實(shí)了新的數(shù)據(jù)處理框架與服務(wù)和容器方法之間的關(guān)聯(lián)。調(diào)查還發(fā)現(xiàn),這兩個(gè)框架都與另一個(gè)技術(shù)有關(guān),那就是Akka Streams,35%的受訪者使用了它。

對(duì)于數(shù)據(jù)微服務(wù),大多數(shù)新的基礎(chǔ)設(shè)施仍需要構(gòu)建。很多地方還需要一點(diǎn)點(diǎn)摸索,開(kāi)發(fā)團(tuán)隊(duì)需要找出哪些是正確的,哪些是錯(cuò)誤的。

此外,數(shù)據(jù)管理的明顯特征——“狀態(tài)”會(huì)話和數(shù)據(jù)持久性在微服務(wù)領(lǐng)域仍然有待完善。 對(duì)于Hadoop的開(kāi)發(fā)風(fēng)格來(lái)說(shuō),它要取代或替換專用的數(shù)據(jù)倉(cāng)庫(kù),使用更具活力的開(kāi)源系統(tǒng),這還有很長(zhǎng)的一段路要走。

責(zé)任編輯:趙寧寧 來(lái)源: TechTarget中國(guó)
相關(guān)推薦

2012-06-11 17:14:45

2016-04-05 10:59:59

Hadoop數(shù)據(jù)倉(cāng)庫(kù)架構(gòu)設(shè)計(jì)

2015-09-11 09:56:40

大數(shù)據(jù)教育

2013-11-28 16:08:14

大數(shù)據(jù)

2021-06-21 17:04:55

大數(shù)據(jù)Hadoop

2015-06-15 09:45:36

聯(lián)想互聯(lián)網(wǎng)

2014-10-15 11:07:43

HadoopLuigi

2016-11-23 21:16:49

大數(shù)據(jù)服務(wù)器

2015-04-24 11:20:15

Hadoop大數(shù)據(jù)架構(gòu)大數(shù)據(jù)

2015-11-05 11:56:56

SDN路由器技術(shù)路由器

2012-05-31 14:54:59

Hadoop大數(shù)據(jù)

2014-10-14 16:41:32

保險(xiǎn)IT技術(shù)

2009-07-08 17:16:51

2015-09-01 14:06:24

hadoop大數(shù)據(jù)趨勢(shì)

2015-08-31 11:20:08

大數(shù)據(jù)

2013-01-30 10:15:37

數(shù)據(jù)中心大數(shù)據(jù)

2013-11-11 16:34:36

2010-10-12 09:17:42

本地代碼Native CodeNative Clie

2011-09-02 10:59:02

大數(shù)據(jù)數(shù)據(jù)分析Hadoop

2021-07-13 22:41:49

區(qū)塊鏈數(shù)據(jù)安全
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)