自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<kbd id="xns3i"></kbd>

<optgroup id="xns3i"><ruby id="xns3i"></ruby></optgroup>

<sup id="xns3i"><rt id="xns3i"></rt></sup>

<p id="xns3i"><li id="xns3i"><pre id="xns3i"></pre></li></p>

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項目管理免費題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設(shè)置退出

架構(gòu)師的選擇，Pulsar還是Kafka？

作者：聞數(shù)起舞 2020-11-14 11:23:18

開發(fā) 開發(fā)工具 Kafka

在本文中，我將重點介紹Pulsar的優(yōu)勢，并為您提供一些理由，使您對比Kafka來考慮它。

介紹

最近，我一直在研究Pulsar及其與Kafka的比較。快速搜索將顯示兩個最著名的開源消息傳遞系統(tǒng)之間存在當(dāng)前的"戰(zhàn)爭"。

作為Kafka的用戶，我確實對Kafka的某些問題感到困惑，并且我對Pulsar感到非常失望。所以最后，我設(shè)法花了一些時間進(jìn)行研究，并且做了很多研究。在本文中，我將重點介紹Pulsar的優(yōu)勢，并為您提供一些理由，使您對比Kafka來考慮它。但是，請在產(chǎn)品使用，支持，社區(qū)，文檔等方面明確一點;Kafka顯然超過了Pulsar，并且只有在本文中討論的大多數(shù)優(yōu)點都適合您的用例的情況下，才考慮使用Pulsar。讓我們開始!

Kafka基礎(chǔ)知識

Kafka是消息傳遞系統(tǒng)之王。它由LinkedIn于2011年創(chuàng)建，并在Confluent的支持下得到了廣泛的傳播。Confluent已向開源社區(qū)發(fā)布了許多新功能和附加組件，例如用于模式演化的Schema Registry，用于從其他數(shù)據(jù)源輕松流式傳輸?shù)腒afka Connect等。數(shù)據(jù)庫到Kafka，Kafka Streams進(jìn)行分布式流處理，最近使用KSQL對Kafka主題執(zhí)行類似SQL的查詢等等。它還具有用于許多系統(tǒng)的許多連接器，有關(guān)更多詳細(xì)信息，請查看Confluent Platform。

Kafka快速，易于安裝，非常受歡迎，可用于廣泛的范圍或用例。從開發(fā)人員的角度來看，盡管Apache Kafka一直很友好，但在操作上卻是一團(tuán)糟。因此，讓我們回顧一下Kafka的一些痛點。

架構(gòu)師的選擇，Pulsar還是Kafka？

> Kafka example. Source: https://talks.rmoff.net/pZC6Za/slides

Kafka的問題

擴(kuò)展Kafka十分棘手，這是由于代理還存儲數(shù)據(jù)的耦合體系結(jié)構(gòu)所致。剝離另一個代理意味著它必須復(fù)制主題分區(qū)和副本，這非常耗時。
沒有與租戶完全隔離的本地多租戶。
存儲可能會變得非常昂貴，盡管可以長時間存儲數(shù)據(jù)，但是由于成本問題，很少使用它。
萬一副本不同步，有可能丟失消息。
必須提前計劃和計算代理，主題，分區(qū)和副本的數(shù)量(以適應(yīng)計劃的未來使用量增長)，以避免擴(kuò)展問題，這非常困難。
如果僅需要消息傳遞系統(tǒng)，則使用偏移量可能會很復(fù)雜。
集群重新平衡會影響相連的生產(chǎn)者和消費者的性能。
MirrorMaker Geo復(fù)制機(jī)制存在問題。像Uber這樣的公司已經(jīng)創(chuàng)建了自己的解決方案來克服這些問題。

如您所見，大多數(shù)問題與操作方面有關(guān)。盡管安裝起來相對容易，但Kafka難以管理和調(diào)整。而且，它還沒有像它可能的那樣靈活和有彈性。

Pulsar基礎(chǔ)知識

Pulsar由Yahoo在2013年創(chuàng)建，并于2016年捐贈給Apache基金會。Pulsar現(xiàn)在是Apache的頂級項目。Yahoo，Verizon，Twitter等公司在生產(chǎn)中使用它來處理數(shù)百萬條消息。它具有許多功能，并且非常靈活。它聲稱比Kafka更快，因此運行成本更低。它旨在解決Kafka的大部分難題，使其更易于擴(kuò)展。

Pulsar非常靈活; 它可以像Kafka這樣的分布式日志，也可以像RabbitMQ這樣的純消息傳遞系統(tǒng)。它具有多種類型的訂閱，幾種交付保證，保留策略以及幾種處理模式演變的方法。它還有很多功能……

架構(gòu)師的選擇，Pulsar還是Kafka？

> Pulsar architecture: https://pulsar.apache.org/docs/en/concepts-architecture-overview/

Pulsar的特性

由于內(nèi)置了多租戶，因此不同的團(tuán)隊可以使用相同的集群并將其隔離。這解決了許多管理難題。它支持隔離，身份驗證，授權(quán)和配額。
多層體系結(jié)構(gòu)：Pulsar將所有主題數(shù)據(jù)存儲在由Apache BookKeeper支持的專業(yè)數(shù)據(jù)層中，作為數(shù)據(jù)分類帳。存儲和消息傳遞的分離解決了擴(kuò)展，重新平衡和維護(hù)集群的許多問題。它還提高了可靠性，幾乎不可能丟失數(shù)據(jù)。另外，在讀取數(shù)據(jù)時，可以直接連接到Bookeeper，而不會影響實時攝取。例如，可以使用Presto對主題執(zhí)行SQL查詢，類似于KSQL，但請放心，這不會影響實時數(shù)據(jù)處理。
虛擬主題。由于采用n層體系結(jié)構(gòu)，因此對主題的數(shù)量沒有限制，主題及其存儲是分離的。還可以創(chuàng)建非持久性主題。
N層存儲。 Kafka的一個問題是，存儲可能變得昂貴。因此，它很少用于存儲"冷"數(shù)據(jù)，并且消息經(jīng)常被刪除。并且仍然向客戶展示透明視圖; 客戶端可以從時間開始讀取，就像所有消息都存在于日志中一樣。
Pulsar函數(shù)。易于部署，輕量級計算過程，對開發(fā)人員友好的API，無需運行自己的流處理引擎(如Kafka)。
安全性：它具有內(nèi)置的代理，多租戶安全性，可插入身份驗證等等。
快速重新平衡。分區(qū)分為易于重新平衡的段。
服務(wù)器端重復(fù)數(shù)據(jù)刪除和無效字段。無需在客戶端中執(zhí)行此操作，也可以在壓縮期間執(zhí)行重復(fù)數(shù)據(jù)刪除。
內(nèi)置架構(gòu)注冊表。支持多種策略，非常易于使用。
地理復(fù)制和內(nèi)置發(fā)現(xiàn)。將群集復(fù)制到多個區(qū)域非常容易。
集成的負(fù)載均衡器和Prometheus指標(biāo)。
多重集成：Kafka，RabbitMQ等。
支持許多編程語言，例如GoLang，Java，Scala，Node，Python…
客戶端不需要知道分片和數(shù)據(jù)分區(qū)，這是在服務(wù)器端透明進(jìn)行的。

架構(gòu)師的選擇，Pulsar還是Kafka？

> List of features: https://pulsar.apache.org/

如您所見，Pulsar具有許多有趣的功能。

Pulsar 動手

開始使用Pulsar非常容易。確保已安裝JDK!

下載Pulsar并解壓縮：

$ wget https://archive.apache.org/dist/pulsar/pulsar-2.6.1/apache-pulsar-2.6.1-bin.tar.gz

下載連接器(可選)：

$ wget https://archive.apache.org/dist/pulsar/pulsar-2.6.1/connectors/{connector}-2.6.1.nar

下載nar文件后，將文件復(fù)制到pulsar目錄中的connectors目錄
啟動Pulsar!

$ bin/pulsar standalone

Pulsar提供了一個稱為pulsar-client的CLI工具，我們可以使用它與集群進(jìn)行交互。

產(chǎn)生消息：

$ bin/pulsar-client produce my-topic --messages "hello-pulsar"

閱讀消息：

$ bin/pulsar-client consume my-topic -s "first-subscription"

Akka流示例

作為一個客戶示例，讓我們在Akka上使用Pulsar4s!

首先，我們需要創(chuàng)建一個Source來使用數(shù)據(jù)流，所需要的只是一個函數(shù)，該函數(shù)將按需創(chuàng)建使用者并查找消息ID：

val topic = Topic("persistent://standalone/mytopic") 
val consumerFn = () => client.consumer(ConsumerConfig(topic, subscription))

然后，我們傳遞consumerFn函數(shù)來創(chuàng)建源：

import com.sksamuel.pulsar4s.akka.streams._ 
val pulsarSource = source(consumerFn, Some(MessageId.earliest))

Akka源的物化值是Control的一個實例，該對象提供了一種"關(guān)閉"方法，可用于停止使用消息。現(xiàn)在，我們可以像往常一樣使用Akka Streams處理數(shù)據(jù)。

要創(chuàng)建一個接收器：

val topic = Topic("persistent://standalone/mytopic") 
val producerFn = () => client.producer(ProducerConfig(topic)) 
import com.sksamuel.pulsar4s.akka.streams._ 
val pulsarSink = sink(producerFn)

完整示例摘自Pulsar4s：

Pulsar函數(shù)示例

Pulsar函數(shù)處理來自一個或多個主題的消息，對其進(jìn)行轉(zhuǎn)換并將結(jié)果輸出到另一個主題：

架構(gòu)師的選擇，Pulsar還是Kafka？

> Pulsar Functions. Source: https://pulsar.apache.org/docs/en/functions-overview/

可以在兩個接口之間進(jìn)行選擇以編寫函數(shù)：

語言本機(jī)界面：不需要特定于Pulsar的庫或特殊的依賴項。無法訪問上下文。僅支持Java和Python。
Pulsar Function SDK：可用于Java / Python / Go，并提供更多功能，包括訪問上下文對象。

使用語言本機(jī)接口非常容易，您只需編寫一個簡單的函數(shù)即可轉(zhuǎn)換消息：

def process(input): 
return "{}!".format(input)

用Python編寫的這個簡單函數(shù)只是向所有傳入的字符串添加一個感嘆號，并將結(jié)果字符串發(fā)布到主題。

要使用SDK，您需要導(dǎo)入依賴項，例如在Go中，我們將編寫：

package main 
import ( 
"context" 
"fmt" 
"github.com/apache/pulsar/pulsar-function-go/pf" 
) 
 
func HandleRequest(ctx context.Context, in []byte) error { 
fmt.Println(string(in) + "!") 
return nil 
} 
 
func main() { 
pf.Start(HandleRequest) 
}

要發(fā)布無服務(wù)器功能并將其部署到集群，我們使用pulsar-admin CLI，如果使用Python，我們將使用：

$ bin/pulsar-admin functions create \ 
--py ~/router.py \ 
--classname router.RoutingFunction \ 
--tenant public \ 
--namespace default \ 
--name route-fruit-veg \ 
--inputs persistent://public/default/basket-items

Pulsar Functions的一個重要功能是您可以在發(fā)布該函數(shù)時設(shè)置交付保證：

$ bin/pulsar-admin functions create \ 
--name my-effectively-once-function \ 
--processing-guarantees EFFECTIVELY_ONCE

有以下選擇：

架構(gòu)師的選擇，Pulsar還是Kafka？

Pulsar的優(yōu)勢

讓我們回顧一下與Kafka相比的主要優(yōu)勢：

更多功能：Pulsar函數(shù)，多租戶，架構(gòu)注冊表，n層存儲，多種使用模式和持久性模式等。
更大的靈活性：3種訂閱類型(獨占，共享和故障轉(zhuǎn)移)，您可以在一個訂閱上收聽多個主題。持久性選項：非持久(快速)，持久，壓縮(每個消息僅最后一個鍵)?？梢赃x擇交付保證，它具有服務(wù)器端重復(fù)數(shù)據(jù)刪除和無效字樣。許多保留政策和TTL。
無需提前定義擴(kuò)展需求。
支持排隊和流媒體。因此它可以像RabbitMQ或Kafka。
由于存儲與代理分離，因此擴(kuò)展性更好。重新平衡更快，更可靠。
易于操作：得益于去耦和n層存儲。管理員REST API也很棒。
與Presto的SQL集成，可直接查詢存儲而不會影響代理。
借助n層自動存儲選項，可以更便宜地存儲。
更快：許多基準(zhǔn)測試在各種情況下都表現(xiàn)出更好的性能。 Pulsar聲稱具有較低的延遲和更好的擴(kuò)展功能。但是，這正受到Confluent的挑戰(zhàn)，因此，請帶著鹽味做，并自己制定基準(zhǔn)。
Pulsar Functions將無服務(wù)器計算帶到您的消息傳遞平臺。
集成架構(gòu)注冊表支持輕松的架構(gòu)演變
集成的負(fù)載平衡器和Prometheus指標(biāo)。
地理復(fù)制效果更好，更易于設(shè)置。Pulsar還內(nèi)置了發(fā)現(xiàn)能力。
可以創(chuàng)建的主題數(shù)量沒有限制。
與Kafka兼容，易于集成。

Pulsar的問題

Pulsar并不完美，Kafka之所以流行是有原因的，它做一件事并且做得很好。 Pulsar試圖解決太多領(lǐng)域，但沒有超越任何一個領(lǐng)域。讓我們總結(jié)一下Pulsar的一些問題：

受歡迎程度：Pulsar不那么受歡迎。它缺乏支持，文檔和實際使用情況。對于大型組織而言，這是一個主要問題。
由于n層體系結(jié)構(gòu)，它需要更多組件：Bookkeeper。
在平臺內(nèi)沒有對流應(yīng)用程序的適當(dāng)支持。 Pulsar函數(shù)與Kafka Streams不同，它們更簡單，并且不用于實時流處理。您無法進(jìn)行有狀態(tài)處理。
與Kafka相比，插件和客戶端更少。此外，掌握Pulsar技能的人較少，因此需要在內(nèi)部學(xué)習(xí)。
它在云中的支持較少。 Confluent具有托管云產(chǎn)品。

Confluent在Pulsar和Kafka之間進(jìn)行了比較，可以在其中進(jìn)行更多的詳細(xì)說明。該博客還回答了有關(guān)Kafka與Pulsar的一些問題，但請注意，這些問題可能有偏見。

Pulsar使用案例

Pulsar可用于廣泛的用例：

發(fā)布/訂閱隊列消息傳遞
分布式日志
事件源壁架，用于永久性事件存儲
微服務(wù)
SQL分析
無服務(wù)器功能

什么時候應(yīng)該考慮Pulsar

需要像RabbitMQ這樣的隊列，也需要像Kafka這樣的流處理程序。
需要簡單的地理復(fù)制。
多租戶是必須具備的，并且想確保每個團(tuán)隊的訪問權(quán)限。
需要將所有消息保留很長時間，并且不想將其卸載到另一個存儲中。
性能對你至關(guān)重要，基準(zhǔn)測試表明Pulsar提供了更低的延遲和更高的吞吐量。
在本地運行，沒有設(shè)置Kafka的經(jīng)驗，但具有Hadoop經(jīng)驗。

請注意，如果在云中，請考慮基于云的解決方案。云提供商擁有涵蓋某些用例的不同服務(wù)。例如，對于隊列消息傳遞，云提供商提供了許多服務(wù)，例如Google pub / sub。對于分布式日志，有Confluent云或AWS Kinesis。云提供商還提供了非常好的安全性。Pulsar的優(yōu)勢在于可以在一個平臺上提供許多功能。一些團(tuán)隊可能將其用作微服務(wù)的消息傳遞系統(tǒng)，而另一些團(tuán)隊則將其用作數(shù)據(jù)處理的分布式日志。

結(jié)論

我是Kafka的忠實粉絲，這就是為什么我對Pulsar如此感興趣。競爭是好的，它驅(qū)動創(chuàng)新。

Kafka是一種成熟，富有彈性且經(jīng)過戰(zhàn)斗考驗的產(chǎn)品，在世界范圍內(nèi)獲得了巨大成功。沒有它，我無法想象任何公司。但是，我確實看到Kafka成為其自身成功的受害者，巨大的增長減慢了功能開發(fā)的速度，因為它們需要支持這么多大型公司。刪除ZooKeeper依賴項等重要功能花費的時間太長。這為諸如Pulsar等工具蓬勃發(fā)展創(chuàng)造了空間。解決Kafka的一些問題并添加更多功能。

但是，Pulsar仍然很不成熟，在投入生產(chǎn)之前，我會格外小心。在將Pulsar納入你的組織之前，進(jìn)行分析，進(jìn)行基準(zhǔn)測試，研究并編寫概念證明。從小處著手，在從Kafka遷移之前進(jìn)行概念驗證，并在決定進(jìn)行完全遷移之前先評估影響。

責(zé)任編輯：趙寧寧來源：今日頭條

Pulsar Kafka 架構(gòu)師

51CTO技術(shù)棧公眾號

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營

<style id="7yw31"></style>