怎么去選消息隊(duì)列?Kafka vs. RabbitMQ
在上周,我們討論了使用消息隊(duì)列的好處。然后我們回顧了消息隊(duì)列產(chǎn)品的發(fā)展歷史。如今,在項(xiàng)目中需要使用消息隊(duì)列時(shí),Apache Kafka似乎是首選產(chǎn)品。然而,考慮到特定需求時(shí),它并不總是最佳選擇。
基于數(shù)據(jù)庫(kù)的隊(duì)列
讓我們?cè)俅问褂眯前涂说睦?。最重要的兩個(gè)需求是:
- 異步處理,使收銀員可以在不等待的情況下接下一個(gè)訂單。
- 持久性,以防出現(xiàn)問(wèn)題時(shí)錯(cuò)過(guò)顧客的訂單。
在這里,消息的順序不太重要,因?yàn)榭Х葞熃?jīng)常批量制作相同的飲料??蓴U(kuò)展性也不是很重要,因?yàn)殛?duì)列受限于每個(gè)星巴克門店。
星巴克的隊(duì)列可以在數(shù)據(jù)庫(kù)表中實(shí)現(xiàn)。下面的圖表顯示了它的工作原理:
當(dāng)收銀員接受一個(gè)訂單時(shí),在數(shù)據(jù)庫(kù)支持的隊(duì)列中創(chuàng)建一個(gè)新訂單。然后收銀員可以繼續(xù)接受另一個(gè)訂單,而咖啡師則會(huì)批量獲取新的訂單。一旦訂單完成,咖啡師會(huì)在數(shù)據(jù)庫(kù)中標(biāo)記為已完成。然后顧客可以在柜臺(tái)上取走他們的咖啡。
每天結(jié)束時(shí)可以運(yùn)行一個(gè)維護(hù)作業(yè)來(lái)刪除已完成的訂單(即“DONE”狀態(tài)的訂單)。
對(duì)于星巴克的用例,一個(gè)簡(jiǎn)單的數(shù)據(jù)庫(kù)隊(duì)列可以在不需要使用Kafka的情況下滿足需求。具有CRUD(創(chuàng)建-讀取-更新-刪除)操作的訂單表就可以勝任。
基于Redis的隊(duì)列
基于數(shù)據(jù)庫(kù)的消息隊(duì)列仍然需要開發(fā)工作來(lái)創(chuàng)建隊(duì)列表并從中讀取/寫入數(shù)據(jù)。對(duì)于預(yù)算有限且已經(jīng)使用Redis進(jìn)行緩存的小型創(chuàng)業(yè)公司,Redis也可以用作消息隊(duì)列。
有三種使用Redis作為消息隊(duì)列的方法:
- 發(fā)布/訂閱(Pub/Sub)
- 列表(List)
- 流(Stream)
下面的圖表顯示了它們的工作原理。
發(fā)布/訂閱是方便的,但有一些傳遞限制。消費(fèi)者訂閱一個(gè)鍵,當(dāng)生產(chǎn)者向相同的鍵發(fā)布數(shù)據(jù)時(shí),消費(fèi)者會(huì)接收數(shù)據(jù)。限制在于數(shù)據(jù)最多只會(huì)傳遞一次。如果消費(fèi)者關(guān)閉并且未接收到已發(fā)布的數(shù)據(jù),則該數(shù)據(jù)會(huì)丟失。此外,數(shù)據(jù)不會(huì)持久保存在磁盤上。如果Redis宕機(jī),所有發(fā)布/訂閱數(shù)據(jù)都會(huì)丟失。發(fā)布/訂閱適用于度量監(jiān)視等情況,其中可以接受一些數(shù)據(jù)丟失。
Redis中的列表數(shù)據(jù)結(jié)構(gòu)可以構(gòu)建FIFO(先進(jìn)先出)隊(duì)列。消費(fèi)者使用BLPOP以阻塞模式等待消息,因此應(yīng)該應(yīng)用超時(shí)。等待相同列表的消費(fèi)者形成一個(gè)消費(fèi)者組,每個(gè)消息只由一個(gè)消費(fèi)者消費(fèi)。作為Redis數(shù)據(jù)結(jié)構(gòu),列表可以持久保存在磁盤上。
流解決了上述兩種方法的限制。消費(fèi)者可以選擇從何處讀取消息 - 使用“$”表示新消息,“”表示特定消息ID,或使用“0-0”從開始讀取消息。
總而言之,基于數(shù)據(jù)庫(kù)和基于Redis的消息隊(duì)列易于維護(hù)。如果它們無(wú)法滿足我們的需求,專用的消息隊(duì)列產(chǎn)品更好。接下來(lái)我們將比較兩個(gè)流行的選項(xiàng)。
RabbitMQ vs. Kafka
對(duì)于需要可靠、可擴(kuò)展和可維護(hù)的系統(tǒng)的大公司,在以下方面評(píng)估消息隊(duì)列產(chǎn)品:
- 功能
- 性能
- 可擴(kuò)展性
- 生態(tài)系統(tǒng)
下面的圖表比較了兩種典型的消息隊(duì)列產(chǎn)品:RabbitMQ和Kafka。
工作原理
RabbitMQ的工作方式類似于消息中間件 - 它將消息推送給消費(fèi)者,然后在確認(rèn)后將其刪除。這避免了消息積壓,這是RabbitMQ認(rèn)為有問(wèn)題的。
Kafka最初是為大規(guī)模日志處理而構(gòu)建的。它會(huì)保留消息直到過(guò)期,并允許消費(fèi)者以自己的速度拉取消息。
語(yǔ)言和API
RabbitMQ是用Erlang編寫的,這使得修改核心代碼變得具有挑戰(zhàn)性。然而,它提供了非常豐富的客戶端API和庫(kù)支持。
Kafka使用Scala和Java,但也有針對(duì)流行語(yǔ)言(如Python、Ruby 和Node.js)的客戶端庫(kù)和API。
性能和可擴(kuò)展性
RabbitMQ每秒可以處理數(shù)萬(wàn)條消息。即使在更好的硬件上,吞吐量也不會(huì)大幅提高。
Kafka可以處理數(shù)百萬(wàn)條每秒的消息,并具有很高的可擴(kuò)展性。
生態(tài)系統(tǒng)
許多現(xiàn)代大數(shù)據(jù)和流式應(yīng)用程序默認(rèn)集成了Kafka。這使得它非常適合這些用例。
消息隊(duì)列用例
既然我們已經(jīng)介紹了不同消息隊(duì)列的特點(diǎn),讓我們看一些如何選擇正確產(chǎn)品的示例。
日志處理與分析
對(duì)于具有購(gòu)物車、訂單和付款等服務(wù)的電子商務(wù)網(wǎng)站,我們需要分析日志以調(diào)查顧客訂單。
下面的圖表顯示了使用“ELK”堆棧的典型架構(gòu):
- ElasticSearch - 為全文搜索索引日志
- LogStash - 日志收集代理
- Kibana - 用于搜索和可視化日志的用戶界面
- Kafka - 分布式消息隊(duì)列
圖片