自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<legend id="oyj6p"><abbr id="oyj6p"></abbr></legend>

<style id="oyj6p"></style>

<sub id="oyj6p"><p id="oyj6p"></p></sub>

<sub id="oyj6p"><input id="oyj6p"></input></sub>

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設(shè)置退出

終于弄明白了 RocketMQ 的存儲模型

作者：勇哥 2022-12-31 08:17:02

存儲存儲架構(gòu)

充分考慮業(yè)務(wù)的查詢場景，支持消息 key ，消息 offsetMsgId 查詢消息數(shù)據(jù)。也支持消費(fèi)者通過 tag 來訂閱主題下的不同消息，提升了消費(fèi)者的靈活性。

RocketMQ 優(yōu)異的性能表現(xiàn)，必然繞不開其優(yōu)秀的存儲模型。

這篇文章，筆者按照自己的理解 , 嘗試分析 RocketMQ 的存儲模型，希望對大家有所啟發(fā)。

一、整體概覽

首先溫習(xí)下 RocketMQ 架構(gòu)。

整體架構(gòu)中包含四種角色 :

Producer ：消息發(fā)布的角色，Producer 通過 MQ 的負(fù)載均衡模塊選擇相應(yīng)的 Broker 集群隊(duì)列進(jìn)行消息投遞，投遞的過程支持快速失敗并且低延遲。
Consumer ：消息消費(fèi)的角色，支持以 push 推，pull 拉兩種模式對消息進(jìn)行消費(fèi)。
NameServer ：名字服務(wù)是一個非常簡單的 Topic 路由注冊中心，其角色類似 Dubbo 中的 zookeeper ，支持 Broker 的動態(tài)注冊與發(fā)現(xiàn)。
BrokerServer ：Broker 主要負(fù)責(zé)消息的存儲、投遞和查詢以及服務(wù)高可用保證。

本文的重點(diǎn)在于分析 BrokerServer 的消息存儲模型。我們先進(jìn)入 broker 的文件存儲目錄。

消息存儲和下面三個文件關(guān)系非常緊密：

數(shù)據(jù)文件 commitlog
消息主體以及元數(shù)據(jù)的存儲主體；
消費(fèi)文件 consumequeue
消息消費(fèi)隊(duì)列，引入的目的主要是提高消息消費(fèi)的性能；
索引文件 indexfile
索引文件，提供了一種可以通過 key 或時間區(qū)間來查詢消息。

RocketMQ 采用的是混合型的存儲結(jié)構(gòu)，Broker 單個實(shí)例下所有的隊(duì)列共用一個數(shù)據(jù)文件（commitlog）來存儲。

生產(chǎn)者發(fā)送消息至 Broker 端，然后 Broker 端使用同步或者異步的方式對消息刷盤持久化，保存至 commitlog 文件中。只要消息被刷盤持久化至磁盤文件 commitlog 中，那么生產(chǎn)者發(fā)送的消息就不會丟失。

Broker 端的后臺服務(wù)線程會不停地分發(fā)請求并異步構(gòu)建 consumequeue（消費(fèi)文件）和 indexfile（索引文件）。

二、數(shù)據(jù)文件

RocketMQ 的消息數(shù)據(jù)都會寫入到數(shù)據(jù)文件中，我們稱之為 commitlog 。

所有的消息都會順序?qū)懭霐?shù)據(jù)文件，當(dāng)文件寫滿了，會寫入下一個文件。

如上圖所示，單個文件大小默認(rèn) 1G , 文件名長度為 20 位，左邊補(bǔ)零，剩余為起始偏移量，比如 00000000000000000000 代表了第一個文件，起始偏移量為 0 ，文件大小為1 G = 1073741824。

當(dāng)?shù)谝粋€文件寫滿了，第二個文件為 00000000001073741824，起始偏移量為 1073741824，以此類推。

從上圖中，我們可以看到消息是一條一條寫入到文件，每條消息的格式是固定的。

這樣設(shè)計(jì)有三點(diǎn)優(yōu)勢：

順序?qū)?/li>

磁盤的存取速度相對內(nèi)存來講并不快，一次磁盤 IO 的耗時主要取決于：尋道時間和盤片旋轉(zhuǎn)時間，提高磁盤 IO 性能最有效的方法就是：減少隨機(jī) IO，增加順序 IO 。

對比隨機(jī)和順序讀寫在內(nèi)存和磁盤中的表現(xiàn)

《 The Pathologies of Big Data 》這篇文章指出：內(nèi)存隨機(jī)讀寫的速度遠(yuǎn)遠(yuǎn)低于磁盤順序讀寫的速度。磁盤順序?qū)懭胨俣瓤梢赃_(dá)到幾百兆/s，而隨機(jī)寫入速度只有幾百 KB /s，相差上千倍。

2.快速定位

因?yàn)橄⑹且粭l一條寫入到 commitlog 文件，寫入完成后，我們可以得到這條消息的物理偏移量。

每條消息的物理偏移量是唯一的， commitlog 文件名是遞增的，可以根據(jù)消息的物理偏移量通過二分查找，定位消息位于那個文件中，并獲取到消息實(shí)體數(shù)據(jù)。

3.通過消息 offsetMsgId 查詢消息數(shù)據(jù)

消息 offsetMsgId 是由 Broker 服務(wù)端在寫入消息時生成的，該消息編號包含兩個部分：

Broker 服務(wù)端 ip + port 8個字節(jié)；
commitlog 物理偏移量 8個字節(jié) 。

我們可以通過消息 offsetMsgId ，定位到 Broker 的 ip 地址 + 端口，傳遞物理偏移量參數(shù) ，即可定位該消息實(shí)體數(shù)據(jù)。

三、消費(fèi)文件

在介紹 consumequeue 文件之前，我們先溫習(xí)下消息隊(duì)列的傳輸模型-發(fā)布訂閱模型 ，這也是 RocketMQ 當(dāng)前的傳輸模型。

發(fā)布訂閱模型具有如下特點(diǎn)：

消費(fèi)獨(dú)立：相比隊(duì)列模型的匿名消費(fèi)方式，發(fā)布訂閱模型中消費(fèi)方都會具備的身份，一般叫做訂閱組（訂閱關(guān)系），不同訂閱組之間相互獨(dú)立不會相互影響。
一對多通信：基于獨(dú)立身份的設(shè)計(jì)，同一個主題內(nèi)的消息可以被多個訂閱組處理，每個訂閱組都可以拿到全量消息。因此發(fā)布訂閱模型可以實(shí)現(xiàn)一對多通信。

因此，rocketmq 的文件設(shè)計(jì)必須滿足發(fā)布訂閱模型的需求。

那么僅僅 commitlog 文件是否可以滿足需求嗎？

假如有一個 consumerGroup 消費(fèi)者，訂閱主題 my-mac-topic ，因?yàn)?commitlog 包含所有的消息數(shù)據(jù)，查詢該主題下的消息數(shù)據(jù)，需要遍歷數(shù)據(jù)文件 commitlog , 這樣的效率是極其低下的。

進(jìn)入 rocketmq 存儲目錄，顯示見下圖：

消費(fèi)文件按照主題存儲，每個主題下有不同的隊(duì)列，圖中 my-mac-topic 有 16 個隊(duì)列 ;
每個隊(duì)列目錄下，存儲 consumequeue 文件，每個 consumequeue 文件也是順序?qū)懭耄瑪?shù)據(jù)格式見下圖。

每個 consumequeue 包含 30 萬個條目，每個條目大小是 20 個字節(jié)，每個文件的大小是 30 萬 * 20 = 60萬字節(jié)，每個文件大小約5.72M 。和 commitlog 文件類似，consumequeue 文件的名稱也是以偏移量來命名的，可以通過消息的邏輯偏移量定位消息位于哪一個文件里。

消費(fèi)文件按照主題-隊(duì)列來保存，這種方式特別適配發(fā)布訂閱模型。

消費(fèi)者從 broker 獲取訂閱消息數(shù)據(jù)時，不用遍歷整個 commitlog 文件，只需要根據(jù)邏輯偏移量從 consumequeue 文件查詢消息偏移量 , 最后通過定位到 commitlog 文件，獲取真正的消息數(shù)據(jù)。

這樣就可以簡化消費(fèi)查詢邏輯，同時因?yàn)橥恢黝}下，消費(fèi)者可以訂閱不同的隊(duì)列或者 tag ，同時提高了系統(tǒng)的可擴(kuò)展性。

四、索引文件

每個消息在業(yè)務(wù)層面的唯一標(biāo)識碼要設(shè)置到 keys 字段，方便將來定位消息丟失問題。服務(wù)器會為每個消息創(chuàng)建索引（哈希索引），應(yīng)用可以通過 topic、key 來查詢這條消息內(nèi)容，以及消息被誰消費(fèi)。

由于是哈希索引，請務(wù)必保證key盡可能唯一，這樣可以避免潛在的哈希沖突。

//訂單Id   
String orderId = "1234567890";   
message.setKeys(orderId);

從開源的控制臺中根據(jù)主題和 key 查詢消息列表：

進(jìn)入索引文件目錄，如下圖所以：

索引文件名 fileName 是以創(chuàng)建時的時間戳命名的，固定的單個 IndexFile 文件大小約為 400 M 。

IndexFile 的文件邏輯結(jié)構(gòu)類似于 JDK 的 HashMap 的數(shù)組加鏈表結(jié)構(gòu)。

HashMap數(shù)據(jù)結(jié)構(gòu)

索引文件主要由 Header、Slot Table (默認(rèn) 500 萬個條目)、Index Linked List（默認(rèn)最多包含 2000萬個條目）三部分組成。

假如訂單系統(tǒng)發(fā)送兩條消息 A 和 B , 他們的 key 都是 "1234567890" ，我們依次存儲消息 A , 消息 B 。

因?yàn)檫@兩個消息的 key 的 hash 值相同，它們對應(yīng)的哈希槽（深黃色）也會相同，哈希槽會保存的最新的消息 B 的索引條目序號 , 序號值是 4 ，也就是第二個深綠色條目。

而消息 B 的索引條目信息的最后 4 個字節(jié)會保存上一條消息對應(yīng)的索引條目序號，索引序號值是 3 , 也就是消息 A 。

五、寫到最后

Databases are specializing – the “one size fits all” approach no longer applies ------ MongoDB設(shè)計(jì)哲學(xué)

RocketMQ 存儲模型設(shè)計(jì)得非常精巧，筆者覺得每種設(shè)計(jì)都有其底層思考，這里總結(jié)了三點(diǎn) ：

完美適配消息隊(duì)列發(fā)布訂閱模型；
數(shù)據(jù)文件，消費(fèi)文件，索引文件各司其職，同時以數(shù)據(jù)文件為核心，異步構(gòu)建消費(fèi)文件 + 索引文件這種模式非常容易擴(kuò)展到主從復(fù)制的架構(gòu)；
充分考慮業(yè)務(wù)的查詢場景，支持消息 key ，消息 offsetMsgId 查詢消息數(shù)據(jù)。也支持消費(fèi)者通過 tag 來訂閱主題下的不同消息，提升了消費(fèi)者的靈活性。

責(zé)任編輯：武曉燕來源：勇哥java實(shí)戰(zhàn)分享

場景數(shù)據(jù)消息

點(diǎn)贊

51CTO技術(shù)棧公眾號

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營

<s id="yhr4b"></s>

<center id="yhr4b"></center>

<style id="yhr4b"></style>

<blockquote id="yhr4b"><p id="yhr4b"></p></blockquote>

<sub id="yhr4b"></sub>