自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

九張圖帶你理解 Kafka 中高水位 HW

開發(fā) 架構(gòu)
高水位 HW 這個概念在 Kafka 中標(biāo)記消息是否可以被消費(fèi)者消費(fèi),這個概念跟 LEO 有著重要的關(guān)系。本文介紹了 LEO 和 HW 的更新機(jī)制,希望對你理解 HW 有所幫助。

大家好,我是君哥。

Kafka 高水位(簡稱 HW)是 Kafka 中非常重要的一個概念,今天來聊一聊 HW。

1 HW 簡介

HW 是 Kafka 中 Offset 的一個值,HW 作為一個邊界,Offset 小于 HW 的消息被稱為已提交消息,這部分消息可以被消費(fèi)者進(jìn)行拉取消費(fèi),大于等于 HW 的消息被稱為未提交消息,不能被消費(fèi)者拉取。如下圖:

圖片圖片

Offset 小于 108 的消息可以被消費(fèi)者消費(fèi),Offset 大于等于 108 的消息不能被消費(fèi)者消費(fèi) 。

2 LEO 簡介

Kafka 中跟 Offset 相關(guān)的還有一個重要概念叫 LEO(Log End Offset)。LEO 表示 Offset 中的最后一個位置,也就是新消息寫入的第一個位置,這個位置還沒有消息。比如下圖中的 114 這個位置,新消息寫入時會從這個位置開始存儲。

圖片圖片

3 HW 更新機(jī)制

對于 Kafka 的一個分區(qū)來說,分區(qū)的所有副本都有 HW 和 LEO 這 2 個重要屬性,不光是 Leader 副本。但是 Leader 副本的 HW 值被作為整個分區(qū)的 HW。

因此,分區(qū)每個副本所在的 Broker 都保存了自己的 HW 和 LEO 值,而 Leader 副本所在的 Broker 節(jié)點(diǎn)還保存了 Follower 副本的 HW 和 LEO。

注意:這里說的 Follower 必須跟 Leader 保持同步,一般用 2 個條件來判斷:

  • Follower 在 ISR 集合中;
  • Follower 中 LEO 值落后于 Leader LEO 值的時間,不超過參數(shù)(replica.lag.time.max.ms)的值,默認(rèn) 10s。

如下圖,partition-test 這個分區(qū)有 3 個副本,Leader 和 Follower1、Follower2,F(xiàn)ollower1 和 Follower2 所在的 Broker1 上保存了自己的 HW 和 LEO,而 Leader 所在的 Broker0 不僅保存了自己的 HW 和 LEO,還保存了 Follower1 跟 Follower2 的 HW 和 LEO。

圖片圖片

3.1 Follower 更新

Broker1 和 Broker2 作為分區(qū)的 Follower 副本,會從 Leader 拉取消息,寫入本地磁盤,然后更新 LEO。更新成功 LEO 后,比較自己的 LEO 值跟 Leader 副本發(fā)送的 HW 值,取較小的作為自己的 HW。如下圖:

圖片圖片

3.2 Leader 更新

從 3.1 中的圖可以看到,Leader 收到 Follower 拉取消息請求后,會根據(jù) Follower 副本發(fā)送的拉取請求中的 Offset 更新本地保存的 Follower 的 LEO。同時 leader 會更新自己的 HW = min LEO of{Leader、Follower1、Follower2}。

需要注意的是,Leader 是不能更新 Follower 的 HW 的。

下面看一下 Leader 副本收到生產(chǎn)者發(fā)送的消息時是怎樣更新自己的 LEO 和 HW 的。如下圖:

圖片圖片

4 一個示例

下面以 Leader 只有一個 Follower 的場景來說明 LEO 和 HW 的更新過程。

初始狀態(tài),Leader 所在的 Broker 節(jié)點(diǎn)保存的 Leader 的 LEO 和 HW 都是 0,保存的 Follower 的 LEO = 0。

圖片圖片

生產(chǎn)者發(fā)送一條消息后,Leader 節(jié)點(diǎn)更新 LEO = 1,此時 Leader 的 HW 是 0。Follower 還沒有發(fā)起拉取請求,所以 Follower 的 LEO 任然是 0,Leader 的 HW 是 0。

圖片圖片

Follower 第一次拉取消息,發(fā)送給 Leader 的 Offset = 0,Leader 節(jié)點(diǎn)收到請求后,因?yàn)?Offset = 0,所以本地保存的 Follower LEO 不變。Leader 節(jié)點(diǎn)返回消息給 Follower,F(xiàn)ollower 節(jié)點(diǎn)寫入消息后更新自己的 LEO = 1。

圖片圖片

Follower 第二次拉取消息,發(fā)送給 Leader 的 Offset = 1,Leader 節(jié)點(diǎn)收到請求后,更新本地保存的 Follower LEO = 1,更新自己的 HW = 1 并返回給 Follower,F(xiàn)ollower 收到 Leader 發(fā)送的 HW 后更新自己的 HW = 1。

圖片圖片

總結(jié)

高水位 HW 這個概念在 Kafka 中標(biāo)記消息是否可以被消費(fèi)者消費(fèi),這個概念跟 LEO 有著重要的關(guān)系。本文介紹了 LEO 和 HW 的更新機(jī)制,希望對你理解 HW 有所幫助。

責(zé)任編輯:武曉燕 來源: 君哥聊技術(shù)
相關(guān)推薦

2020-06-28 07:39:44

Kafka分布式消息

2022-06-11 18:15:26

KubernetesDockerLinux

2022-02-28 11:10:42

ZGCG1收集器

2022-04-11 11:55:34

架構(gòu)技術(shù)調(diào)優(yōu)

2022-06-13 11:05:35

RocketMQ消費(fèi)者線程

2023-04-11 08:35:22

RocketMQ云原生

2022-07-11 11:06:11

RocketMQ函數(shù).消費(fèi)端

2021-04-25 10:45:59

Docker架構(gòu)Job

2022-07-04 11:06:02

RocketMQ事務(wù)消息實(shí)現(xiàn)

2021-05-18 06:55:07

Java AQS源碼

2022-06-27 11:04:24

RocketMQ順序消息

2019-07-24 08:49:36

Docker容器鏡像

2021-11-12 08:38:26

一致性哈希算法數(shù)據(jù)結(jié)構(gòu)

2021-12-06 07:15:47

Pulsar地域復(fù)制

2022-05-09 11:15:05

RocketMQPULL 模式PUSH 模式

2015-07-13 10:23:23

Java圖解

2023-09-28 21:37:41

HashMap多線程

2020-11-27 06:28:55

Spring循環(huán)依賴

2021-08-15 18:59:13

垃圾收集器JDK

2021-11-29 07:47:56

RocketMQ分布式消息
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號