自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

面試官:項目中如何實現(xiàn)布隆過濾器?

數(shù)據(jù)庫 Redis
對于布隆過濾器是什么?以及布隆過濾器的實現(xiàn)原理?相信大部分同學(xué)都能回答個七七八八。當(dāng)如果被問道:項目當(dāng)中是如何實現(xiàn)布隆過濾器的?這個時候大部分同學(xué)就又回答不上來了,所以今天咱們就來探討一下這個問題。

談起“布隆過濾器”相信大家都不陌生,它也算日常面試中的常見面試題了。例如,當(dāng)面試官在問到 Redis 模塊的相關(guān)問題時,可能會問到緩存穿透(Redis 四大經(jīng)典問題之一),而緩存穿透的經(jīng)典解決方案之一,則是“布隆過濾器”。

但是,對于布隆過濾器是什么?以及布隆過濾器的實現(xiàn)原理?相信大部分同學(xué)都能回答個七七八八。當(dāng)如果被問道:項目當(dāng)中是如何實現(xiàn)布隆過濾器的?這個時候大部分同學(xué)就又回答不上來了,所以今天咱們就來探討一下這個問題。

1. 什么是布隆過濾器?

布隆過濾器(Bloom Filter)是一種高效的數(shù)據(jù)結(jié)構(gòu),由布隆在 1970 年提出。它主要用于判斷一個元素可能是否存在于集合中,其核心特性包括高效的插入和查詢操作,但存在一定的假陽性(False Positives)可能性。

布隆過濾器實現(xiàn)如下圖所示:

根據(jù) key 值計算出它的存儲位置,然后將此位置標(biāo)識全部標(biāo)識為 1(未存放數(shù)據(jù)的位置全部為 0),查詢時也是查詢對應(yīng)的位置是否全部為 1,如果全部為 1,則說明數(shù)據(jù)是可能存在的,否則一定不存在。

也就是說,如果布隆過濾器說一個元素不在集合中,那么它一定不在這個集合中;但如果它說一個元素在集合中,則有可能是不存在的(存在誤差,假陽性)。

2.布隆過濾器特征

  • 高效節(jié)省空間:布隆過濾器不存儲數(shù)據(jù)本身,只存儲數(shù)據(jù)對應(yīng)的哈希比特位,因此占用空間非常小。
  • 快速的插入和查詢:插入和查詢操作的時間復(fù)雜度都為 O(k),其中 k 為哈希函數(shù)的個數(shù),這使得布隆過濾器在處理大量數(shù)據(jù)時非常高效。
  • 存在假陽性:由于哈希碰撞的可能性,布隆過濾器在判斷元素存在時可能會出現(xiàn)誤判,即元素實際上不在集合中,但過濾器錯誤地認(rèn)為其存在。這種誤判率取決于哈希函數(shù)的個數(shù)和位數(shù)組的長度。
  • 不支持刪除操作:一旦一個元素被添加到布隆過濾器中,很難將其準(zhǔn)確地刪除。因為多個元素可能會共用位數(shù)組中的某些位,刪除一個元素可能會影響其他元素的判斷結(jié)果。
  • 靈活性與可配置性:布隆過濾器的誤判率、位數(shù)組的長度和哈希函數(shù)的個數(shù)都是可以根據(jù)具體應(yīng)用場景進(jìn)行調(diào)整的,以達(dá)到最優(yōu)的性能和誤判率平衡。

3.使用場景

布隆過濾器的主要使用場景有以下幾個:

  • 大數(shù)據(jù)量去重:可以用布隆過濾器來進(jìn)行數(shù)據(jù)去重,判斷一個數(shù)據(jù)是否已經(jīng)存在,避免重復(fù)插入。
  • 防止緩存穿透問題:可以用布隆過濾器來過濾掉惡意請求或請求不存在的數(shù)據(jù),避免對后端存儲的頻繁訪問。
  • 網(wǎng)絡(luò)爬蟲URL 去重:可以用布隆過濾器來判斷 URL 是否已經(jīng)被爬取,避免重復(fù)爬取。

4.布隆過濾器實現(xiàn)

實現(xiàn)布隆過濾器的方法有很多,可以分為以下兩類:

  • 分布式布隆過濾器
  • 使用 Redis 4.0 之后提供的插件來實現(xiàn)布隆過濾器。
  • 使用 Redisson 框架實現(xiàn)布隆過濾器。
  • 單機(jī)布隆過濾器
  • 使用 Google Guava 實現(xiàn)布隆過濾器。
  • 使用 Java 自帶的數(shù)據(jù)結(jié)構(gòu) BitSet 來實現(xiàn)布隆過濾器。
  • 使用 Hutool 框架實現(xiàn)布隆過濾器。

5.項目中具體實現(xiàn)

在項目開發(fā)當(dāng)中,如果使用的是 Redis 4.0+ 版本,我們通常會使用 Redis 布隆過濾器插件來實現(xiàn)布隆過濾器,以下是具體的實現(xiàn)步驟。

(1)下載編譯RedisBloom插件

git clone https://github.com/RedisLabsModules/redisbloom.git
cd redisbloom
make # 編譯redisbloom

編譯正常執(zhí)行完,會在根目錄生成一個 redisbloom.so 文件。

(2)啟用RedisBloom插件

重新啟動 Redis 服務(wù),并指定啟動 RedisBloom 插件,具體命令如下:

redis-server redis.conf --loadmodule ./src/modules/RedisBloom-master/redisbloom.so

(3)創(chuàng)建布隆過濾器

創(chuàng)建一個布隆過濾器,并設(shè)置期望插入的元素數(shù)量和誤差率,在 Redis 客戶端中輸入以下命令:

BF.RESERVE my_bloom_filter 0.01 100000

(4)添加元素到布隆過濾器

在 Redis 客戶端中輸入以下命令:

BF.ADD my_bloom_filter leige

(5)檢查元素是否存在

在 Redis 客戶端中輸入以下命令:

BF.EXISTS my_bloom_filter leige

責(zé)任編輯:姜華 來源: 磊哥和Java
相關(guān)推薦

2024-01-05 09:04:35

隆過濾器數(shù)據(jù)結(jié)構(gòu)哈希函數(shù)

2024-11-04 08:45:48

布隆過濾器元數(shù)據(jù)指紋值

2024-03-15 11:21:22

布隆過濾器數(shù)據(jù)庫數(shù)據(jù)

2024-02-01 08:08:53

Spring過濾器類型Gateway

2024-09-18 10:08:37

2025-02-08 17:30:00

布隆過濾器數(shù)據(jù)結(jié)構(gòu)

2024-10-09 15:54:38

布隆過濾器函數(shù)

2025-04-30 08:47:41

2020-10-29 07:16:26

布隆過濾器場景

2023-01-31 08:19:53

二進(jìn)制元素數(shù)量

2019-03-22 15:15:25

Redis緩存擊穿雪崩效應(yīng)

2022-03-21 08:31:07

布隆過濾器Redis過濾器原理

2025-01-23 00:00:00

Java布隆過濾器

2021-03-06 14:41:07

布隆過濾器算法

2025-01-22 00:00:00

布隆過濾器二進(jìn)制

2021-09-03 06:33:24

布隆過濾器高并發(fā)

2023-02-20 07:19:14

2024-09-24 16:30:46

分布式鎖Redis數(shù)據(jù)中間件

2024-03-04 10:24:34

布隆過濾器C#代碼

2023-07-06 10:15:38

布隆過濾器優(yōu)化
點贊
收藏

51CTO技術(shù)棧公眾號