Redis如何實(shí)現(xiàn)分頁+多條件模糊查詢?答案來了
導(dǎo)言
Redis是一個(gè)高效的內(nèi)存數(shù)據(jù)庫,它支持包括String、List、Set、SortedSet和Hash等數(shù)據(jù)類型的存儲,在Redis中通常根據(jù)數(shù)據(jù)的key查詢其value值,Redis沒有模糊條件查詢,在面對一些需要分頁、排序以及條件查詢的場景時(shí)(如評論,時(shí)間線,檢索等),只憑借Redis所提供的功能就不太好不處理了。
本文不對Redis的特性做過多贅述。由于之前基于業(yè)務(wù)問題需要實(shí)現(xiàn)基于Redis的條件查詢和分頁功能,在百度上查詢了不少文章,基本不是只有分頁功能就是只有條件查詢功能的實(shí)現(xiàn),缺少兩者組合的解決方案。因此,本文將基于Redis提供條件查詢+分頁的技術(shù)解決方案。
注:本文只提供實(shí)現(xiàn)思路,并不提供實(shí)現(xiàn)的代碼
本文將從四個(gè)部分進(jìn)行說明:
- 分頁實(shí)現(xiàn)
- 模糊條件查詢實(shí)現(xiàn)
- 分頁和模糊條件查詢的組合實(shí)現(xiàn)
- 優(yōu)化方案
大家可以直接跳到自己需要的部分進(jìn)行閱讀。
Redis的分頁實(shí)現(xiàn)
我們通常習(xí)慣于在Mysql、Oracle這樣持久化數(shù)據(jù)庫中實(shí)現(xiàn)分頁查詢,但是基于某些特殊的業(yè)務(wù)場景下,我們的數(shù)據(jù)并未持久化到了數(shù)據(jù)庫中或是出于查詢速度上的考慮將熱點(diǎn)數(shù)據(jù)加載到了緩存數(shù)據(jù)庫中。因此,我們可能需要基于Redis這樣的緩存數(shù)據(jù)庫去進(jìn)行分頁查詢。
Redis的分頁查詢的實(shí)現(xiàn)是基于Redis提供的ZSet數(shù)據(jù)結(jié)構(gòu)實(shí)現(xiàn)的,ZSet全稱為Sorted Set,該結(jié)構(gòu)主要存儲有序集合。下面是它的指令描述以及該指令在分頁實(shí)現(xiàn)中的作用:
- ZADD:SortedSet的添加元素指令ZADD key score member [[score,member]…]會給每個(gè)添加的元素member綁定一個(gè)用于排序的值score,SortedSet就會根據(jù)score值的大小對元素進(jìn)行排序。我們?yōu)橥ǔA?xí)慣于將數(shù)據(jù)的時(shí)間屬性當(dāng)作score用于排序,當(dāng)然大家也可以根據(jù)具體的業(yè)務(wù)場景去選擇排序的目標(biāo)。
- ZREVRANGE:SortedSet中的指令ZREVRANGE key start stop可以返回指定區(qū)間內(nèi)的成員,可以用來做分頁。
- ZREM:SortedSet的指令ZREM key member可以根據(jù)key移除指定的成員,能滿足刪評論的要求。
所以SortedSet用來做分頁是非常適合的。下面是分頁實(shí)現(xiàn)的演示圖,包含插入新記錄后的查詢情況。
事實(shí)上,Redis中的List結(jié)構(gòu)也是可以實(shí)現(xiàn)分頁,但List無法實(shí)現(xiàn)自動(dòng)排序,并且Zset還可以根據(jù)score進(jìn)行數(shù)據(jù)篩選,取出目標(biāo)score區(qū)間內(nèi)數(shù)據(jù)。
所以在實(shí)現(xiàn)上,ZSet往往更加適合我們。當(dāng)然如果你需要插入重復(fù)數(shù)據(jù)的情況下,分頁就可能就需要借助List來實(shí)現(xiàn)了。具體使用那種結(jié)構(gòu)來實(shí)現(xiàn)分頁還是需要根據(jù)實(shí)際的業(yè)務(wù)場景來進(jìn)行選擇的。
Redis的多條件模糊查詢實(shí)現(xiàn)
Redis是key-value類型的內(nèi)存數(shù)據(jù)庫,通過key直接取數(shù)據(jù)雖然很方便,但是并未提供像mysql那樣方便的sql條件查詢支持。因此我們需要借助Redis提供的結(jié)構(gòu)和功能去自己實(shí)現(xiàn)模糊條件查詢功能。
事實(shí)上,Redis的模糊條件查詢是基于Hash實(shí)現(xiàn)的,我們可以將數(shù)據(jù)的某些條件值作為hash的key值,并數(shù)據(jù)本身作為value進(jìn)行存儲。然后通過Hash提供的HSCAN指令去遍歷所有的key進(jìn)行篩選,得到我們符合條件的所有key值(hscan可以進(jìn)行模式匹配)。
為了方便,我們通常將符合條件的key全部放入到一個(gè)Set或是List中。這樣一來,我們就可以根據(jù)得到的key值去取出相應(yīng)的數(shù)據(jù)了。下面是模糊查詢的演示圖(其中field中的命名規(guī)則為<id>:<姓名>:<性別>,value為用戶詳情的json串)。
查詢所有性別為女的用戶
查詢所有名字中姓阿的用戶
HSCAN雖然為我們提供了模式匹配的功能,但這種匹配是基于遍歷實(shí)現(xiàn)的,每一次匹配都需要遍歷全部的key,效率上并不高。因此在下面一節(jié)會這方面進(jìn)行補(bǔ)充,本節(jié)只談如何實(shí)現(xiàn)模糊匹配。
Redis的分頁+多條件模糊查詢組合實(shí)現(xiàn)
前面分別單獨(dú)敘述了如何實(shí)現(xiàn)Redis的分頁和多條件某查詢。在實(shí)際使用中,單獨(dú)使用ZSet實(shí)現(xiàn)分頁已經(jīng)能夠展現(xiàn)不錯(cuò)的性能了,但存在一個(gè)問題是我們所分頁的數(shù)據(jù)往往是伴隨著一些動(dòng)態(tài)的篩選條件的,而ZSet并不提供這樣的功能。
面對這種情況,我們通常有兩種解決方案:
- 如果數(shù)據(jù)已經(jīng)存儲在了持久化數(shù)據(jù)庫中,我們可以每次在數(shù)據(jù)庫中做好條件查詢再將數(shù)據(jù)放入Redis中進(jìn)行分頁。
- 在Redis中實(shí)現(xiàn)多條件模糊查詢并分頁。
前者方案其實(shí)是一個(gè)不錯(cuò)的選擇,但缺點(diǎn)在于數(shù)據(jù)有時(shí)候并不一定都在持久化數(shù)據(jù)庫中。在有些業(yè)務(wù)場景下,我們的數(shù)據(jù)為了展現(xiàn)更好的并發(fā)性以及高響應(yīng),我們的數(shù)據(jù)會先放置在緩存數(shù)據(jù)庫中,等到某個(gè)時(shí)間或者滿足某種條件時(shí)再持久化到數(shù)據(jù)庫中。
在這種情況下我們第一個(gè)方案就不起作用了,需要使用第二個(gè)方案。因此,下面將介紹如何實(shí)現(xiàn)多條件模糊查詢的基礎(chǔ)上進(jìn)行分頁。
實(shí)現(xiàn)思路
首先我們可以采用多條件模糊查詢章節(jié)所說的方式,將我們所涉及到的條件字段作為hash的field,而數(shù)據(jù)的內(nèi)容則作為對應(yīng)value進(jìn)行存儲(一般以json格式存儲,方便反序列化)。
我們需要實(shí)現(xiàn)約定好查詢的格式,用前面一節(jié)的例子來說,field中的命名規(guī)則為<id>:<姓名>:<性別>,我們每次可以通過"*"來實(shí)現(xiàn)我們希望的模糊匹配條件,比如“*:*:男”就是匹配所有男性數(shù)據(jù),“100*:*:*”就是匹配所有id前綴為100的用戶。
當(dāng)我們拿到了匹配串后我們先去Redis中尋找是否存在以該匹配串為key的ZSet,如果沒有則通過Redis提供的HSCAN遍歷所有hash的field,得到所有符合條件的field,并將其放入一個(gè)ZSet集合,同時(shí)將這個(gè)集合的key設(shè)置為我們的條件匹配串。如果已經(jīng)存在了,則直接對這個(gè)ZSet進(jìn)行分頁查詢即可。對ZSet進(jìn)行分頁的方式已經(jīng)在前面敘述過了。通過這樣的方式我們就實(shí)現(xiàn)了最簡單的分頁+多條件模糊查詢。另外,搜索公眾號GitHub猿后臺回復(fù)“賺錢”,獲取一份驚喜禮包。
上圖中,由于并未在緩存數(shù)據(jù)庫中找到符合的ZSet集合,我們將根據(jù)匹配串生成一個(gè)新的集合用于分頁。
性能優(yōu)化方案
雖然上文實(shí)現(xiàn)了多條件模糊查詢+分頁的功能,但是在時(shí)間開發(fā)中,我們不能無限制的生成新的集合,因?yàn)槠ヅ浯呛芏鄻踊?,這會給緩存帶來巨大的壓力。
因此我們在生成集合時(shí)可以賦予這個(gè)集合一個(gè)過期時(shí)間,到期集合會自動(dòng)銷毀。因?yàn)楦鶕?jù)時(shí)間局部性原理,我們在一段時(shí)間內(nèi)不訪問的數(shù)據(jù)大概率在很長一頓時(shí)間內(nèi)也不會再訪問。而對于命中的集合,我們將更新其過期時(shí)間。
同時(shí),我們數(shù)據(jù)的實(shí)時(shí)性也是一個(gè)問題,因?yàn)槲覀兊募鲜窃谏杉蠒r(shí)的Hash內(nèi)容決定的,對于新插入到Hash的數(shù)據(jù),集合是無法探知的,因此有兩種解決方案:
- 第一種是插入到Hash時(shí)同時(shí)再插入到其他相應(yīng)的集合中,保證數(shù)據(jù)一直是最新的,這種方式需要增加特殊前綴用于識別,否則我們也不清楚到底要插入到哪些集合中。
- 第二種方式是定時(shí)更新,這種方式比較省力,但無法保證分頁數(shù)據(jù)的實(shí)時(shí)性。因此具體怎么選擇還是取決于業(yè)務(wù)場景。
總結(jié)
本文大概地描述了實(shí)現(xiàn)分頁和多條件模糊查詢的方案,希望能夠?qū)Υ蠹矣兴鶐椭?/p>