Redis查漏補(bǔ)缺:Redis錯過的技術(shù)要點(diǎn)大掃盲
考慮到絕大部分寫業(yè)務(wù)的程序員在實(shí)際開發(fā)中使用Redis時,只會Setvalue和Getvalue兩個操作,對Redis整體缺乏一個認(rèn)知。又恰逢筆者有同事下周要去培訓(xùn)Redis,所以筆者斗膽以Redis為主題,對Redis常見問題做一個總結(jié),希望能夠掃除大家的知識盲點(diǎn)。
本文圍繞以下幾點(diǎn)進(jìn)行闡述:
- 為什么使用Redis
- 使用Redis有什么缺點(diǎn)
- 單線程的Redis為什么這么快
- Redis的數(shù)據(jù)類型,以及每種數(shù)據(jù)類型的使用場景
- Redis的過期策略以及內(nèi)存淘汰機(jī)制
- Redis和數(shù)據(jù)庫雙寫一致性問題
- 如何應(yīng)對緩存穿透和緩存雪崩問題
- 如何解決Redis的并發(fā)競爭問題
為什么使用Redis
筆者認(rèn)為,在項(xiàng)目中使用Redis,主要是從兩個角度去考慮:性能和并發(fā)。當(dāng)然,Redis還具備可做分布式鎖等功能的其它功能,但如果只是為了分布式鎖這些其它功能,完全還有其它中間件(如Zookpeer等)可以代替,并不是非要使用Redis。
因此,這個問題主要從性能和并發(fā)兩個角度去答:
1性能
如下圖所示,我們在碰到需要執(zhí)行耗時特別久、且結(jié)果不頻繁變動的SQL時,就特別適合將運(yùn)行結(jié)果放入緩存。這樣,后面的請求就去緩存中讀取,使得請求能夠迅速響應(yīng)。
題外話:忽然想聊一下這個迅速響應(yīng)的標(biāo)準(zhǔn)——其實(shí)根據(jù)交互效果的不同,這個響應(yīng)時間沒有固定標(biāo)準(zhǔn)。不過曾經(jīng)有人這么告訴我:“在理想狀態(tài)下,我們的頁面跳轉(zhuǎn)需要在瞬間解決,對于頁內(nèi)操作則需要在剎那間解決。另外,超過一彈指的耗時操作要有進(jìn)度提示,并且可以隨時中止或取消,這樣才能給用戶***的體驗(yàn)。”
那么瞬間、剎那、一彈指具體是多少時間呢?
根據(jù)《摩訶僧祗律》記載:一剎那者為一念,二十念為一瞬,二十瞬為一彈指,二十彈指為一羅預(yù),二十羅預(yù)為一須臾,一日一夜有三十須臾。
那么,經(jīng)過周密的計算,一瞬間為0.36秒,一剎那有0.018秒,一彈指長達(dá)7.2秒。
2并發(fā)
如下圖所示,在大并發(fā)的情況下,所有的請求直接訪問數(shù)據(jù)庫,數(shù)據(jù)庫會出現(xiàn)連接異常。這個時候,就需要使用Redis做一個緩沖操作,讓請求先訪問到Redis,而不是直接訪問數(shù)據(jù)庫。
使用Redis有什么缺點(diǎn)
大家用Redis這么久,這個問題是必須要了解的,基本上使用Redis都會碰到一些問題,常見的主要是四方面的問題:
- 緩存和數(shù)據(jù)庫雙寫一致性問題
- 緩存雪崩問題
- 緩存擊穿問題
- 緩存的并發(fā)競爭問題
這四個問題,筆者個人覺得在項(xiàng)目中比較常遇見,具體解決方案,后文會給出。
單線程的Redis為什么這么快
這個問題其實(shí)是對Redis內(nèi)部機(jī)制的一個考察。其實(shí)根據(jù)筆者的面試經(jīng)驗(yàn),很多人其實(shí)都不知道Redis是單線程工作模型。所以,這個問題還是應(yīng)該要復(fù)習(xí)一下的。主要是以下三點(diǎn):
- 純內(nèi)存操作
- 單線程操作,避免了頻繁的上下文切換
- 采用了非阻塞I/O多路復(fù)用機(jī)制
我們現(xiàn)在仔細(xì)地說一說I/O多路復(fù)用機(jī)制,因?yàn)檫@個說法實(shí)在是太通俗了,通俗到一般人都不懂是什么意思。打一個比方:小曲在S城開了一家快遞店,負(fù)責(zé)同城快送服務(wù)。小曲因?yàn)橘Y金限制,雇傭了一批快遞員,然后小曲發(fā)現(xiàn)資金不夠了,只夠買一輛車送快遞。
經(jīng)營方式一:
客戶每送來一份快遞,小曲就讓一個快遞員盯著,然后快遞員開車去送快遞。慢慢的小曲就發(fā)現(xiàn)了這種經(jīng)營方式存在很多問題,幾十個快遞員基本上時間都花在了搶車上了,大部分快遞員都處在閑置狀態(tài),誰搶到了車,誰就能去送快遞。
隨著快遞的增多,快遞員也越來越多,小曲發(fā)現(xiàn)快遞店里越來越擠,沒辦法雇傭新的快遞員了,快遞員之間的協(xié)調(diào)很花時間,大部分時間花在搶車上。綜合上述缺點(diǎn),小曲痛定思痛,提出了下面的經(jīng)營方式↓
經(jīng)營方式二:
小曲只雇傭一個快遞員,客戶送來的快遞,小曲按送達(dá)地點(diǎn)標(biāo)注好,然后依次放在一個地方。***,那個快遞員依次去取快遞,一次拿一個,開著車去送快遞,送好了就回來拿下一個快遞。
上述兩種經(jīng)營方式對比,是不是明顯覺得第二種,效率更高、更好呢?在上述比喻中:
- 每個快遞員→每個線程
- 每個快遞→每個Socket(I/O流)
- 快遞的送達(dá)地點(diǎn)→Socket的不同狀態(tài)
- 客戶送快遞請求→來自客戶端的請求
- 小曲的經(jīng)營方式→服務(wù)端運(yùn)行的代碼
- 一輛車→CPU的核數(shù)
于是我們有如下結(jié)論:
- 經(jīng)營方式一就是傳統(tǒng)的并發(fā)模型,每個I/O流(快遞)都有一個新的線程(快遞員)管理。
- 經(jīng)營方式二就是I/O多路復(fù)用。只有單個線程(一個快遞員),通過跟蹤每個I/O流的狀態(tài)(每個快遞的送達(dá)地點(diǎn)),來管理多個I/O流。
下面類比到真實(shí)的Redis線程模型,如圖所示:
參照上圖,簡單來說就是,我們的Redis-client在操作的時候,會產(chǎn)生具有不同事件類型的Socket。在服務(wù)端,有一段I/O多路復(fù)用程序,將其置入隊列之中。然后文件事件分派器依次去隊列中取,轉(zhuǎn)發(fā)到不同的事件處理器中。
需要說明的是,這個I/O多路復(fù)用機(jī)制,Redis還提供了Select、Epoll、Evport、Kqueue等多路復(fù)用函數(shù)庫,大家可以自行去了解。
Redis的數(shù)據(jù)類型及各自使用場景
看到這個問題,是不是覺得它很基礎(chǔ)?其實(shí)筆者也這么覺得。然而根據(jù)面試經(jīng)驗(yàn)發(fā)現(xiàn),至少80%的人答不上這個問題。建議在項(xiàng)目中用到后,再類比記憶,體會更深,不要硬記?;旧?,一個合格的程序員五種類型都會用到:
1String
這個其實(shí)沒什么好說的,最常規(guī)的Set/Get操作,Value可以是String也可以是數(shù)字,一般做一些復(fù)雜的計數(shù)功能的緩存。
2Hash
這里Value存放的是結(jié)構(gòu)化的對象,比較方便的就是操作其中的某個字段。筆者在做單點(diǎn)登錄的時候,就是用這種數(shù)據(jù)結(jié)構(gòu)存儲用戶信息,以CookieId作為Key,設(shè)置30分鐘為緩存過期時間,能很好地模擬出類似Session的效果。
3List
使用List的數(shù)據(jù)結(jié)構(gòu),可以做簡單的消息隊列的功能。另外還有一個就是,可以利用Lrange命令,做基于Redis的分頁功能,性能***,用戶體驗(yàn)好。
4Set
因?yàn)镾et堆放的是一堆不重復(fù)值的集合,所以可以做全局去重的功能。
為什么不用JVM自帶的Set進(jìn)行去重?因?yàn)槲覀兊南到y(tǒng)一般都是集群部署,使用JVM自帶的Set比較麻煩,難道為了做一個全局去重,再起一個公共服務(wù)?太麻煩了。
另外,就是利用交集、并集、差集等操作,可以計算共同喜好、全部的喜好、自己獨(dú)有的喜好等功能。
5SortedSet
Sorted Set多了一個權(quán)重參數(shù)Score,集合中的元素能夠按Score進(jìn)行排列。可以做排行榜應(yīng)用,取TOP N操作。另外,Sorted Set還可以用來做延時任務(wù)。***一個應(yīng)用就是可以做范圍查找。
Redis的過期策略及內(nèi)存淘汰機(jī)制
這個問題其實(shí)相當(dāng)重要,從這個問題就可以看出來到底Redis有沒有用到位。比如,你Redis只能存5G數(shù)據(jù),可是你寫了10G,那會刪5G的數(shù)據(jù)。怎么刪的?這個問題思考過么?還有,你的數(shù)據(jù)已經(jīng)設(shè)置了過期時間,但是時間到了,內(nèi)存占用率還是比較高,有思考過原因么?
Redis采用的是定期刪除+惰性刪除策略。
為什么不用定時刪除策略?
定時刪除,用一個定時器來負(fù)責(zé)監(jiān)視Key,過期則自動刪除。雖然內(nèi)存及時釋放,但是十分消耗CPU資源。在大并發(fā)請求下,CPU要將時間應(yīng)用在處理請求,而不是刪除Key,因此沒有采用這一策略。
定期刪除+惰性刪除是如何工作的呢?
定期刪除,Redis默認(rèn)每個100ms檢查是否有過期的Key,有過期Key則刪除。需要說明的是,Redis不是每個100ms將所有的Key檢查一次,而是隨機(jī)抽取進(jìn)行檢查(如果每隔100ms,全部Key進(jìn)行檢查,Redis豈不是卡死)。因此,如果只采用定期刪除策略,會導(dǎo)致很多Key到時間沒有刪除。
于是,惰性刪除派上用場。也就是說在你獲取某個Key的時候,Redis會檢查一下,這個Key如果設(shè)置了過期時間,那么是否過期了?如果過期了此時就會刪除。
采用定期刪除+惰性刪除就沒其他問題了么?
不是的,如果定期刪除沒刪除Key。然后你也沒及時去請求Key,也就是說惰性刪除也沒生效。這樣,Redis的內(nèi)存會越來越高,那么就應(yīng)該采用內(nèi)存淘汰機(jī)制。
在Redis.conf中有一行配置:
- # maxmemory-policy volatile-lru
該配置就是配內(nèi)存淘汰策略的:
- Noeviction:當(dāng)內(nèi)存不足以容納新寫入數(shù)據(jù)時,新寫入操作會報錯。應(yīng)該沒人使用吧;
- Allkeys-lru:當(dāng)內(nèi)存不足以容納新寫入數(shù)據(jù)時,在鍵空間中,移除最近最少使用的Key。推薦使用,目前項(xiàng)目在用這種;
- Allkeys-random:當(dāng)內(nèi)存不足以容納新寫入數(shù)據(jù)時,在鍵空間中,隨機(jī)移除某個key,應(yīng)該也沒人使用吧;
- Volatile-lru:當(dāng)內(nèi)存不足以容納新寫入數(shù)據(jù)時,在設(shè)置了過期時間的鍵空間中,移除最近最少使用的Key。這種情況一般是把Redis既當(dāng)緩存又做持久化存儲的時候才用。不推薦;
- Volatile-random:當(dāng)內(nèi)存不足以容納新寫入數(shù)據(jù)時,在設(shè)置了過期時間的鍵空間中,隨機(jī)移除某個Key。依然不推薦;
- Volatile-ttl:當(dāng)內(nèi)存不足以容納新寫入數(shù)據(jù)時,在設(shè)置了過期時間的鍵空間中,有更早過期時間的Key優(yōu)先移除。不推薦。
PS:如果沒有設(shè)置Expire的Key,不滿足先決條件(Prerequisites);那么Volatile-lru、Volatile-random和Volatile-ttl策略的行為,和Noeviction(不刪除)基本上一致。
Redis和數(shù)據(jù)庫雙寫一致性問題
一致性問題是分布式常見問題,還可以再分為最終一致性和強(qiáng)一致性。數(shù)據(jù)庫和緩存雙寫,就必然會存在不一致的問題,想要回答這個問題,就要先明白一個前提:如果對數(shù)據(jù)有強(qiáng)一致性要求,就不能放緩存。我們所做的一切,只能保證最終一致性。
另外,我們所做的方案其實(shí)從根本上來說,只能說降低不一致發(fā)生的概率,無法完全避免。因此,有強(qiáng)一致性要求的數(shù)據(jù)不能放緩存。
在這里簡單地說一說:首先,采取正確更新策略,先更新數(shù)據(jù)庫,再刪緩存;其次,因?yàn)榭赡艽嬖趧h除緩存失敗的問題,提供一個補(bǔ)償措施即可,例如利用消息隊列。
應(yīng)對緩存穿透和緩存雪崩問題
關(guān)于“如何應(yīng)對緩存穿透和緩存雪崩”這兩個問題,說句實(shí)在話,一般中小型傳統(tǒng)軟件企業(yè)很難碰到。如果有大并發(fā)的項(xiàng)目,流量有幾百萬左右,這兩個問題一定要深刻考慮:
1應(yīng)對緩存穿透
緩存穿透,即黑客故意去請求緩存中不存在的數(shù)據(jù),導(dǎo)致所有的請求都懟到數(shù)據(jù)庫上,從而數(shù)據(jù)庫連接異常。
解決方案:
- 利用互斥鎖,緩存失效的時候,先去獲得鎖,得到鎖了,再去請求數(shù)據(jù)庫,沒得到鎖,則休眠一段時間重試;
- 采用異步更新策略,無論Key是否取到值,都直接返回。Value值中維護(hù)一個緩存失效時間,緩存如果過期,異步起一個線程去讀數(shù)據(jù)庫,更新緩存,需要做緩存預(yù)熱(項(xiàng)目啟動前,先加載緩存)操作;
- 提供一個能迅速判斷請求是否有效的攔截機(jī)制,比如利用布隆過濾器,內(nèi)部維護(hù)一系列合法有效的Key,迅速判斷出,請求所攜帶的Key是否合法有效,如果不合法,則直接返回。
2應(yīng)對緩存雪崩
緩存雪崩,即緩存同一時間大面積的失效,這個時候又來了一波請求,結(jié)果請求都懟到數(shù)據(jù)庫上,從而導(dǎo)致數(shù)據(jù)庫連接異常。
解決方案:
- 給緩存的失效時間加上一個隨機(jī)值,避免集體失效;
- 使用互斥鎖,但是該方案吞吐量明顯下降了;
- 雙緩存。我們有兩個緩存,緩存A和緩存B。緩存A的失效時間為20分鐘,緩存B不設(shè)失效時間,自己做緩存預(yù)熱操作。然后細(xì)分以下幾個小點(diǎn):
a. 從緩存A讀數(shù)據(jù)庫,有則直接返回;
b. A 沒有數(shù)據(jù),直接從B讀數(shù)據(jù),直接返回,并且異步啟動一個更新線程;
c. 更新線程同時更新緩存A和緩存B。
如何解決Redis并發(fā)競爭Key問題
這個問題大致就是同時有多個子系統(tǒng)去Set一個Key。這個時候要注意什么呢?本人提前百度了一下,發(fā)現(xiàn)大家思考的答案基本都是推薦用Redis事務(wù)機(jī)制。但本人不推薦使用Redis的事務(wù)機(jī)制。因?yàn)槲覀兊纳a(chǎn)環(huán)境,基本都是Redis集群環(huán)境,做了數(shù)據(jù)分片操作。你一個事務(wù)中有涉及到多個Key操作的時候,這多個Key不一定都存儲在同一個Redis-Server上。因此,Redis的事務(wù)機(jī)制,十分雞肋。
解決方法如下:
如果對這個Key操作不要求順序
這種情況下,準(zhǔn)備一個分布式鎖,大家去搶鎖,搶到鎖就做Set操作即可,比較簡單。
如果對這個Key操作要求順序
假設(shè)有一個Key1,系統(tǒng)A需要將Key1設(shè)置為ValueA,系統(tǒng)B需要將Key1設(shè)置為ValueB,系統(tǒng)C需要將Key1設(shè)置為ValueC。期望按照Key1的Value值按照 ValueA→ValueB→ValueC的順序變化。這種時候我們在數(shù)據(jù)寫入數(shù)據(jù)庫的時候,需要保存一個時間戳。假設(shè)時間戳如下:
系統(tǒng)A Key 1 {ValueA 3:00}
系統(tǒng)B Key 1 {ValueB 3:05}
系統(tǒng)C Key 1 {ValueC 3:10}
那么,假設(shè)這會系統(tǒng)B先搶到鎖,將Key1設(shè)置為{ValueB 3:05}。接下來系統(tǒng)A搶到鎖,發(fā)現(xiàn)自己的ValueA的時間戳早于緩存中的時間戳,那就不做Set操作了。以此類推。
其他方法,比如利用隊列,將Set方法變成串行訪問也可以。總之,靈活變通。
總結(jié)
本文對Redis的常見問題做了一個總結(jié)。大部分是筆者自己在工作中遇到,以及以前面試別人的時候常問的一些問題,希望大家能夠有所收獲。
作者介紹
孤獨(dú)煙,中國平安研發(fā)工程師,目前負(fù)責(zé)規(guī)則云平臺架構(gòu)設(shè)計以及需求研發(fā)工作。畢業(yè)后一直從事Java開發(fā)工作,在Web開發(fā)、架構(gòu)設(shè)計上有多年的實(shí)戰(zhàn)經(jīng)驗(yàn)。在MySQL性能優(yōu)化、JVM調(diào)優(yōu)、分布式領(lǐng)域有著豐富的經(jīng)驗(yàn)。