Redis查漏補(bǔ)缺：Redis錯過的技術(shù)要點(diǎn)大掃盲

作者：DBAplus社群 2018-12-05 10:44:41

考慮到絕大部分寫業(yè)務(wù)的程序員在實(shí)際開發(fā)中使用Redis時，只會Setvalue和Getvalue兩個操作，對Redis整體缺乏一個認(rèn)知。

考慮到絕大部分寫業(yè)務(wù)的程序員在實(shí)際開發(fā)中使用Redis時，只會Setvalue和Getvalue兩個操作，對Redis整體缺乏一個認(rèn)知。又恰逢筆者有同事下周要去培訓(xùn)Redis，所以筆者斗膽以Redis為主題，對Redis常見問題做一個總結(jié)，希望能夠掃除大家的知識盲點(diǎn)。

[[251562]]

本文圍繞以下幾點(diǎn)進(jìn)行闡述：

為什么使用Redis
使用Redis有什么缺點(diǎn)
單線程的Redis為什么這么快
Redis的數(shù)據(jù)類型，以及每種數(shù)據(jù)類型的使用場景
Redis的過期策略以及內(nèi)存淘汰機(jī)制
Redis和數(shù)據(jù)庫雙寫一致性問題
如何應(yīng)對緩存穿透和緩存雪崩問題
如何解決Redis的并發(fā)競爭問題

為什么使用Redis

筆者認(rèn)為，在項(xiàng)目中使用Redis，主要是從兩個角度去考慮：性能和并發(fā)。當(dāng)然，Redis還具備可做分布式鎖等功能的其它功能，但如果只是為了分布式鎖這些其它功能，完全還有其它中間件(如Zookpeer等)可以代替，并不是非要使用Redis。

因此，這個問題主要從性能和并發(fā)兩個角度去答：

1性能

如下圖所示，我們在碰到需要執(zhí)行耗時特別久、且結(jié)果不頻繁變動的SQL時，就特別適合將運(yùn)行結(jié)果放入緩存。這樣，后面的請求就去緩存中讀取，使得請求能夠迅速響應(yīng)。

題外話：忽然想聊一下這個迅速響應(yīng)的標(biāo)準(zhǔn)——其實(shí)根據(jù)交互效果的不同，這個響應(yīng)時間沒有固定標(biāo)準(zhǔn)。不過曾經(jīng)有人這么告訴我：“在理想狀態(tài)下，我們的頁面跳轉(zhuǎn)需要在瞬間解決，對于頁內(nèi)操作則需要在剎那間解決。另外，超過一彈指的耗時操作要有進(jìn)度提示，并且可以隨時中止或取消，這樣才能給用戶***的體驗(yàn)。”

那么瞬間、剎那、一彈指具體是多少時間呢?

根據(jù)《摩訶僧祗律》記載：一剎那者為一念，二十念為一瞬，二十瞬為一彈指，二十彈指為一羅預(yù)，二十羅預(yù)為一須臾，一日一夜有三十須臾。

那么，經(jīng)過周密的計算，一瞬間為0.36秒,一剎那有0.018秒，一彈指長達(dá)7.2秒。

2并發(fā)

如下圖所示，在大并發(fā)的情況下，所有的請求直接訪問數(shù)據(jù)庫，數(shù)據(jù)庫會出現(xiàn)連接異常。這個時候，就需要使用Redis做一個緩沖操作，讓請求先訪問到Redis，而不是直接訪問數(shù)據(jù)庫。

使用Redis有什么缺點(diǎn)

大家用Redis這么久，這個問題是必須要了解的，基本上使用Redis都會碰到一些問題，常見的主要是四方面的問題：

緩存和數(shù)據(jù)庫雙寫一致性問題
緩存雪崩問題
緩存擊穿問題
緩存的并發(fā)競爭問題

這四個問題，筆者個人覺得在項(xiàng)目中比較常遇見，具體解決方案，后文會給出。

單線程的Redis為什么這么快

這個問題其實(shí)是對Redis內(nèi)部機(jī)制的一個考察。其實(shí)根據(jù)筆者的面試經(jīng)驗(yàn)，很多人其實(shí)都不知道Redis是單線程工作模型。所以，這個問題還是應(yīng)該要復(fù)習(xí)一下的。主要是以下三點(diǎn)：

純內(nèi)存操作
單線程操作，避免了頻繁的上下文切換
采用了非阻塞I/O多路復(fù)用機(jī)制

我們現(xiàn)在仔細(xì)地說一說I/O多路復(fù)用機(jī)制，因?yàn)檫@個說法實(shí)在是太通俗了，通俗到一般人都不懂是什么意思。打一個比方：小曲在S城開了一家快遞店，負(fù)責(zé)同城快送服務(wù)。小曲因?yàn)橘Y金限制，雇傭了一批快遞員，然后小曲發(fā)現(xiàn)資金不夠了，只夠買一輛車送快遞。

經(jīng)營方式一：

客戶每送來一份快遞，小曲就讓一個快遞員盯著，然后快遞員開車去送快遞。慢慢的小曲就發(fā)現(xiàn)了這種經(jīng)營方式存在很多問題，幾十個快遞員基本上時間都花在了搶車上了，大部分快遞員都處在閑置狀態(tài)，誰搶到了車，誰就能去送快遞。

隨著快遞的增多，快遞員也越來越多，小曲發(fā)現(xiàn)快遞店里越來越擠，沒辦法雇傭新的快遞員了，快遞員之間的協(xié)調(diào)很花時間，大部分時間花在搶車上。綜合上述缺點(diǎn)，小曲痛定思痛，提出了下面的經(jīng)營方式↓

經(jīng)營方式二：

小曲只雇傭一個快遞員，客戶送來的快遞，小曲按送達(dá)地點(diǎn)標(biāo)注好，然后依次放在一個地方。***，那個快遞員依次去取快遞，一次拿一個，開著車去送快遞，送好了就回來拿下一個快遞。

上述兩種經(jīng)營方式對比，是不是明顯覺得第二種，效率更高、更好呢?在上述比喻中：

每個快遞員→每個線程
每個快遞→每個Socket(I/O流)
快遞的送達(dá)地點(diǎn)→Socket的不同狀態(tài)
客戶送快遞請求→來自客戶端的請求
小曲的經(jīng)營方式→服務(wù)端運(yùn)行的代碼
一輛車→CPU的核數(shù)

于是我們有如下結(jié)論：

經(jīng)營方式一就是傳統(tǒng)的并發(fā)模型，每個I/O流(快遞)都有一個新的線程(快遞員)管理。
經(jīng)營方式二就是I/O多路復(fù)用。只有單個線程(一個快遞員)，通過跟蹤每個I/O流的狀態(tài)(每個快遞的送達(dá)地點(diǎn))，來管理多個I/O流。

下面類比到真實(shí)的Redis線程模型，如圖所示：

參照上圖，簡單來說就是，我們的Redis-client在操作的時候，會產(chǎn)生具有不同事件類型的Socket。在服務(wù)端，有一段I/O多路復(fù)用程序，將其置入隊列之中。然后文件事件分派器依次去隊列中取，轉(zhuǎn)發(fā)到不同的事件處理器中。

需要說明的是，這個I/O多路復(fù)用機(jī)制，Redis還提供了Select、Epoll、Evport、Kqueue等多路復(fù)用函數(shù)庫，大家可以自行去了解。

Redis的數(shù)據(jù)類型及各自使用場景

看到這個問題，是不是覺得它很基礎(chǔ)?其實(shí)筆者也這么覺得。然而根據(jù)面試經(jīng)驗(yàn)發(fā)現(xiàn)，至少80%的人答不上這個問題。建議在項(xiàng)目中用到后，再類比記憶，體會更深，不要硬記?；旧?，一個合格的程序員五種類型都會用到：

1String

這個其實(shí)沒什么好說的，最常規(guī)的Set/Get操作，Value可以是String也可以是數(shù)字，一般做一些復(fù)雜的計數(shù)功能的緩存。

2Hash

這里Value存放的是結(jié)構(gòu)化的對象，比較方便的就是操作其中的某個字段。筆者在做單點(diǎn)登錄的時候，就是用這種數(shù)據(jù)結(jié)構(gòu)存儲用戶信息，以CookieId作為Key，設(shè)置30分鐘為緩存過期時間，能很好地模擬出類似Session的效果。

3List

使用List的數(shù)據(jù)結(jié)構(gòu)，可以做簡單的消息隊列的功能。另外還有一個就是，可以利用Lrange命令，做基于Redis的分頁功能，性能***，用戶體驗(yàn)好。

4Set

因?yàn)镾et堆放的是一堆不重復(fù)值的集合，所以可以做全局去重的功能。

為什么不用JVM自帶的Set進(jìn)行去重?因?yàn)槲覀兊南到y(tǒng)一般都是集群部署，使用JVM自帶的Set比較麻煩，難道為了做一個全局去重，再起一個公共服務(wù)?太麻煩了。

另外，就是利用交集、并集、差集等操作，可以計算共同喜好、全部的喜好、自己獨(dú)有的喜好等功能。

5SortedSet

Sorted Set多了一個權(quán)重參數(shù)Score，集合中的元素能夠按Score進(jìn)行排列。可以做排行榜應(yīng)用，取TOP N操作。另外，Sorted Set還可以用來做延時任務(wù)。***一個應(yīng)用就是可以做范圍查找。

Redis的過期策略及內(nèi)存淘汰機(jī)制

這個問題其實(shí)相當(dāng)重要，從這個問題就可以看出來到底Redis有沒有用到位。比如，你Redis只能存5G數(shù)據(jù)，可是你寫了10G，那會刪5G的數(shù)據(jù)。怎么刪的?這個問題思考過么?還有，你的數(shù)據(jù)已經(jīng)設(shè)置了過期時間，但是時間到了，內(nèi)存占用率還是比較高，有思考過原因么?

Redis采用的是定期刪除+惰性刪除策略。

為什么不用定時刪除策略?

定時刪除，用一個定時器來負(fù)責(zé)監(jiān)視Key，過期則自動刪除。雖然內(nèi)存及時釋放，但是十分消耗CPU資源。在大并發(fā)請求下，CPU要將時間應(yīng)用在處理請求，而不是刪除Key，因此沒有采用這一策略。

定期刪除+惰性刪除是如何工作的呢?

定期刪除，Redis默認(rèn)每個100ms檢查是否有過期的Key，有過期Key則刪除。需要說明的是，Redis不是每個100ms將所有的Key檢查一次，而是隨機(jī)抽取進(jìn)行檢查(如果每隔100ms，全部Key進(jìn)行檢查，Redis豈不是卡死)。因此，如果只采用定期刪除策略，會導(dǎo)致很多Key到時間沒有刪除。

于是，惰性刪除派上用場。也就是說在你獲取某個Key的時候，Redis會檢查一下，這個Key如果設(shè)置了過期時間，那么是否過期了?如果過期了此時就會刪除。

采用定期刪除+惰性刪除就沒其他問題了么?

不是的，如果定期刪除沒刪除Key。然后你也沒及時去請求Key，也就是說惰性刪除也沒生效。這樣，Redis的內(nèi)存會越來越高，那么就應(yīng)該采用內(nèi)存淘汰機(jī)制。

在Redis.conf中有一行配置：

# maxmemory-policy volatile-lru

該配置就是配內(nèi)存淘汰策略的：

Noeviction：當(dāng)內(nèi)存不足以容納新寫入數(shù)據(jù)時，新寫入操作會報錯。應(yīng)該沒人使用吧;
Allkeys-lru：當(dāng)內(nèi)存不足以容納新寫入數(shù)據(jù)時，在鍵空間中，移除最近最少使用的Key。推薦使用，目前項(xiàng)目在用這種;
Allkeys-random：當(dāng)內(nèi)存不足以容納新寫入數(shù)據(jù)時，在鍵空間中，隨機(jī)移除某個key，應(yīng)該也沒人使用吧;
Volatile-lru：當(dāng)內(nèi)存不足以容納新寫入數(shù)據(jù)時，在設(shè)置了過期時間的鍵空間中，移除最近最少使用的Key。這種情況一般是把Redis既當(dāng)緩存又做持久化存儲的時候才用。不推薦;
Volatile-random：當(dāng)內(nèi)存不足以容納新寫入數(shù)據(jù)時，在設(shè)置了過期時間的鍵空間中，隨機(jī)移除某個Key。依然不推薦;
Volatile-ttl：當(dāng)內(nèi)存不足以容納新寫入數(shù)據(jù)時，在設(shè)置了過期時間的鍵空間中，有更早過期時間的Key優(yōu)先移除。不推薦。

PS：如果沒有設(shè)置Expire的Key，不滿足先決條件(Prerequisites);那么Volatile-lru、Volatile-random和Volatile-ttl策略的行為，和Noeviction(不刪除)基本上一致。

Redis和數(shù)據(jù)庫雙寫一致性問題

一致性問題是分布式常見問題，還可以再分為最終一致性和強(qiáng)一致性。數(shù)據(jù)庫和緩存雙寫，就必然會存在不一致的問題，想要回答這個問題，就要先明白一個前提：如果對數(shù)據(jù)有強(qiáng)一致性要求，就不能放緩存。我們所做的一切，只能保證最終一致性。

另外，我們所做的方案其實(shí)從根本上來說，只能說降低不一致發(fā)生的概率，無法完全避免。因此，有強(qiáng)一致性要求的數(shù)據(jù)不能放緩存。

在這里簡單地說一說：首先，采取正確更新策略，先更新數(shù)據(jù)庫，再刪緩存;其次，因?yàn)榭赡艽嬖趧h除緩存失敗的問題，提供一個補(bǔ)償措施即可，例如利用消息隊列。

應(yīng)對緩存穿透和緩存雪崩問題

關(guān)于“如何應(yīng)對緩存穿透和緩存雪崩”這兩個問題，說句實(shí)在話，一般中小型傳統(tǒng)軟件企業(yè)很難碰到。如果有大并發(fā)的項(xiàng)目，流量有幾百萬左右，這兩個問題一定要深刻考慮：

1應(yīng)對緩存穿透

緩存穿透，即黑客故意去請求緩存中不存在的數(shù)據(jù)，導(dǎo)致所有的請求都懟到數(shù)據(jù)庫上，從而數(shù)據(jù)庫連接異常。

解決方案：

利用互斥鎖，緩存失效的時候，先去獲得鎖，得到鎖了，再去請求數(shù)據(jù)庫，沒得到鎖，則休眠一段時間重試;
采用異步更新策略，無論Key是否取到值，都直接返回。Value值中維護(hù)一個緩存失效時間，緩存如果過期，異步起一個線程去讀數(shù)據(jù)庫，更新緩存，需要做緩存預(yù)熱(項(xiàng)目啟動前，先加載緩存)操作;
提供一個能迅速判斷請求是否有效的攔截機(jī)制，比如利用布隆過濾器，內(nèi)部維護(hù)一系列合法有效的Key，迅速判斷出，請求所攜帶的Key是否合法有效，如果不合法，則直接返回。

2應(yīng)對緩存雪崩

緩存雪崩，即緩存同一時間大面積的失效，這個時候又來了一波請求，結(jié)果請求都懟到數(shù)據(jù)庫上，從而導(dǎo)致數(shù)據(jù)庫連接異常。

解決方案：

給緩存的失效時間加上一個隨機(jī)值，避免集體失效;
使用互斥鎖，但是該方案吞吐量明顯下降了;
雙緩存。我們有兩個緩存，緩存A和緩存B。緩存A的失效時間為20分鐘，緩存B不設(shè)失效時間，自己做緩存預(yù)熱操作。然后細(xì)分以下幾個小點(diǎn)：

a. 從緩存A讀數(shù)據(jù)庫，有則直接返回;

b. A 沒有數(shù)據(jù)，直接從B讀數(shù)據(jù)，直接返回，并且異步啟動一個更新線程;

c. 更新線程同時更新緩存A和緩存B。

如何解決Redis并發(fā)競爭Key問題

這個問題大致就是同時有多個子系統(tǒng)去Set一個Key。這個時候要注意什么呢?本人提前百度了一下，發(fā)現(xiàn)大家思考的答案基本都是推薦用Redis事務(wù)機(jī)制。但本人不推薦使用Redis的事務(wù)機(jī)制。因?yàn)槲覀兊纳a(chǎn)環(huán)境，基本都是Redis集群環(huán)境，做了數(shù)據(jù)分片操作。你一個事務(wù)中有涉及到多個Key操作的時候，這多個Key不一定都存儲在同一個Redis-Server上。因此，Redis的事務(wù)機(jī)制，十分雞肋。

解決方法如下：

如果對這個Key操作不要求順序

這種情況下，準(zhǔn)備一個分布式鎖，大家去搶鎖，搶到鎖就做Set操作即可，比較簡單。

如果對這個Key操作要求順序

假設(shè)有一個Key1，系統(tǒng)A需要將Key1設(shè)置為ValueA，系統(tǒng)B需要將Key1設(shè)置為ValueB，系統(tǒng)C需要將Key1設(shè)置為ValueC。期望按照Key1的Value值按照 ValueA→ValueB→ValueC的順序變化。這種時候我們在數(shù)據(jù)寫入數(shù)據(jù)庫的時候，需要保存一個時間戳。假設(shè)時間戳如下：

系統(tǒng)A Key 1 {ValueA 3:00}

系統(tǒng)B Key 1 {ValueB 3:05}

系統(tǒng)C Key 1 {ValueC 3:10}

那么，假設(shè)這會系統(tǒng)B先搶到鎖，將Key1設(shè)置為{ValueB 3:05}。接下來系統(tǒng)A搶到鎖，發(fā)現(xiàn)自己的ValueA的時間戳早于緩存中的時間戳，那就不做Set操作了。以此類推。

其他方法，比如利用隊列，將Set方法變成串行訪問也可以。總之，靈活變通。

總結(jié)

本文對Redis的常見問題做了一個總結(jié)。大部分是筆者自己在工作中遇到，以及以前面試別人的時候常問的一些問題，希望大家能夠有所收獲。

作者介紹

孤獨(dú)煙，中國平安研發(fā)工程師，目前負(fù)責(zé)規(guī)則云平臺架構(gòu)設(shè)計以及需求研發(fā)工作。畢業(yè)后一直從事Java開發(fā)工作，在Web開發(fā)、架構(gòu)設(shè)計上有多年的實(shí)戰(zhàn)經(jīng)驗(yàn)。在MySQL性能優(yōu)化、JVM調(diào)優(yōu)、分布式領(lǐng)域有著豐富的經(jīng)驗(yàn)。

責(zé)任編輯：武曉燕來源：今日頭條