緩存和數(shù)據(jù)庫(kù)到底先寫(xiě)哪個(gè)？這次整明白了！

作者：陳皓 2022-03-04 14:57:50

你要用緩存，就不得不面對(duì)緩存和數(shù)據(jù)庫(kù)不一致的問(wèn)題，解決這種不一致有通用設(shè)計(jì)模式（其實(shí)不僅僅是數(shù)據(jù)庫(kù)上的應(yīng)用），陳皓這篇文章講的比較全面。

大型高并發(fā)的后端服務(wù)系統(tǒng)，處理瓶頸往往是數(shù)據(jù)庫(kù)，比如mysql的查詢寫(xiě)入。

為了能夠快速響應(yīng)用戶請(qǐng)求，系統(tǒng)優(yōu)化自然會(huì)想到利用緩存加快處理速度，常用的比如redis，性能非常高的緩存數(shù)據(jù)庫(kù)。redis搭配mysql一起使用，絕配。

但，沒(méi)有免費(fèi)的午餐，你要用緩存，就不得不面對(duì)緩存和數(shù)據(jù)庫(kù)不一致的問(wèn)題，解決這種不一致有通用設(shè)計(jì)模式（其實(shí)不僅僅是數(shù)據(jù)庫(kù)上的應(yīng)用），陳皓這篇文章講的比較全面。

以下是原文，侵刪：

看到好些人在寫(xiě)更新緩存數(shù)據(jù)代碼時(shí)，先刪除緩存，然后再更新數(shù)據(jù)庫(kù)，而后續(xù)的讀操作會(huì)把數(shù)據(jù)再裝載的緩存中。然而，這個(gè)是邏輯是錯(cuò)誤的。試想，兩個(gè)并發(fā)操作，一個(gè)是更新操作，另一個(gè)是查詢操作，更新操作刪除緩存后，查詢操作沒(méi)有命中緩存，先把老數(shù)據(jù)讀出來(lái)后放到緩存中，然后更新操作更新了數(shù)據(jù)庫(kù)。于是，在緩存中的數(shù)據(jù)還是老的數(shù)據(jù)，導(dǎo)致緩存中的數(shù)據(jù)是臟的，而且還一直這樣臟下去了。

我不知道為什么這么多人用的都是這個(gè)邏輯，當(dāng)我在微博上發(fā)了這個(gè)貼以后，我發(fā)現(xiàn)好些人給了好多非常復(fù)雜和詭異的方案，所以，我想寫(xiě)這篇文章說(shuō)一下幾個(gè)緩存更新的Design Pattern（讓我們多一些套路吧）。

這里，我們先不討論更新緩存和更新數(shù)據(jù)這兩個(gè)事是一個(gè)事務(wù)的事，或是會(huì)有失敗的可能，我們先假設(shè)更新數(shù)據(jù)庫(kù)和更新緩存都可以成功的情況（我們先把成功的代碼邏輯先寫(xiě)對(duì)）。

更新緩存的的Design Pattern有四種：Cache aside, Read through, Write through, Write behind caching，我們下面一一來(lái)看一下這四種Pattern。

Cache Aside Pattern

這是最常用最常用的pattern了。其具體邏輯如下：

失效：應(yīng)用程序先從cache取數(shù)據(jù)，沒(méi)有得到，則從數(shù)據(jù)庫(kù)中取數(shù)據(jù)，成功后，放到緩存中。命中：應(yīng)用程序從cache中取數(shù)據(jù)，取到后返回。更新：先把數(shù)據(jù)存到數(shù)據(jù)庫(kù)中，成功后，再讓緩存失效。Cache-Aside-Design-Pat

注意，我們的更新是先更新數(shù)據(jù)庫(kù)，成功后，讓緩存失效。那么，這種方式是否可以沒(méi)有文章前面提到過(guò)的那個(gè)問(wèn)題呢？我們可以腦補(bǔ)一下。

一個(gè)是查詢操作，一個(gè)是更新操作的并發(fā)，首先，沒(méi)有了刪除cache數(shù)據(jù)的操作了，而是先更新了數(shù)據(jù)庫(kù)中的數(shù)據(jù)，此時(shí)，緩存依然有效，所以，并發(fā)的查詢操作拿的是沒(méi)有更新的數(shù)據(jù)，但是，更新操作馬上讓緩存的失效了，后續(xù)的查詢操作再把數(shù)據(jù)從數(shù)據(jù)庫(kù)中拉出來(lái)。而不會(huì)像文章開(kāi)頭的那個(gè)邏輯產(chǎn)生的問(wèn)題，后續(xù)的查詢操作一直都在取老的數(shù)據(jù)。

這是標(biāo)準(zhǔn)的design pattern，包括Facebook的論文《Scaling Memcache at Facebook》也使用了這個(gè)策略。為什么不是寫(xiě)完數(shù)據(jù)庫(kù)后更新緩存？你可以看一下Quora上的這個(gè)問(wèn)答《Why does Facebook use delete to remove the key-value pair in Memcached instead of updating the Memcached during write request to the backend?》，主要是怕兩個(gè)并發(fā)的寫(xiě)操作導(dǎo)致臟數(shù)據(jù)。

那么，是不是Cache Aside這個(gè)就不會(huì)有并發(fā)問(wèn)題了？不是的，比如，一個(gè)是讀操作，但是沒(méi)有命中緩存，然后就到數(shù)據(jù)庫(kù)中取數(shù)據(jù)，此時(shí)來(lái)了一個(gè)寫(xiě)操作，寫(xiě)完數(shù)據(jù)庫(kù)后，讓緩存失效，然后，之前的那個(gè)讀操作再把老的數(shù)據(jù)放進(jìn)去，所以，會(huì)造成臟數(shù)據(jù)。

但，這個(gè)case理論上會(huì)出現(xiàn)，不過(guò)，實(shí)際上出現(xiàn)的概率可能非常低，因?yàn)檫@個(gè)條件需要發(fā)生在讀緩存時(shí)緩存失效，而且并發(fā)著有一個(gè)寫(xiě)操作。而實(shí)際上數(shù)據(jù)庫(kù)的寫(xiě)操作會(huì)比讀操作慢得多，而且還要鎖表，而讀操作必需在寫(xiě)操作前進(jìn)入數(shù)據(jù)庫(kù)操作，而又要晚于寫(xiě)操作更新緩存，所有的這些條件都具備的概率基本并不大。

所以，這也就是Quora上的那個(gè)答案里說(shuō)的，要么通過(guò)2PC或是Paxos協(xié)議保證一致性，要么就是拼命的降低并發(fā)時(shí)臟數(shù)據(jù)的概率，而Facebook使用了這個(gè)降低概率的玩法，因?yàn)?PC太慢，而Paxos太復(fù)雜。當(dāng)然，最好還是為緩存設(shè)置上過(guò)期時(shí)間。

Read/Write Through Pattern

我們可以看到，在上面的Cache Aside套路中，我們的應(yīng)用代碼需要維護(hù)兩個(gè)數(shù)據(jù)存儲(chǔ)，一個(gè)是緩存（Cache），一個(gè)是數(shù)據(jù)庫(kù)（Repository）。所以，應(yīng)用程序比較啰嗦。而Read/Write Through套路是把更新數(shù)據(jù)庫(kù)（Repository）的操作由緩存自己代理了，所以，對(duì)于應(yīng)用層來(lái)說(shuō)，就簡(jiǎn)單很多了?？梢岳斫鉃?，應(yīng)用認(rèn)為后端就是一個(gè)單一的存儲(chǔ)，而存儲(chǔ)自己維護(hù)自己的Cache。

Read Through

Read Through 套路就是在查詢操作中更新緩存，也就是說(shuō)，當(dāng)緩存失效的時(shí)候（過(guò)期或LRU換出），Cache Aside是由調(diào)用方負(fù)責(zé)把數(shù)據(jù)加載入緩存，而Read Through則用緩存服務(wù)自己來(lái)加載，從而對(duì)應(yīng)用方是透明的。

Write Through

Write Through 套路和Read Through相仿，不過(guò)是在更新數(shù)據(jù)時(shí)發(fā)生。當(dāng)有數(shù)據(jù)更新的時(shí)候，如果沒(méi)有命中緩存，直接更新數(shù)據(jù)庫(kù)，然后返回。如果命中了緩存，則更新緩存，然后再由Cache自己更新數(shù)據(jù)庫(kù)（這是一個(gè)同步操作）

下圖自來(lái)Wikipedia的Cache詞條。其中的Memory你可以理解為就是我們例子里的數(shù)據(jù)庫(kù)。

Write Behind Caching Pattern

Write Behind 又叫 Write Back。一些了解Linux操作系統(tǒng)內(nèi)核的同學(xué)對(duì)write back應(yīng)該非常熟悉，這不就是Linux文件系統(tǒng)的Page Cache的算法嗎？是的，你看基礎(chǔ)這玩意全都是相通的。所以，基礎(chǔ)很重要，我已經(jīng)不是一次說(shuō)過(guò)基礎(chǔ)很重要這事了。

Write Back套路，一句說(shuō)就是，在更新數(shù)據(jù)的時(shí)候，只更新緩存，不更新數(shù)據(jù)庫(kù)，而我們的緩存會(huì)異步地批量更新數(shù)據(jù)庫(kù)。這個(gè)設(shè)計(jì)的好處就是讓數(shù)據(jù)的I/O操作飛快無(wú)比（因?yàn)橹苯硬僮鲀?nèi)存嘛），因?yàn)楫惒剑瑆rite backg還可以合并對(duì)同一個(gè)數(shù)據(jù)的多次操作，所以性能的提高是相當(dāng)可觀的。

但是，其帶來(lái)的問(wèn)題是，數(shù)據(jù)不是強(qiáng)一致性的，而且可能會(huì)丟失（我們知道Unix/Linux非正常關(guān)機(jī)會(huì)導(dǎo)致數(shù)據(jù)丟失，就是因?yàn)檫@個(gè)事）。在軟件設(shè)計(jì)上，我們基本上不可能做出一個(gè)沒(méi)有缺陷的設(shè)計(jì)，就像算法設(shè)計(jì)中的時(shí)間換空間，空間換時(shí)間一個(gè)道理，有時(shí)候，強(qiáng)一致性和高性能，高可用和高性性是有沖突的。軟件設(shè)計(jì)從來(lái)都是取舍Trade-Off。

另外，Write Back實(shí)現(xiàn)邏輯比較復(fù)雜，因?yàn)樗枰猼rack有哪數(shù)據(jù)是被更新了的，需要刷到持久層上。操作系統(tǒng)的write back會(huì)在僅當(dāng)這個(gè)cache需要失效的時(shí)候，才會(huì)被真正持久起來(lái)，比如，內(nèi)存不夠了，或是進(jìn)程退出了等情況，這又叫l(wèi)azy write。

在wikipedia上有一張write back的流程圖，基本邏輯如下：

再多嘮叨一些 1）上面講的這些Design Pattern，其實(shí)并不是軟件架構(gòu)里的mysql數(shù)據(jù)庫(kù)和memcache/redis的更新策略，這些東西都是計(jì)算機(jī)體系結(jié)構(gòu)里的設(shè)計(jì)，比如CPU的緩存，硬盤(pán)文件系統(tǒng)中的緩存，硬盤(pán)上的緩存，數(shù)據(jù)庫(kù)中的緩存?；旧蟻?lái)說(shuō)，這些緩存更新的設(shè)計(jì)模式都是非常老古董的，而且歷經(jīng)長(zhǎng)時(shí)間考驗(yàn)的策略，所以這也就是，工程學(xué)上所謂的Best Practice，遵從就好了。

2）有時(shí)候，我們覺(jué)得能做宏觀的系統(tǒng)架構(gòu)的人一定是很有經(jīng)驗(yàn)的，其實(shí)，宏觀系統(tǒng)架構(gòu)中的很多設(shè)計(jì)都來(lái)源于這些微觀的東西。比如，云計(jì)算中的很多虛擬化技術(shù)的原理，和傳統(tǒng)的虛擬內(nèi)存不是很像么？Unix下的那些I/O模型，也放大到了架構(gòu)里的同步異步的模型，還有Unix發(fā)明的管道不就是數(shù)據(jù)流式計(jì)算架構(gòu)嗎？TCP的好些設(shè)計(jì)也用在不同系統(tǒng)間的通訊中，仔細(xì)看看這些微觀層面，你會(huì)發(fā)現(xiàn)有很多設(shè)計(jì)都非常精妙……所以，請(qǐng)?jiān)试S我在這里放句觀點(diǎn)鮮明的話——如果你要做好架構(gòu)，首先你得把計(jì)算機(jī)體系結(jié)構(gòu)以及很多老古董的基礎(chǔ)技術(shù)吃透了。

3）在軟件開(kāi)發(fā)或設(shè)計(jì)中，我非常建議在之前先去參考一下已有的設(shè)計(jì)和思路，看看相應(yīng)的guideline，best practice或design pattern，吃透了已有的這些東西，再?zèng)Q定是否要重新發(fā)明輪子。千萬(wàn)不要似是而非地，想當(dāng)然的做軟件設(shè)計(jì)。

4）上面，我們沒(méi)有考慮緩存（Cache）和持久層（Repository）的整體事務(wù)的問(wèn)題。比如，更新Cache成功，更新數(shù)據(jù)庫(kù)失敗了怎么嗎？或是反過(guò)來(lái)。關(guān)于這個(gè)事，如果你需要強(qiáng)一致性，你需要使用“兩階段提交協(xié)議”——prepare, commit/rollback，比如Java 7 的XAResource，還有MySQL 5.7的 XA Transaction，有些cache也支持XA，比如EhCache。當(dāng)然，XA這樣的強(qiáng)一致性的玩法會(huì)導(dǎo)致性能下降，關(guān)于分布式的事務(wù)的相關(guān)話題，你可以看看《分布式系統(tǒng)的事務(wù)處理》一文。

以上，就是陳皓大佬的文章，站在大佬的肩膀上，lemon 也有些思考，作者一開(kāi)始就提出：

先刪除緩存，然后再更新數(shù)據(jù)庫(kù)，而后續(xù)的操作會(huì)把數(shù)據(jù)再裝載的緩存中。然而，這個(gè)是邏輯是錯(cuò)誤的。

隨后提出的 Facebook 采用的Cache Aside Pattern 的最佳實(shí)踐，其實(shí)本質(zhì)上是?先更新數(shù)據(jù)庫(kù)，后刪緩存?，雖然有可能出錯(cuò)，但概率比較低，更能被接受。

暫且不說(shuō)這個(gè)結(jié)論對(duì)不對(duì)，咱們自己對(duì)比下，這兩種一致性策略：

? 先更新數(shù)據(jù)庫(kù)，再刪除緩存。就是前面的 Cache aside

? 先刪除緩存，再更新數(shù)據(jù)庫(kù)

有人要問(wèn)了，為什么都是刪除緩存，而不是更新呢？

因?yàn)楦侣闊┭剑∵€容易出錯(cuò)，不如直接刪除。而且你每次更新完，后面不一定有請(qǐng)求來(lái)讀，浪費(fèi)時(shí)間。還不如讓后續(xù)讀請(qǐng)求來(lái)更新，簡(jiǎn)單高效，這和 Linux 進(jìn)程復(fù)制的 copy on write 有異曲同工之妙。

其實(shí)，誰(shuí)好誰(shuí)壞，選擇哪一個(gè)，并沒(méi)有那么絕對(duì)，兩種策略在并發(fā)情況下，都存在不一致的可能。目前工程應(yīng)用上，對(duì)?先刪除緩存，再更新數(shù)據(jù)庫(kù)?有兩個(gè)主要優(yōu)化：

延時(shí)雙刪（「緩存刪了又怕被污染，延時(shí)再刪一次」）
異步更新緩存（「基于訂閱binlog的同步機(jī)制，阿里的canal、騰訊的Mysync，并發(fā)緩存更新串行化」）

通過(guò)這些措施，?先刪除緩存，再更新數(shù)據(jù)庫(kù)? ，也能滿足業(yè)務(wù)的一致性要求，所以，沒(méi)有完美的解決方案，只有適合業(yè)務(wù)場(chǎng)景，最終選擇哪個(gè)，是在一致性和性能之間的Trade-Off，或者，老板說(shuō)哪個(gè)好，我就用哪個(gè)。

責(zé)任編輯：龐桂玉來(lái)源：數(shù)據(jù)庫(kù)開(kāi)發(fā)