緩存與數(shù)據(jù)庫不一致,你遇到過嗎?
相信大家偶爾會遇到緩存與數(shù)據(jù)庫不一致的問題。今天聊聊這個話題。
數(shù)據(jù)庫主從,為什么會不一致?
先回顧下,無緩存時,數(shù)據(jù)庫主從不一致問題。
如上圖,發(fā)生的場景是,寫后立刻讀:
(1)主庫一個寫請求(主從沒同步完成);
(2)從庫接著一個讀請求,讀到了舊數(shù)據(jù);
(3)最后,主從同步完成;
導致的結(jié)果是:主動同步完成之前,會讀取到舊數(shù)據(jù)。
可以看到,主從不一致的影響時間很短,在主從同步完成后,就會讀到新數(shù)據(jù)。
緩存與數(shù)據(jù)庫,什么時候會不一致?
再看,引入緩存后,緩存和數(shù)據(jù)庫不一致問題。
如上圖,發(fā)生的場景也是,寫后立刻讀:
(1+2)先一個寫請求,淘汰緩存,寫數(shù)據(jù)庫;
(3+4+5)接著立刻一個讀請求,讀緩存,cache miss,讀從庫,寫緩存放入數(shù)據(jù),以便后續(xù)的讀能夠cache hit(主從同步?jīng)]有完成,緩存中放入了舊數(shù)據(jù));
(6)最后,主從同步完成;
導致的結(jié)果是:舊數(shù)據(jù)放入緩存,即使主從同步完成,后續(xù)仍然會從緩存一直讀取到舊數(shù)據(jù)。
可以看到,加入緩存后,導致的不一致影響時間會很長,并且最終也不會達到一致。
為什么會出現(xiàn)這類不一致?
可以看到,這里提到的緩存與數(shù)據(jù)庫數(shù)據(jù)不一致,根本上是由數(shù)據(jù)庫主從不一致引起的。當主庫上發(fā)生寫操作之后,從庫binlog同步的時間間隔內(nèi),讀請求,可能導致有舊數(shù)據(jù)入緩存。
假如主從不一致沒法徹底解決,引入緩存之后,binlog同步時間間隔內(nèi),也無法避免讀舊數(shù)據(jù)。
但是,有沒有辦法做到,即使引入緩存,不一致不會比“不引入緩存”更糟呢?這是更為實際的優(yōu)化目標。
思路轉(zhuǎn)化為:在從庫同步完成之后,如果有舊數(shù)據(jù)入緩存,應該及時把這個舊數(shù)據(jù)淘汰掉。
緩存與數(shù)據(jù)庫不一致,可以怎么優(yōu)化?
如上圖所述,在并發(fā)讀寫導致緩存中讀入了臟數(shù)據(jù)之后:
(6)主從同步;
(7)通過工具訂閱從庫的binlog,這里能夠最準確的知道,從庫數(shù)據(jù)同步完成的時間;畫外音:本圖畫的訂閱工具是DTS,可以是cannal,也可以自己訂閱和分析binlog。
(8)從庫執(zhí)行完寫操作,向緩存再次發(fā)起刪除,淘汰這段時間內(nèi)可能寫入緩存的舊數(shù)據(jù);
如此這般,至少能夠保證,引入緩存之后,主從不一致,不會比沒有引入緩存更壞。
【本文為51CTO專欄作者“58沈劍”原創(chuàng)稿件,轉(zhuǎn)載請聯(lián)系原作者】