自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項目管理免費題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設(shè)置退出

架構(gòu)師面試常考！緩存三大問題及解決方案！

作者：IT技術(shù)分享 2018-11-12 12:12:15

開發(fā) 前端

隨著互聯(lián)網(wǎng)系統(tǒng)發(fā)展的逐步完善，提高系統(tǒng)的qps，目前的絕大部分系統(tǒng)都增加了緩存機制從而避免請求過多的直接與數(shù)據(jù)庫操作從而造成系統(tǒng)瓶頸，極大的提升了用戶體驗和系統(tǒng)穩(wěn)定性，但同時也帶來了一些需要注意的問題。

1. 緩存來由

隨著互聯(lián)網(wǎng)系統(tǒng)發(fā)展的逐步完善，提高系統(tǒng)的qps，目前的絕大部分系統(tǒng)都增加了緩存機制從而避免請求過多的直接與數(shù)據(jù)庫操作從而造成系統(tǒng)瓶頸，極大的提升了用戶體驗和系統(tǒng)穩(wěn)定性。

2. 緩存問題

雖然使用緩存給系統(tǒng)帶來了一定的質(zhì)的提升，但同時也帶來了一些需要注意的問題。

(1) 緩存穿透

緩存穿透是指查詢一個一定不存在的數(shù)據(jù)，因為緩存中也無該數(shù)據(jù)的信息，則會直接去數(shù)據(jù)庫層進行查詢，從系統(tǒng)層面來看像是穿透了緩存層直接達到db，從而稱為緩存穿透，沒有了緩存層的保護，這種查詢一定不存在的數(shù)據(jù)對系統(tǒng)來說可能是一種危險，如果有人惡意用這種一定不存在的數(shù)據(jù)來頻繁請求系統(tǒng)，不，準(zhǔn)確的說是攻擊系統(tǒng)，請求都會到達數(shù)據(jù)庫層導(dǎo)致db癱瘓從而引起系統(tǒng)故障。

(2) 解決方案

緩存穿透業(yè)內(nèi)的解決方案已經(jīng)比較成熟，主要常用的有以下幾種：

bloom filter：類似于哈希表的一種算法，用所有可能的查詢條件生成一個bitmap，在進行數(shù)據(jù)庫查詢之前會使用這個bitmap進行過濾，如果不在其中則直接過濾，從而減輕數(shù)據(jù)庫層面的壓力。guava中有實現(xiàn)BloomFilter算法。
空值緩存：一種比較簡單的解決辦法，在第一次查詢完不存在的數(shù)據(jù)后，將該key與對應(yīng)的空值也放入緩存中，只不過設(shè)定為較短的失效時間，例如幾分鐘，這樣則可以應(yīng)對短時間的大量的該key攻擊，設(shè)置為較短的失效時間是因為該值可能業(yè)務(wù)無關(guān)，存在意義不大，且該次的查詢也未必是攻擊者發(fā)起，無過久存儲的必要，故可以早點失效。

(3) 緩存雪崩

在普通的緩存系統(tǒng)中一般例如redis、memcache等中，我們會給緩存設(shè)置一個失效時間，但是如果所有的緩存的失效時間相同，那么在同一時間失效時，所有系統(tǒng)的請求都會發(fā)送到數(shù)據(jù)庫層，db可能無法承受如此大的壓力導(dǎo)致系統(tǒng)崩潰。

(4) 解決方案

線程互斥：只讓一個線程構(gòu)建緩存，其他線程等待構(gòu)建緩存的線程執(zhí)行完，重新從緩存獲取數(shù)據(jù)才可以，每個時刻只有一個線程在執(zhí)行請求，減輕了db的壓力，但缺點也很明顯，降低了系統(tǒng)的qps。

交錯失效時間：這種方法時間比較簡單粗暴，既然在同一時間失效會造成請求過多雪崩，那我們錯開不同的失效時間即可從一定長度上避免這種問題，在緩存進行失效時間設(shè)置的時候，從某個適當(dāng)?shù)闹涤蛑须S機一個時間作為失效時間即可。

(5) 緩存擊穿

緩存擊穿實際上是緩存雪崩的一個特例，大家使用過微博的應(yīng)該都知道，微博有一個熱門話題的功能，用戶對于熱門話題的搜索量往往在一些時刻會大大的高于其他話題，這種我們成為系統(tǒng)的“熱點“，由于系統(tǒng)中對這些熱點的數(shù)據(jù)緩存也存在失效時間，在熱點的緩存到達失效時間時，此時可能依然會有大量的請求到達系統(tǒng)，沒有了緩存層的保護，這些請求同樣的會到達db從而可能引起故障。擊穿與雪崩的區(qū)別即在于擊穿是對于特定的熱點數(shù)據(jù)來說，而雪崩是全部數(shù)據(jù)。

(6) 解決方案

二級緩存：對于熱點數(shù)據(jù)進行二級緩存，并對于不同級別的緩存設(shè)定不同的失效時間，則請求不會直接擊穿緩存層到達數(shù)據(jù)庫。

這里參考了阿里雙11萬億流量的緩存擊穿解決方案，解決此問題的關(guān)鍵在于熱點訪問。由于熱點可能隨著時間的變化而變化，針對固定的數(shù)據(jù)進行特殊緩存是不能起到治本作用的，結(jié)合LRU算法能夠較好的幫我們解決這個問題。那么LRU是什么，下面粗略的介紹一下。

LRU(Least recently used，最近最少使用)算法根據(jù)數(shù)據(jù)的歷史訪問記錄來進行淘汰數(shù)據(jù)，其核心思想是“如果數(shù)據(jù)最近被訪問過，那么將來被訪問的幾率也更高”。最常見的實現(xiàn)是使用一個鏈表保存緩存數(shù)據(jù)，如下圖所示

這個鏈表即是我們的緩存結(jié)構(gòu)，緩存處理步驟為

首先將新數(shù)據(jù)放入鏈表的頭部
在進行數(shù)據(jù)插入的過程中，如果檢測到鏈表中有數(shù)據(jù)被再次訪問也就是有請求再次訪問這些數(shù)據(jù)，那么就其插入的鏈表的頭部，因為它們相對其他數(shù)據(jù)來說可能是熱點數(shù)據(jù)，具有保留時間更久的意義
最后當(dāng)鏈表數(shù)據(jù)放滿時將底部的數(shù)據(jù)淘汰，也就是不常訪問的數(shù)據(jù)

LRU-K算法，其實上面的算法也是該算法的特例情況即LRU-1，上面的算法存在較多的不合理性，在實際的應(yīng)用過程中采用該算法進行了改進，例如偶然的數(shù)據(jù)影響會造成命中率較低，比如某個數(shù)據(jù)即將到達底部即將被淘汰，但由于一次的請求又放入了頭部，此后再無該數(shù)據(jù)的請求，那么該數(shù)據(jù)的繼續(xù)存在其實是不合理的，針對這類情況LRU-K算法擁有更好的解決措施。結(jié)構(gòu)圖如下所示：

LRU-K需要多維護一個隊列或者更多，用于記錄所有緩存數(shù)據(jù)被訪問的歷史。只有當(dāng)數(shù)據(jù)的訪問次數(shù)達到K次的時候，才將數(shù)據(jù)放入緩存。當(dāng)需要淘汰數(shù)據(jù)時，LRU-K會淘汰第K次訪問時間距當(dāng)前時間最大的數(shù)據(jù)。

第一步添加數(shù)據(jù)照樣放入第一個隊列的頭部。如果數(shù)據(jù)在該隊列里訪問沒有達到K次(該數(shù)值根據(jù)具體系統(tǒng)qps來定)則會繼續(xù)到達鏈表底部直至淘汰;如果該數(shù)據(jù)在隊列中時訪問次數(shù)達到了K次，那么它會被加入到接下來的2級(具體需要幾級結(jié)構(gòu)也同樣結(jié)合系統(tǒng)分析)鏈表中，按照時間順序在2級鏈表中排列
接下來2級鏈表中的操作與上面算法相同，鏈表中的數(shù)據(jù)如果再次被訪問則移到頭部，鏈表滿時，底部數(shù)據(jù)淘汰

相比LRU，LRU-K需要多維護一個隊列，用于記錄所有緩存數(shù)據(jù)被訪問的歷史，所以需要更多的內(nèi)存空間來用來構(gòu)建緩存，但優(yōu)點也很明顯，較好的降低了數(shù)據(jù)的污染率提高了緩存的命中率，對于系統(tǒng)來說可以用一定的硬件成本來換取系統(tǒng)性能也不失為一種辦法。當(dāng)然還有更為復(fù)雜的緩存結(jié)構(gòu)算法，點擊LRU算法即可學(xué)習(xí)，例如Two Queues和Mutil Queues等等，本文不過多贅述，只為讀者提供一種解決思路。

責(zé)任編輯：趙寧寧來源：今日頭條

架構(gòu)師緩存數(shù)據(jù)庫

51CTO技術(shù)棧公眾號

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營