自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開(kāi)發(fā)者社區(qū)

WOT技術(shù)大會(huì)

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線學(xué)習(xí)

文章資源問(wèn)答課堂專欄直播

51CTO

鴻蒙開(kāi)發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開(kāi)發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開(kāi)發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

賬號(hào)設(shè)置退出

JVM內(nèi)部緩存選型？一篇文章為你解答疑惑

作者：青峰科技 2020-07-09 08:42:23

云計(jì)算虛擬化

簡(jiǎn)單的在HashMap的鏈?zhǔn)椒ㄔ黾有碌囊眯纬梢粋€(gè)鏈表，即是一個(gè)HashMap又是一個(gè)鏈表，這樣輸出即有序，也可以根據(jù)訪問(wèn)來(lái)動(dòng)態(tài)調(diào)整順序，達(dá)到FIFO或者LRU的特點(diǎn)。

jvm內(nèi)部緩存有哪些

原生Java

簡(jiǎn)單的在HashMap的鏈?zhǔn)椒ㄔ黾有碌囊眯纬梢粋€(gè)鏈表，即是一個(gè)HashMap又是一個(gè)鏈表，這樣輸出即有序，也可以根據(jù)訪問(wèn)來(lái)動(dòng)態(tài)調(diào)整順序，達(dá)到FIFO或者LRU的特點(diǎn)。

使用ConcurrentHashMap作為緩存，沒(méi)有淘汰功能或者手動(dòng)淘汰。但是尋找效率較高，而且線程安全

可以明顯看出這個(gè)存在的問(wèn)題，線程不安全，需要額外加鎖，功能結(jié)構(gòu)單一，沒(méi)有過(guò)期時(shí)間容易存在內(nèi)存泄露

Guava

因?yàn)長(zhǎng)inkedHashMap存在的問(wèn)題，所以大神們?cè)诖嘶A(chǔ)上造出了Guava

既然HashMap線程不安全，那么就使用CurrentHashMap(類似不完全是)，為了實(shí)現(xiàn)過(guò)期那么就給數(shù)據(jù)加上時(shí)間戳標(biāo)志，為了實(shí)現(xiàn)寫(xiě)后過(guò)期，讀后過(guò)期，這兩種配置，就使用了多條隊(duì)列分別代表讀和寫(xiě)

EHCHCHED

Ehcache支持持久化到本地磁盤(pán)，Guava不可以;
Ehcache有現(xiàn)成的集群解決方案，Guava沒(méi)有。不過(guò)個(gè)人感覺(jué)比較雞肋，對(duì)JVM級(jí)別的緩存來(lái)講太重了
Ehcache jar包龐大，Guava Cache只是Guava jar包中的工具之一，而且后者遠(yuǎn)遠(yuǎn)小于Ehcache;
兩種緩存當(dāng)緩存過(guò)期或者沒(méi)有命中的時(shí)候都可以通過(guò)load接口重載數(shù)據(jù)，調(diào)用方式略有不同。兩者的主要區(qū)別是Ehcache的緩存load的時(shí)候，允許用戶返回null，而Guava Cache則不允許返回為null，因?yàn)镚uava Cache是根據(jù)value的值是否為null來(lái)判斷是否需要load，所以不允許返回為null，但是使用的時(shí)候可以使用空對(duì)象替換。不允許返回null是一個(gè)很好的考慮;
Ehcache有內(nèi)存占用大小統(tǒng)計(jì)，Guava Cache沒(méi)有，需要自己開(kāi)發(fā);
Ehcache在put緩存的時(shí)候，對(duì)K、V都做了包裝，對(duì)GC有一定影響。

Caffeine

Caffeine是Spring 5默認(rèn)支持的Cache，可見(jiàn)Spring對(duì)它的看重，那么Spring為什么喜新厭舊的拋棄Guava而追求Caffeine呢?

緩存的淘汰策略是為了預(yù)測(cè)哪些數(shù)據(jù)在短期內(nèi)最可能被再次用到，從而提升緩存的命中率。LRU由于實(shí)現(xiàn)簡(jiǎn)單、高效的運(yùn)行時(shí)表現(xiàn)以及在常規(guī)的使用場(chǎng)景下有不錯(cuò)的命中率，或許是目前最佳的實(shí)現(xiàn)途徑。但 LRU 通過(guò)歷史數(shù)據(jù)來(lái)預(yù)測(cè)未來(lái)是局限的，它會(huì)認(rèn)為最后到來(lái)的數(shù)據(jù)是最可能被再次訪問(wèn)的，從而給與它最高的優(yōu)先級(jí)。這樣就意味著淘汰真正熱點(diǎn)數(shù)據(jù)，為了解決這個(gè)問(wèn)題業(yè)界運(yùn)用一些數(shù)據(jù)結(jié)構(gòu)上的改進(jìn)巧妙的解決這個(gè)問(wèn)題。

下面的內(nèi)容是轉(zhuǎn)載的一篇譯文，如果需要查看譯文原文，請(qǐng)點(diǎn)擊這里,英語(yǔ)好的同學(xué)也可以直接查看英文原作。

緩存是提升性能的通用方法，現(xiàn)在大多數(shù)的緩存實(shí)現(xiàn)都使用了經(jīng)典的技術(shù)。這篇文章中，我們會(huì)發(fā)掘Caffeine中的現(xiàn)代的實(shí)現(xiàn)方法。Caffeine是一個(gè)開(kāi)源的Java緩存庫(kù)，它能提供高命中率和出色的并發(fā)能力。期望讀者們能被這些想法激發(fā)，進(jìn)而將它們應(yīng)用到任何你喜歡的編程語(yǔ)言中。

驅(qū)逐策略

緩存的驅(qū)逐策略是為了預(yù)測(cè)哪些數(shù)據(jù)在短期內(nèi)最可能被再次用到，從而提升緩存的命中率。由于簡(jiǎn)潔的實(shí)現(xiàn)、高效的運(yùn)行時(shí)表現(xiàn)以及在常規(guī)的使用場(chǎng)景下有不錯(cuò)的命中率，LRU(Least Recently Used)策略或許是最流行的驅(qū)逐策略。但LRU通過(guò)歷史數(shù)據(jù)來(lái)預(yù)測(cè)未來(lái)是局限的，它會(huì)認(rèn)為最后到來(lái)的數(shù)據(jù)是最可能被再次訪問(wèn)的，從而給與它最高的優(yōu)先級(jí)。

現(xiàn)代緩存擴(kuò)展了對(duì)歷史數(shù)據(jù)的使用，結(jié)合就近程度(recency)和訪問(wèn)頻次(frequency)來(lái)更好的預(yù)測(cè)數(shù)據(jù)。其中一種保留歷史信息的方式是使用popularity sketch(一種壓縮、概率性的數(shù)據(jù)結(jié)構(gòu))來(lái)從一大堆訪問(wèn)事件中定位頻繁的訪問(wèn)者?？梢詤⒖糃ountMin Sketch算法，它由計(jì)數(shù)矩陣和多個(gè)哈希方法實(shí)現(xiàn)。發(fā)生一次讀取時(shí)，矩陣中每行對(duì)應(yīng)的計(jì)數(shù)器增加計(jì)數(shù)，估算頻率時(shí)，取數(shù)據(jù)對(duì)應(yīng)是所有行中計(jì)數(shù)的最小值。這個(gè)方法讓我們從空間、效率、以及適配矩陣的長(zhǎng)寬引起的哈希碰撞的錯(cuò)誤率上做權(quán)衡。

Window TinyLFU(W-TinyLFU)算法將sketch作為過(guò)濾器，當(dāng)新來(lái)的數(shù)據(jù)比要驅(qū)逐的數(shù)據(jù)高頻時(shí)，這個(gè)數(shù)據(jù)才會(huì)被緩存接納。這個(gè)許可窗口給予每個(gè)數(shù)據(jù)項(xiàng)積累熱度的機(jī)會(huì)，而不是立即過(guò)濾掉。這避免了持續(xù)的未命中，特別是在突然流量暴漲的的場(chǎng)景中，一些短暫的重復(fù)流量就不會(huì)被長(zhǎng)期保留。為了刷新歷史數(shù)據(jù)，一個(gè)時(shí)間衰減進(jìn)程被周期性或增量的執(zhí)行，給所有計(jì)數(shù)器減半。

對(duì)于長(zhǎng)期保留的數(shù)據(jù)，W-TinyLFU使用了分段LRU(Segmented LRU，縮寫(xiě)SLRU)策略。起初，一個(gè)數(shù)據(jù)項(xiàng)存儲(chǔ)被存儲(chǔ)在試用段(probationary segment)中，在后續(xù)被訪問(wèn)到時(shí)，它會(huì)被提升到保護(hù)段(protected segment)中(保護(hù)段占總?cè)萘康?0%)。保護(hù)段滿后，有的數(shù)據(jù)會(huì)被淘汰回試用段，這也可能級(jí)聯(lián)的觸發(fā)試用段的淘汰。這套機(jī)制確保了訪問(wèn)間隔小的熱數(shù)據(jù)被保存下來(lái)，而被重復(fù)訪問(wèn)少的冷數(shù)據(jù)則被回收。

如圖中數(shù)據(jù)庫(kù)和搜索場(chǎng)景的結(jié)果展示，通過(guò)考慮就近程度和頻率能大大提升LRU的表現(xiàn)。一些高級(jí)的策略，像ARC，LIRS和W-TinyLFU都提供了接近最理想的命中率。想看更多的場(chǎng)景測(cè)試，請(qǐng)查看相應(yīng)的論文，也可以在使用simulator來(lái)測(cè)試自己的場(chǎng)景。

過(guò)期策略

過(guò)期的實(shí)現(xiàn)里，往往每個(gè)數(shù)據(jù)項(xiàng)擁有不同的過(guò)期時(shí)間。因?yàn)槿萘康南拗?，過(guò)期后數(shù)據(jù)需要被懶淘汰，否則這些已過(guò)期的臟數(shù)據(jù)會(huì)污染到整個(gè)緩存。一般緩存中會(huì)啟用專有的清掃線程周期性的遍歷清理緩存。這個(gè)策略相比在每次讀寫(xiě)操作時(shí)按照過(guò)期時(shí)間排序的優(yōu)先隊(duì)列來(lái)清理過(guò)期緩存要好，因?yàn)楹笈_(tái)線程隱藏了的過(guò)期數(shù)據(jù)清除的時(shí)間開(kāi)銷。

鑒于大多數(shù)場(chǎng)景里不同數(shù)據(jù)項(xiàng)使用的都是固定的過(guò)期時(shí)長(zhǎng)，Caffien采用了統(tǒng)一過(guò)期時(shí)間的方式。這個(gè)限制讓用O(1)的有序隊(duì)列組織數(shù)據(jù)成為可能。針對(duì)數(shù)據(jù)的寫(xiě)后過(guò)期，維護(hù)了一個(gè)寫(xiě)入順序隊(duì)列，針對(duì)讀后過(guò)期，維護(hù)了一個(gè)讀取順序隊(duì)列。緩存能復(fù)用驅(qū)逐策略下的隊(duì)列以及下面將要介紹的并發(fā)機(jī)制，讓過(guò)期的數(shù)據(jù)項(xiàng)在緩存的維護(hù)階段被拋棄掉。

并發(fā)

由于在大多數(shù)的緩存策略中，數(shù)據(jù)的讀取都會(huì)伴隨對(duì)緩存狀態(tài)的寫(xiě)操作，并發(fā)的緩存讀取被視為一個(gè)難點(diǎn)問(wèn)題。傳統(tǒng)的解決方式是用同步鎖。這可以通過(guò)將緩存的數(shù)據(jù)劃成多個(gè)分區(qū)來(lái)進(jìn)行鎖拆分優(yōu)化。不幸的是熱點(diǎn)數(shù)據(jù)所持有的鎖會(huì)比其他數(shù)據(jù)更常的被占有，在這種場(chǎng)景下鎖拆分的性能提升也就沒(méi)那么好了。當(dāng)單個(gè)鎖的競(jìng)爭(zhēng)成為瓶頸后，接下來(lái)的經(jīng)典的優(yōu)化方式是只更新單個(gè)數(shù)據(jù)的元數(shù)據(jù)信息，以及使用隨機(jī)采樣、基于FIFO的驅(qū)逐策略來(lái)減少數(shù)據(jù)操作。這些策略會(huì)帶來(lái)高性能的讀和低性能的寫(xiě)，同時(shí)在選擇驅(qū)逐對(duì)象時(shí)也比較困難。

另一種可行方案來(lái)自于數(shù)據(jù)庫(kù)理論，通過(guò)提交日志的方式來(lái)擴(kuò)展寫(xiě)的性能。寫(xiě)入操作先記入日志中，隨后異步的批量執(zhí)行，而不是立即寫(xiě)入到數(shù)據(jù)結(jié)構(gòu)中。這種思想可以應(yīng)用到緩存中，執(zhí)行哈希表的操作，將操作記錄到緩沖區(qū)，然后在合適的時(shí)機(jī)執(zhí)行緩沖區(qū)中的內(nèi)容。這個(gè)策略依然需要同步鎖或者tryLock，不同的是把對(duì)鎖的競(jìng)爭(zhēng)轉(zhuǎn)移到對(duì)緩沖區(qū)的追加寫(xiě)上。

在Caffeine中，有一組緩沖區(qū)被用來(lái)記錄讀寫(xiě)。一次訪問(wèn)首先會(huì)被因線程而異的哈希到stripped ring buffer上，當(dāng)檢測(cè)到競(jìng)爭(zhēng)時(shí)，緩沖區(qū)會(huì)自動(dòng)擴(kuò)容。一個(gè)ring buffer容量滿載后，會(huì)觸發(fā)異步的執(zhí)行操作，而后續(xù)的對(duì)該ring buffer的寫(xiě)入會(huì)被丟棄，直到這個(gè)ring buffer可被使用。雖然因?yàn)閞ing buffer容量滿而無(wú)法被記錄該訪問(wèn)，但緩存值依然會(huì)返回給調(diào)用方。這種策略信息的丟失不會(huì)帶來(lái)大的影響，因?yàn)閃-TinyLFU能識(shí)別出我們希望保存的熱點(diǎn)數(shù)據(jù)。通過(guò)使用因線程而異的哈希算法替代在數(shù)據(jù)項(xiàng)的鍵上做哈希，緩存避免了瞬時(shí)的熱點(diǎn)key的競(jìng)爭(zhēng)問(wèn)題。

寫(xiě)數(shù)據(jù)時(shí)，采用更傳統(tǒng)的并發(fā)隊(duì)列，每次變更會(huì)引起一次立即的執(zhí)行。雖然數(shù)據(jù)的損失是不可接受的，但我們?nèi)匀挥泻芏喾椒梢詠?lái)優(yōu)化寫(xiě)緩沖區(qū)。所有類型的緩沖區(qū)都被多個(gè)的線程寫(xiě)入，但卻通過(guò)單個(gè)線程來(lái)執(zhí)行。這種多生產(chǎn)者/單個(gè)消費(fèi)者的模式允許了更簡(jiǎn)單、高效的算法來(lái)實(shí)現(xiàn)。

緩沖區(qū)和細(xì)粒度的寫(xiě)帶來(lái)了單個(gè)數(shù)據(jù)項(xiàng)的操作亂序的競(jìng)態(tài)條件。插入、讀取、更新、刪除都可能被各種順序的重放，如果這個(gè)策略控制的不合適，則可能引起懸垂索引。解決方案是通過(guò)狀態(tài)機(jī)來(lái)定義單個(gè)數(shù)據(jù)項(xiàng)的生命周期。

在基準(zhǔn)測(cè)試中，緩沖區(qū)隨著哈希表的增長(zhǎng)而增長(zhǎng)，它的的使用相對(duì)更節(jié)省資源。讀的性能隨著CPU的核數(shù)線性增長(zhǎng)，是哈希表吞吐量的33%。寫(xiě)入有10%的性能損耗，這是因?yàn)楦鹿１頃r(shí)的競(jìng)爭(zhēng)是最主要的開(kāi)銷。

Caffeine

舉個(gè)例子

Mysql的緩存池，內(nèi)部實(shí)現(xiàn)是一個(gè)LRU，但是其內(nèi)部有個(gè)中間點(diǎn),指向倒數(shù)3/8，一半是old區(qū)，另一半是young區(qū)，新數(shù)據(jù)插入是直接插入young區(qū)，這樣就保護(hù)了真正的老數(shù)據(jù)不會(huì)被沖刷掉。

多級(jí)隊(duì)列的形式

LFU結(jié)合頻率這一屬性給予更好的預(yù)測(cè)緩存數(shù)據(jù)是否在未來(lái)被使用。

但是傳統(tǒng)LFU有其局限性：

LFU實(shí)現(xiàn)需要維護(hù)大而復(fù)雜的元數(shù)據(jù)(頻次統(tǒng)計(jì)數(shù)據(jù)等)

大多數(shù)實(shí)際工作負(fù)載中，訪問(wèn)頻率隨著時(shí)間的推移而發(fā)生根本變化，而傳統(tǒng)LFU無(wú)法周期衰減頻率

傳統(tǒng)LFU的實(shí)現(xiàn)通過(guò)外接一個(gè)HashMap統(tǒng)計(jì)頻率，但是HashMap存在Hash沖突，這會(huì)導(dǎo)致頻率統(tǒng)計(jì)的不準(zhǔn)確。

為了解決這些問(wèn)題，Caffeine提出一種新的算法W-TinyLFU，它可以解決頻率統(tǒng)計(jì)不準(zhǔn)確以及訪問(wèn)頻率衰減問(wèn)題。這個(gè)方法讓我們從空間、效率、以及適配矩陣的長(zhǎng)寬引起的哈希碰撞的錯(cuò)誤率上做權(quán)衡。

傳統(tǒng)Hash存在Hash沖突的問(wèn)題，使用LFU算法時(shí)候記錄頻率的話一旦發(fā)生hash沖突可能造成頻率的統(tǒng)計(jì)錯(cuò)誤。

W-TinyLFU算法使用一種Count-Min Sketch解決維護(hù)空間大的問(wèn)題，類似布隆過(guò)濾器，降低沖突可能性，原理是多次hash分散開(kāi)來(lái)，取最小值作為頻率，一次Hash沖突的幾率是1%的話，4次Hash的幾率就是1%的4次方，大大降低的沖突可能性。

在Caffeine中為了實(shí)現(xiàn)Count-Min Sketch它在其中村政府，存放四個(gè)算法

其中randomSeed是一個(gè)隨機(jī)數(shù)，sampleSize=開(kāi)始設(shè)置的緩存最大樹(shù)*10;table= 最大緩存數(shù)最接近的2的次方數(shù)(100的話是128，50是64);tableMask = table.length-1;size=0

在向緩存put數(shù)據(jù)的時(shí)候會(huì)調(diào)用

這個(gè)AddTask是一個(gè)Runnable，其中run方法會(huì)調(diào)用increment方法。

Caffeine比guava好在哪

W-TinyLFU

傳統(tǒng)的LFU受時(shí)間周期的影響比較大。所以各種LFU的變種出現(xiàn)了，基于時(shí)間周期進(jìn)行衰減，或者在最近某個(gè)時(shí)間段內(nèi)的頻率。同樣的LFU也會(huì)使用額外空間記錄每一個(gè)數(shù)據(jù)訪問(wèn)的頻率，即使數(shù)據(jù)沒(méi)有在緩存中也需要記錄，所以需要維護(hù)的額外空間很大。

可以試想我們對(duì)這個(gè)維護(hù)空間建立一個(gè)hashMap，每個(gè)數(shù)據(jù)項(xiàng)都會(huì)存在這個(gè)hashMap中，當(dāng)數(shù)據(jù)量特別大的時(shí)候，這個(gè)hashMap也會(huì)特別大。

再回到LRU，我們的LRU也不是那么一無(wú)是處，LRU可以很好的應(yīng)對(duì)突發(fā)流量的情況，因?yàn)樗恍枰塾?jì)數(shù)據(jù)頻率。

所以W-TinyLFU結(jié)合了LRU和LFU，以及其他的算法的一些特點(diǎn)。

頻率記錄

首先要說(shuō)到的就是頻率記錄的問(wèn)題，我們要實(shí)現(xiàn)的目標(biāo)是利用有限的空間可以記錄隨時(shí)間變化的訪問(wèn)頻率。在W-TinyLFU中使用Count-Min Sketch記錄我們的訪問(wèn)頻率，而這個(gè)也是布隆過(guò)濾器的一種變種。

如果需要記錄一個(gè)值，那我們需要通過(guò)多種Hash算法對(duì)其進(jìn)行處理hash，然后在對(duì)應(yīng)的hash算法的記錄中+1，為什么需要多種hash算法呢?由于這是一個(gè)壓縮算法必定會(huì)出現(xiàn)沖突，比如我們建立一個(gè)Long的數(shù)組，通過(guò)計(jì)算出每個(gè)數(shù)據(jù)的hash的位置。比如張三和李四，他們兩有可能hash值都是相同，比如都是1那Long[1]這個(gè)位置就會(huì)增加相應(yīng)的頻率，張三訪問(wèn)1萬(wàn)次，李四訪問(wèn)1次那Long[1]這個(gè)位置就是1萬(wàn)零1，如果取李四的訪問(wèn)評(píng)率的時(shí)候就會(huì)取出是1萬(wàn)零1，但是李四命名只訪問(wèn)了1次啊，為了解決這個(gè)問(wèn)題，所以用了多個(gè)hash算法可以理解為long[][]二維數(shù)組的一個(gè)概念，比如在第一個(gè)算法張三和李四沖突了，但是在第二個(gè)，第三個(gè)中很大的概率不沖突，比如一個(gè)算法大概有1%的概率沖突，那四個(gè)算法一起沖突的概率是1%的四次方。通過(guò)這個(gè)模式我們?nèi)±钏牡脑L問(wèn)率的時(shí)候取所有算法中，李四訪問(wèn)最低頻率的次數(shù)。所以他的名字叫Count-Min Sketch。

面試jvm內(nèi)部緩存選型？一篇文章為你解答疑惑

這里和以前的做個(gè)對(duì)比，簡(jiǎn)單的舉個(gè)例子:如果一個(gè)hashMap來(lái)記錄這個(gè)頻率，如果我有100個(gè)數(shù)據(jù)，那這個(gè)HashMap就得存儲(chǔ)100個(gè)這個(gè)數(shù)據(jù)的訪問(wèn)頻率。哪怕我這個(gè)緩存的容量是1，因?yàn)長(zhǎng)fu的規(guī)則我必須全部記錄這個(gè)100個(gè)數(shù)據(jù)的訪問(wèn)頻率。如果有更多的數(shù)據(jù)我就有記錄更多的。

在Count-Min Sketch中，我這里直接說(shuō)caffeine中的實(shí)現(xiàn)吧(在FrequencySketch這個(gè)類中),如果你的緩存大小是100，他會(huì)生成一個(gè)long數(shù)組大小是和100最接近的2的冪的數(shù)，也就是128。而這個(gè)數(shù)組將會(huì)記錄我們的訪問(wèn)頻率。在caffeine中規(guī)定頻率最大為15，15的二進(jìn)制位1111，總共是4位，而Long型是64位。所以每個(gè)Long型可以放16種算法，但是caffeine并沒(méi)有這么做，只用了四種hash算法，每個(gè)Long型被分為四段，每段里面保存的是四個(gè)算法的頻率。這樣做的好處是可以進(jìn)一步減少Hash沖突，原先128大小的hash，就變成了128X4。

一個(gè)Long的結(jié)構(gòu)如下:

我們的4個(gè)段分為A,B,C,D，在后面我也會(huì)這么叫它們。而每個(gè)段里面的四個(gè)算法我叫他s1,s2,s3,s4。下面舉個(gè)例子如果要添加一個(gè)訪問(wèn)50的數(shù)字頻率應(yīng)該怎么做?我們這里用size=100來(lái)舉例。

首先確定50這個(gè)hash是在哪個(gè)段里面，通過(guò)hash & 3(3的二進(jìn)制是11)必定能獲得小于4的數(shù)字，假設(shè)hash & 3=0，那就在A段。
對(duì)50的hash再用其他hash算法再做一次hash，得到long數(shù)組的位置，也就是在長(zhǎng)度128數(shù)組中的位置。假設(shè)用s1算法得到1，s2算法得到3，s3算法得到4，s4算法得到0。
因?yàn)镾1算法得到的是1，所以在long[1]的A段里面的s1位置進(jìn)行+1,簡(jiǎn)稱1As1加1，然后在3As2加1，在4As3加1，在0As4加1。

面試jvm內(nèi)部緩存選型？一篇文章為你解答疑惑

這個(gè)時(shí)候有人會(huì)質(zhì)疑頻率最大為15的這個(gè)是否太小?沒(méi)關(guān)系在這個(gè)算法中，比如size等于100，如果他全局提升了size*10也就是1000次就會(huì)全局除以2衰減，衰減之后也可以繼續(xù)增加，這個(gè)算法再W-TinyLFU的論文中證明了其可以較好的適應(yīng)時(shí)間段的訪問(wèn)頻率。

讀寫(xiě)性能

在guava cache中我們說(shuō)過(guò)其讀寫(xiě)操作中夾雜著過(guò)期時(shí)間的處理，也就是你在一次Put操作中有可能還會(huì)做淘汰操作，所以其讀寫(xiě)性能會(huì)受到一定影響，可以看上面的圖中，caffeine的確在讀寫(xiě)操作上面完爆guava cache。主要是因?yàn)樵赾affeine，對(duì)這些事件的操作是通過(guò)異步操作，他將事件提交至隊(duì)列，這里的隊(duì)列的數(shù)據(jù)結(jié)構(gòu)是RingBuffer,不清楚的可以看看這篇文章,你應(yīng)該知道的高性能無(wú)鎖隊(duì)列Disruptor。然后會(huì)通過(guò)默認(rèn)的ForkJoinPool.commonPool()，或者自己配置線程池，進(jìn)行取隊(duì)列操作，然后在進(jìn)行后續(xù)的淘汰，過(guò)期操作。

當(dāng)然讀寫(xiě)也是有不同的隊(duì)列，在caffeine中認(rèn)為緩存讀比寫(xiě)多很多，所以對(duì)于寫(xiě)操作是所有線程共享一個(gè)Ringbuffer。

面試jvm內(nèi)部緩存選型？一篇文章為你解答疑惑

對(duì)于讀操作比寫(xiě)操作更加頻繁，進(jìn)一步減少競(jìng)爭(zhēng)，其為每個(gè)線程配備了一個(gè)RingBuffer：

數(shù)據(jù)淘汰策略

在caffeine所有的數(shù)據(jù)都在ConcurrentHashMap中，這個(gè)和guava cache不同，guava cache是自己實(shí)現(xiàn)了個(gè)類似ConcurrentHashMap的結(jié)構(gòu)。在caffeine中有三個(gè)記錄引用的LRU隊(duì)列:

Eden隊(duì)列:在caffeine中規(guī)定只能為緩存容量的%1,如果size=100,那這個(gè)隊(duì)列的有效大小就等于1。這個(gè)隊(duì)列中記錄的是新到的數(shù)據(jù)，防止突發(fā)流量由于之前沒(méi)有訪問(wèn)頻率，而導(dǎo)致被淘汰。比如有一部新劇上線，在最開(kāi)始其實(shí)是沒(méi)有訪問(wèn)頻率的，防止上線之后被其他緩存淘汰出去，而加入這個(gè)區(qū)域。伊甸區(qū)，最舒服最安逸的區(qū)域，在這里很難被其他數(shù)據(jù)淘汰。
Probation隊(duì)列:叫做緩刑隊(duì)列，在這個(gè)隊(duì)列就代表你的數(shù)據(jù)相對(duì)比較冷，馬上就要被淘汰了。這個(gè)有效大小為size減去eden減去protected。
Protected隊(duì)列:在這個(gè)隊(duì)列中，可以稍微放心一下了，你暫時(shí)不會(huì)被淘汰，但是別急，如果Probation隊(duì)列沒(méi)有數(shù)據(jù)了或者Protected數(shù)據(jù)滿了，你也將會(huì)被面臨淘汰的尷尬局面。當(dāng)然想要變成這個(gè)隊(duì)列，需要把Probation訪問(wèn)一次之后，就會(huì)提升為Protected隊(duì)列。這個(gè)有效大小為(size減去eden) X 80% 如果size =100，就會(huì)是79。

這三個(gè)隊(duì)列關(guān)系如下:

面試jvm內(nèi)部緩存選型？一篇文章為你解答疑惑

所有的新數(shù)據(jù)都會(huì)進(jìn)入Eden。
Eden滿了，淘汰進(jìn)入Probation。
如果在Probation中訪問(wèn)了其中某個(gè)數(shù)據(jù)，則這個(gè)數(shù)據(jù)升級(jí)為Protected。
如果Protected滿了又會(huì)繼續(xù)降級(jí)為Probation。

對(duì)于發(fā)生數(shù)據(jù)淘汰的時(shí)候，會(huì)從Probation中進(jìn)行淘汰。會(huì)把這個(gè)隊(duì)列中的數(shù)據(jù)隊(duì)頭稱為受害者，這個(gè)隊(duì)頭肯定是最早進(jìn)入的，按照LRU隊(duì)列的算法的話那他其實(shí)他就應(yīng)該被淘汰，但是在這里只能叫他受害者，這個(gè)隊(duì)列是緩刑隊(duì)列，代表馬上要給他行刑了。這里會(huì)取出隊(duì)尾叫候選者，也叫攻擊者。這里受害者會(huì)和攻擊者皇城PK決出我們應(yīng)該被淘汰的。

通過(guò)我們的Count-Min Sketch中的記錄的頻率數(shù)據(jù)有以下幾個(gè)判斷:

如果攻擊者大于受害者，那么受害者就直接被淘汰。
如果攻擊者<=5，那么直接淘汰攻擊者。這個(gè)邏輯在他的注釋中有解釋:

面試jvm內(nèi)部緩存選型？一篇文章為你解答疑惑

他認(rèn)為設(shè)置一個(gè)預(yù)熱的門(mén)檻會(huì)讓整體命中率更高。

其他情況，隨機(jī)淘汰。

責(zé)任編輯：武曉燕來(lái)源：今日頭條

jvm 內(nèi)部緩存

點(diǎn)贊

51CTO技術(shù)棧公眾號(hào)

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開(kāi)發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營(yíng)

^{<blockquote id="89edj"></blockquote>}

<style id="89edj"></style>

<button id="89edj"><style id="89edj"></style></button>