緩存最關(guān)心哪些指標(biāo)?
大家好,我是冰河~~
往往開(kāi)始做一個(gè)項(xiàng)目時(shí),不會(huì)過(guò)多的考慮性能問(wèn)題,以快速迭代功能為主。后續(xù)隨著業(yè)務(wù)的快速發(fā)展,系統(tǒng)運(yùn)行的性能越來(lái)越慢,此時(shí),就需要對(duì)系統(tǒng)進(jìn)行相應(yīng)的優(yōu)化,而效果最顯著的就是給系統(tǒng)加上緩存。
那么,問(wèn)題來(lái)了,當(dāng)你為系統(tǒng)加上緩存時(shí),有沒(méi)有考慮過(guò)使用緩存需要注意哪些事項(xiàng)呢?
緩存命中率
緩存命中率是從緩存中讀取數(shù)據(jù)的次數(shù)與總讀取次數(shù)的比率,命中率越高越好。緩存命中率=從緩存中讀取次數(shù) / (總讀取次數(shù) (從緩存中讀取次數(shù) + 從慢速設(shè)備上讀取次數(shù)))。這是一個(gè)非常重要的監(jiān)控指標(biāo),如果做緩存,則應(yīng)通過(guò)監(jiān)控這個(gè)指標(biāo)來(lái)看緩存是否工作良好。
緩存類型
緩存類型總體上來(lái)看,可以分為:堆緩存、堆外緩存、磁盤(pán)緩存和分布式緩存。
堆內(nèi)存
使用Java堆內(nèi)存來(lái)存儲(chǔ)對(duì)象。使用堆緩存的好處是沒(méi)有序列化/反序列化,是最快的緩存。缺點(diǎn)也很明顯,當(dāng)緩存的數(shù)據(jù)量很大時(shí),GC(垃圾回收)暫停時(shí)間會(huì)變長(zhǎng),存儲(chǔ)容量受限于堆空間大小。一般通過(guò)軟引用/弱引用來(lái)存儲(chǔ)緩存對(duì)象。即當(dāng)堆內(nèi)存不足時(shí),可以強(qiáng)制回收這部分內(nèi)存釋放堆內(nèi)存空間。一般使用堆緩存存儲(chǔ)較熱的數(shù)據(jù)。可以使用Guava Cache、Ehcache 3.x、 MapDB實(shí)現(xiàn)。
堆外內(nèi)存
即緩存數(shù)據(jù)存儲(chǔ)在堆外內(nèi)存,可以減少GC暫停時(shí)間(堆對(duì)象轉(zhuǎn)移到堆外,GC掃描和移動(dòng)的對(duì)象變少了),可以支持更多的緩存空間(只受機(jī)器內(nèi)存大小限制,不受堆空間的影響)。但是,讀取數(shù)據(jù)時(shí)需要序列化/反序列化。因此,會(huì)比堆緩存慢很多。可以使用Ehcache 3.x、 MapDB實(shí)現(xiàn)。
磁盤(pán)緩存
即緩存數(shù)據(jù)存儲(chǔ)在磁盤(pán)上,在JVM重啟時(shí)數(shù)據(jù)還存在,而堆/堆外緩存數(shù)據(jù)會(huì)丟失,需要重新加載。可以使用Ehcache 3.x、MapDB實(shí)現(xiàn)。
分布式緩存
分布式緩存可以使用ehcache-clustered(配合Terracotta server)實(shí)現(xiàn)Java進(jìn)程間分布式緩存。也可以使用Memcached、Redis實(shí)現(xiàn)。
使用分布式緩存時(shí),有兩種模式如下:
- 單機(jī)模式:存儲(chǔ)最熱的數(shù)據(jù)到堆緩存,相對(duì)熱的數(shù)據(jù)到堆外緩存,不熱的數(shù)據(jù)到磁盤(pán)緩存。
- 集群模式:存儲(chǔ)最熱的數(shù)據(jù)到堆緩存,相對(duì)熱的數(shù)據(jù)到對(duì)外緩存,全量數(shù)據(jù)到分布式緩存。
緩存回收策略
緩存的回收策略總體上來(lái)說(shuō)包含:基于空間的回收策略、基于容量(空間)的回收策略、基于時(shí)間的回收策略和基于對(duì)象引用的回收策略。
基于空間
基于空間指緩存設(shè)置了存儲(chǔ)空間,如設(shè)置為10MB,當(dāng)達(dá)到存儲(chǔ)空間上限時(shí),按照一定的策略移除數(shù)據(jù)。
基于容量
基于容量指緩存設(shè)置了最大大小,當(dāng)緩存的條目超過(guò)最大大小時(shí),按照一定的策略移除舊數(shù)據(jù)。
基于時(shí)間
TTL(Time To Live):存活期,即緩存數(shù)據(jù)從創(chuàng)建開(kāi)始直到到期的一個(gè)時(shí)間段(不管在這個(gè)時(shí)間段內(nèi)有沒(méi)有被訪問(wèn),緩存數(shù)據(jù)都將過(guò)期)。TTI(Time To Idle):空閑期,即緩存數(shù)據(jù)多久沒(méi)被訪問(wèn)后移除緩存的時(shí)間。
基于對(duì)象引用
軟引用:如果一個(gè)對(duì)象是軟引用,則當(dāng)JVM堆內(nèi)存不足時(shí),垃圾回收器可以回收這些對(duì)象。軟引用適合用來(lái)做緩存,從而當(dāng)JVM堆內(nèi)存不足時(shí),可以回收這些對(duì)象騰出一些空間供強(qiáng)引用對(duì)象使用,從而避免OOM。弱引用:當(dāng)垃圾回收器回收內(nèi)存時(shí),如果發(fā)現(xiàn)弱引用,則將它立即回收。相對(duì)于軟引用,弱引用有更短的生命周期。
注意:只有在沒(méi)有其他強(qiáng)引用對(duì)象引用弱引用/軟引用對(duì)象時(shí),垃圾回收時(shí)才回收該引用。即如果有一個(gè)對(duì)象(不是弱引用/軟引用對(duì)象)引用了弱引用/軟引用對(duì)象,那么垃圾回收時(shí)不會(huì)回收該弱引用/軟引用對(duì)象。
回收算法
使用基于空間和基于容量的緩存會(huì)使用一定的策略移除舊數(shù)據(jù),通常包含:FIFO算法、LRU算法和LFU算法。
- FIFO(First In First Out):先進(jìn)先出算法,即先放入緩存的先被移除。
- LRU(Least Recently Used):最近最少使用算法,時(shí)間時(shí)間距離現(xiàn)在最久的那個(gè)被移除。
- LFU(Least Frequently Used):最不常用算法,一定時(shí)間段內(nèi)使用次數(shù)(頻率)最少的那個(gè)被移除。
實(shí)際應(yīng)用中基于LRU的緩存居多。
好了,今天就到這兒吧,我是冰河,我們下期見(jiàn)~~
本文轉(zhuǎn)載自微信公眾號(hào)「冰河技術(shù)」,可以通過(guò)以下二維碼關(guān)注。轉(zhuǎn)載本文請(qǐng)聯(lián)系冰河技術(shù)公眾號(hào)。