手寫最簡單的LRU算法
1 什么是LRU
LRU(Least recently used)最近最少使用,它的核心思想是“如果數(shù)據(jù)最近被訪問過,那么將來被訪問的幾率也更高”。因此 LRU 算法會根據(jù)數(shù)據(jù)的歷史訪問記錄來進行排序,如果空間不足,就會淘汰掉最近最少使用的數(shù)據(jù)。
2 LRU 實現(xiàn)原理
由于 LRU 算法會將最近使用的數(shù)據(jù)優(yōu)先級上升,因此需要數(shù)據(jù)結(jié)構(gòu)支持排序,鏈表非常合適。
為什么不考慮數(shù)組呢?
由于 LRU 算法,一般都會應(yīng)用在訪問比較頻繁的場景,因此,對數(shù)據(jù)的移動會頻繁,而數(shù)組一旦移動,需要將移動到值的位置后面的所有數(shù)據(jù)的位置全部改變,效率比較低,不推薦使用。
3 雙向鏈表之LinkedHashMap
前面我們分析到 LRU 的算法實現(xiàn),可以使用鏈表實現(xiàn),java 中 LinkedHashMap 就是一個雙向鏈表。
LinkedHashMap是HashMap的子類,在HashMap數(shù)據(jù)結(jié)構(gòu)的基礎(chǔ)上,還維護著一個雙向鏈表鏈接所有entry,這個鏈表定義了迭代順序,通常是數(shù)據(jù)插入的順序。
我們來看看LinkedHashMap的源碼:
從源碼中的定義可以看到,accessOrder 屬性可以指定遍歷 LinkedHashMap 的順序,true 表示按照訪問順序,false 表示按照插入順序,默認(rèn)為 false。
由于LRU對訪問順序敏感,因此使用true來簡單驗證一下:
- public class LRUTest {
- public static void main(String[] args) {
- LinkedHashMap<String, Object> map = new LinkedHashMap<>(16, 0.75f, true);
- map.put("a", 1);
- map.put("b", 2);
- map.put("c", 3);
- System.out.println("before get " + map);
- map.get("a");
- System.out.println("after get" + map);
- }}
運行結(jié)果如下:
- before get {a=1, b=2, c=3}
- after get{b=2, c=3, a=1}
可以看到通過 accessOrder = true,可以讓 LinkedHashMap 按照訪問順序進行排序。
那么 LinkedHashMap 是怎么做的呢?
我們看下get方法
- public V get(Object key) {
- Node<K,V> e;
- // 獲取node
- if ((e = getNode(hash(key), key)) == null)
- return null;
- // 如果 accessOrder = true,則執(zhí)行afterNodeAccess方法
- if (accessOrder)
- afterNodeAccess(e);
- return e.value;
- }
再看下afterNodeAccess方法,發(fā)現(xiàn)進行移動節(jié)點,到此移動節(jié)點的原理我們了解了
- void afterNodeAccess(Node<K,V> e) { // move node to last
- LinkedHashMap.Entry<K,V> last;
- if (accessOrder && (last = tail) != e) {
- LinkedHashMap.Entry<K,V> p = (LinkedHashMap.Entry<K,V>)e, b = p.before, a = p.after; p.after = null; if (b == null)
- head = a; else
- b.after = a; if (a != null)
- a.before = b; else
- last = b;
- if (last == null)
- head = p; else {
- p.before = last;
- last.after = p; } tail = p; ++modCount; }}
目前,如果使用 LinkedHashMap 做LRU,還有一個問題困擾著我們,就是如果容量有限,該如何淘汰舊數(shù)據(jù)?
我們回過頭看看 put 方法
- public V put(K key, V value) {
- return putVal(hash(key), key, value, false, true);
- }
- final V putVal(int hash, K key, V value, boolean onlyIfAbsent, boolean evict) {
- Node<K,V>[] tab; Node<K,V> p; int n, i;
- if ((tab = table) == null || (n = tab.length) == 0)
- n = (tab = resize()).length;
- if ((p = tab[i = (n - 1) & hash]) == null)
- tab[i] = newNode(hash, key, value, null);
- else {
- Node<K,V> e; K k;
- if (p.hash == hash &&
- ((k = p.key) == key || (key != null && key.equals(k))))
- e = p;
- else if (p instanceof TreeNode)
- e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
- else {
- for (int binCount = 0; ; ++binCount) {
- if ((e = p.next) == null) {
- p.next = newNode(hash, key, value, null);
- if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
- treeifyBin(tab, hash);
- break;
- }
- if (e.hash == hash &&
- ((k = e.key) == key || (key != null && key.equals(k))))
- break;
- p = e;
- }
- }
- if (e != null) { // existing mapping for key
- V oldValue = e.value;
- if (!onlyIfAbsent || oldValue == null)
- e.value = value;
- afterNodeAccess(e);
- return oldValue;
- }
- }
- ++modCount;
- if (++size > threshold)
- resize();
- afterNodeInsertion(evict);
- return null;
- }
- void afterNodeInsertion(boolean evict) { // possibly remove eldest
- LinkedHashMap.Entry<K,V> first;
- if (evict && (first = head) != null && removeEldestEntry(first)) {
- K key = first.key;
- removeNode(hash(key), key, null, false, true);
- }
- }
從put方法中逐步看下來,最終我們發(fā)現(xiàn),如果 removeEldestEntry(first) 方法返回true,則會移除 head,這樣就淘汰了最近都沒使用的數(shù)據(jù)。完全符合LRU。
4 最簡單的LRU實現(xiàn)
根據(jù)上面分析,我們可以如下實現(xiàn)一個最簡單的LRU
- public class LRUCache<K,V> extends LinkedHashMap<K,V> {
- private int cacheSize;
- public LRUCache(int cacheSize) {
- // 注意:此處需要讓 accessOrder = true
- super(cacheSize, 0.75f, true);
- this.cacheSize = cacheSize;
- }
- /**
- * 判斷元素個數(shù)是否超過緩存的容量,超過需要移除
- */
- @Override
- protected boolean removeEldestEntry(Map.Entry<K, V> eldest) {
- return size() > cacheSize;
- }
- }