Redis存儲(chǔ)總是心里沒(méi)底?你大概漏了這些數(shù)據(jù)結(jié)構(gòu)原理
本期內(nèi)容則會(huì)著重講講Redis內(nèi)存數(shù)據(jù)結(jié)構(gòu)與編碼,弄清Redis內(nèi)部到底是如何支持這5種數(shù)據(jù)類(lèi)型的。
一、Redis內(nèi)存數(shù)據(jù)結(jié)構(gòu)與編碼
想要弄清楚Redis內(nèi)部如何支持5種數(shù)據(jù)類(lèi)型,也就是要弄清Redis到底是使用什么樣的數(shù)據(jù)結(jié)構(gòu)來(lái)存儲(chǔ)、查找我們?cè)O(shè)置在內(nèi)存中的數(shù)據(jù)。
雖然我們使用5種數(shù)據(jù)類(lèi)型來(lái)緩存數(shù)據(jù),但是Redis會(huì)根據(jù)我們存儲(chǔ)數(shù)據(jù)的不同而選用不同的數(shù)據(jù)結(jié)構(gòu)和編碼。
這些數(shù)據(jù)類(lèi)型在內(nèi)存中的數(shù)據(jù)結(jié)構(gòu)和編碼有很多種,隨著我們存儲(chǔ)的數(shù)據(jù)類(lèi)型的不同、數(shù)據(jù)量的大小不同都會(huì)引起內(nèi)存數(shù)據(jù)結(jié)構(gòu)的動(dòng)態(tài)調(diào)整。
本文只是做數(shù)據(jù)結(jié)構(gòu)和編碼的一般性介紹,不做過(guò)多細(xì)節(jié)討論,一方面是關(guān)于Redis源碼分析的資料網(wǎng)上有很多,還有一個(gè)原因就是Redis每一個(gè)版本的實(shí)現(xiàn)有很大差異,一旦展開(kāi)細(xì)節(jié)討論,每一個(gè)點(diǎn)每一個(gè)數(shù)據(jù)結(jié)構(gòu)都會(huì)很復(fù)雜,所以我們這里就不展開(kāi)討論這些,只是起到拋磚引玉作用。
1、OBJECT encoding key、DEBUG OBJECT key
我們知道使用type命令可以查看某個(gè)key是否是5種數(shù)據(jù)類(lèi)型之一,但是當(dāng)我們想查看某個(gè)key底層是使用哪種數(shù)據(jù)結(jié)構(gòu)和編碼來(lái)存儲(chǔ)的時(shí)候,可以使用OBJECT encoding命令。
同樣一個(gè)key,由于我們?cè)O(shè)置的值不同,Redis選用了不同的內(nèi)存數(shù)據(jù)結(jié)構(gòu)和編碼。雖然Redis提供String數(shù)據(jù)類(lèi)型,但是Redis會(huì)自動(dòng)識(shí)別我們cache的數(shù)據(jù)類(lèi)型是int還是String。
如果我們?cè)O(shè)置的是字符串,且這個(gè)字符串長(zhǎng)度不大于39字節(jié),那么將使用embstr來(lái)編碼;如果大于39字節(jié)將使用raw來(lái)編碼。Redis4.0將這個(gè)閥值擴(kuò)大了45個(gè)字節(jié)。
除了使用OBJECT encoding命令外,我們還可以使用DEBUG OBJECT命令來(lái)查看更多詳細(xì)信息。
DEBUG OBJECT能看到這個(gè)對(duì)象的refcount引用計(jì)數(shù)、serializedlength長(zhǎng)度、lru_seconds_idle時(shí)間,這些信息決定了這個(gè)key緩存清除策略。
2、簡(jiǎn)單動(dòng)態(tài)字符串(simple dynamic String)
簡(jiǎn)單動(dòng)態(tài)字符串簡(jiǎn)稱(chēng)SDS,在Redis中所有涉及到字符串的地方都是使用SDS實(shí)現(xiàn),當(dāng)然這里不包括字面量。SDS與傳統(tǒng)C字符串的區(qū)別就是SDS是結(jié)構(gòu)化的,它可以高效的處理分配、回收、長(zhǎng)度計(jì)算等問(wèn)題。
- struct sdshdr {
- unsigned int len;
- unsigned int free;
- char buf[];
- };
這是Redis3.0版本的sds.h頭文件定義,3.0.0之后變化比較大。len表示字符串長(zhǎng)度,free表示空間長(zhǎng)度,buf數(shù)組表示字符串。
SDS有很多優(yōu)點(diǎn),比如,獲取長(zhǎng)度的時(shí)間復(fù)雜度O(1),不需要遍歷所有charbuf[]組數(shù),直接返回len值。
- static inline size_t sdslen(const sds s) {
- struct sdshdr *sh = (void*)(s-(sizeof(struct sdshdr)));
- return sh->len;
- }
當(dāng)然還有空間分配檢查、空間預(yù)分配、空間惰性釋放等,這些都是SDS結(jié)構(gòu)化字符串帶來(lái)的強(qiáng)大的擴(kuò)展能力。
3、鏈表(linked list)
鏈表數(shù)據(jù)結(jié)構(gòu)我們是比較熟悉的,最大的特點(diǎn)就是節(jié)點(diǎn)的增、刪非常靈活。Redis List數(shù)據(jù)類(lèi)型底層就是基于鏈表來(lái)實(shí)現(xiàn)。這是Redis3.0實(shí)現(xiàn)。
- typedef struct list {
- listNode *head;
- listNode *tail;
- void *(*dup)(void *ptr);
- void (*free)(void *ptr);
- int (*match)(void *ptr, void *key);
- unsigned long len;
- } list;
- typedef struct listNode {
- struct listNode *prev;
- struct listNode *next;
- void *value;
- } listNode;
在Redis3.2.0版本的時(shí)候引入了quicklist鏈表結(jié)構(gòu),結(jié)合了linkedlist和ziplist的優(yōu)勢(shì)。
- typedef struct quicklist {
- quicklistNode *head;
- quicklistNode *tail;
- unsigned long count; /* total count of all entries in all ziplists */
- unsigned int len; /* number of quicklistNodes */
- int fill : 16; /* fill factor for individual nodes */
- unsigned int compress : 16; /* depth of end nodes not to compress;0=off */
- } quicklist;
- typedef struct quicklistNode {
- struct quicklistNode *prev;
- struct quicklistNode *next;
- unsigned char *zl;
- unsigned int sz; /* ziplist size in bytes */
- unsigned int count : 16; /* count of items in ziplist */
- unsigned int encoding : 2; /* RAW==1 or LZF==2 */
- unsigned int container : 2; /* NONE==1 or ZIPLIST==2 */
- unsigned int recompress : 1; /* was this node previous compressed? */
- unsigned int attempted_compress : 1; /* node can't compress; too small */
- unsigned int extra : 10; /* more bits to steal for future usage */
- } quicklistNode;
quicklist提供了靈活性同時(shí)也兼顧了ziplist的壓縮能力,quicklist->encoding指定了兩種壓縮算法。quickList->compress表示我們可以進(jìn)行quicklist node的深度壓縮能力。Redis提供了兩個(gè)有關(guān)于壓縮的配置:
- List-max-zipList-size:zipList長(zhǎng)度控制;
- List-compress-depth:控制鏈表兩端節(jié)點(diǎn)的壓縮個(gè)數(shù),越是靠近兩端的節(jié)點(diǎn)被訪(fǎng)問(wèn)的機(jī)率越大,所以可以將訪(fǎng)問(wèn)機(jī)率大的節(jié)點(diǎn)不壓縮,其他節(jié)點(diǎn)進(jìn)行壓縮。
對(duì)比Redis3.2的quicklist與Redis3.0,很明顯quicklist提供了更加豐富的壓縮功能。Redis3.0的版本是每個(gè)listnode直接緩存值,而quicklistnode還有強(qiáng)大的有關(guān)于壓縮能力。
- LPUSH list:products:mall 100 200 300
- (integer) 3
- OBJECT encoding list:products:mall
- "quicklist"
4、字典(dict)
dict字典是基于Hash算法來(lái)實(shí)現(xiàn),是Hash數(shù)據(jù)類(lèi)型的底層存儲(chǔ)數(shù)據(jù)結(jié)構(gòu)。我們來(lái)看下Redis3.0.0版本的dict.h頭文件定義:
- typedef struct dict {
- dictType *type;
- void *privdata;
- dictht ht[2];
- long rehashidx;
- int iterators;
- } dict;
- typedef struct dictht {
- dictEntry **table;
- unsigned long size;
- unsigned long sizemask;
- unsigned long used;
- } dictht;
- typedef struct dictEntry {
- void *key;
- union {
- void *val;
- uint64_t u64;
- int64_t s64;
- double d;
- } v;
- struct dictEntry *next;
- } dictEntry;
說(shuō)到Hash table有兩個(gè)東西是我們經(jīng)常會(huì)碰到的,首先就是Hash碰撞問(wèn)題,Redis dict是采用鏈地址法來(lái)解決,dictEntry->next就是指向下個(gè)沖突key的節(jié)點(diǎn)。
還有一個(gè)經(jīng)常碰到的就是rehash的問(wèn)題,提到rehash我們還是有點(diǎn)擔(dān)心性能的。那么Redis實(shí)現(xiàn)是非常巧妙的,采用惰性漸進(jìn)式rehash算法。
在dict struct里有一個(gè)ht[2]組數(shù),還有一個(gè)rehashidx索引。Redis進(jìn)行rehash的大致算法是這樣的:
首先會(huì)開(kāi)辟一個(gè)新的dictht空間,放在ht[2]索引上,此時(shí)將rehashidx設(shè)置為0,表示開(kāi)始進(jìn)入rehash階段,這個(gè)階段可能會(huì)持續(xù)很長(zhǎng)時(shí)間,rehashidx表示dictEntry個(gè)數(shù)。每次當(dāng)有對(duì)某個(gè)ht[1]索引中的key進(jìn)行訪(fǎng)問(wèn)時(shí),獲取、刪除、更新,Redis都會(huì)將當(dāng)前dictEntry索引中的所有key rehash到ht[2]字典中。一旦rehashidx=-1表示rehash結(jié)束。
5、跳表(skip list)
skip list是Zset的底層數(shù)據(jù)結(jié)構(gòu),有著高性能的查找排序能力。
我們都知道一般用來(lái)實(shí)現(xiàn)帶有排序的查找都是用Tree實(shí)現(xiàn),不管是各種變體的B Tree還是B+Tree,本質(zhì)都是用來(lái)做順序查找。
skip list實(shí)現(xiàn)起來(lái)簡(jiǎn)單,性能也與B Tree相接近。
- typedef struct zskiplistNode {
- robj *obj;
- double score;
- struct zskiplistNode *backward;
- struct zskiplistLevel {
- struct zskiplistNode *forward;
- unsigned int span;
- } level[];
- } zskiplistNode;
- typedef struct zskiplist {
- struct zskiplistNode *header, *tail;
- unsigned long length;
- int level;
- } zskiplist;
zskiplistNode->zskiplistLevel->span這個(gè)值記錄了當(dāng)前節(jié)點(diǎn)距離下個(gè)節(jié)點(diǎn)的跨度。每一個(gè)節(jié)點(diǎn)會(huì)有最大不超過(guò)zskiplist->level節(jié)點(diǎn)個(gè)數(shù),分別用來(lái)表示不同跨度與節(jié)點(diǎn)的距離。
每個(gè)節(jié)點(diǎn)會(huì)有多個(gè)forward向前指針,只有一個(gè)backward指針。每個(gè)節(jié)點(diǎn)會(huì)有對(duì)象__*obj__和score分值,每個(gè)分值都會(huì)按照順序排列。
6、整數(shù)集合(int set)
int set整數(shù)集合是set數(shù)據(jù)類(lèi)型的底層實(shí)現(xiàn)數(shù)據(jù)結(jié)構(gòu),它的特點(diǎn)和使用場(chǎng)景很明顯,只要我們使用的集合都是整數(shù)且在一定的范圍之內(nèi),都會(huì)使用整數(shù)集合編碼。
- SADD set:userid 100 200 300
- (integer) 3
- OBJECT encoding set:userid
- "intset"
int set使用一塊連續(xù)的內(nèi)存來(lái)存儲(chǔ)集合數(shù)據(jù),它是數(shù)組結(jié)構(gòu)不是鏈表結(jié)構(gòu)。
- typedef struct intset {
- uint32_t encoding;
- uint32_t length;
- int8_t contents[];
- } intset;
intset->encoding用來(lái)確定contents[]是什么類(lèi)型的整數(shù)編碼,以下三種值之一:
- #define INTSET_ENC_INT16 (sizeof(int16_t))
- #define INTSET_ENC_INT32 (sizeof(int32_t))
- #define INTSET_ENC_INT64 (sizeof(int64_t))
Redis會(huì)根據(jù)我們?cè)O(shè)置的值類(lèi)型動(dòng)態(tài)sizeof出一個(gè)對(duì)應(yīng)的空間大小。如果我們集合原來(lái)是int16,然后往集合里添加了int32整數(shù)將觸發(fā)升級(jí),一旦升級(jí)成功不會(huì)觸發(fā)降級(jí)操作。
7、壓縮表(zip list)
zip list壓縮表是List、Zset、Hash數(shù)據(jù)類(lèi)型的底層數(shù)據(jù)結(jié)構(gòu)之一。它是為了節(jié)省內(nèi)存通過(guò)壓縮數(shù)據(jù)存儲(chǔ)在一塊連續(xù)的內(nèi)存空間中。
- typedef struct zlentry {
- unsigned int prevrawlensize, prevrawlen;
- unsigned int lensize, len;
- unsigned int headersize;
- unsigned char encoding;
- unsigned char *p;
- } zlentry;
它最大的優(yōu)點(diǎn)就是壓縮空間,空間利用率很高。缺點(diǎn)就是一旦出現(xiàn)更新可能就是連鎖更新,因?yàn)閿?shù)據(jù)在內(nèi)容空間中都是連續(xù)的,最極端情況下就是可能出現(xiàn)順序連鎖擴(kuò)張。
壓縮列表會(huì)由多個(gè)zlentry節(jié)點(diǎn)組成,每一個(gè)zlentry記錄上一個(gè)節(jié)點(diǎn)長(zhǎng)度和大小,當(dāng)前節(jié)點(diǎn)長(zhǎng)度lensize和大小len包括編碼encoding。
這取決于業(yè)務(wù)場(chǎng)景,Redis提供了一組配置,專(zhuān)門(mén)用來(lái)針對(duì)不同的場(chǎng)景進(jìn)行閾值控制:
- hash-max-ziplist-entries 512
- hash-max-ziplist-value 64
- list-max-ziplist-entries 512
- list-max-ziplist-value 64
- zset-max-ziplist-entries 128
- zset-max-ziplist-value 64
上述配置分別用來(lái)配置ziplist作為Hash、List、Zset數(shù)據(jù)類(lèi)型的底層壓縮閾值控制。
8、Redis Object類(lèi)型與映射
Redis內(nèi)部每一種數(shù)據(jù)類(lèi)型都是對(duì)象化的,也就是我們所說(shuō)的5種數(shù)據(jù)類(lèi)型其實(shí)內(nèi)部都會(huì)對(duì)應(yīng)到Redis Object對(duì)象,然后再由Redis Object來(lái)包裝具體的存儲(chǔ)數(shù)據(jù)結(jié)構(gòu)和編碼。
- typedef struct redisObject {
- unsigned type:4;
- unsigned encoding:4;
- unsigned lru:REDIS_LRU_BITS;
- int refcount;
- void *ptr;
- } robj;
這是一個(gè)很OO的設(shè)計(jì),redisObject->type是5種數(shù)據(jù)類(lèi)型之一,redisObject->encoding是這個(gè)數(shù)據(jù)類(lèi)型所使用的數(shù)據(jù)結(jié)構(gòu)和編碼。
我們看下Redis提供的5種數(shù)據(jù)類(lèi)型與每一種數(shù)據(jù)類(lèi)型對(duì)應(yīng)的存儲(chǔ)數(shù)據(jù)結(jié)構(gòu)和編碼。
- /* Object types */
- #define REDIS_STRING 0
- #define REDIS_LIST 1
- #define REDIS_SET 2
- #define REDIS_ZSET 3
- #define REDIS_HASH 4
- #define REDIS_ENCODING_RAW 0
- #define REDIS_ENCODING_INT 1
- #define REDIS_ENCODING_HT 2
- #define REDIS_ENCODING_ZIPMAP 3
- #define REDIS_ENCODING_LINKEDLIST 4
- #define REDIS_ENCODING_ZIPLIST 5
- #define REDIS_ENCODING_INTSET 6
- #define REDIS_ENCODING_SKIPLIST 7
- #define REDIS_ENCODING_EMBSTR 8
REDIS_ENCODING_ZIPMAP 3這個(gè)編碼可以忽略了,在特定的情況下有性能問(wèn)題,在Redis 2.6版本之后已經(jīng)廢棄,為了兼容性保留。
圖是Redis 5種數(shù)據(jù)類(lèi)型與底層數(shù)據(jù)結(jié)構(gòu)和編碼的對(duì)應(yīng)關(guān)系:
但是這種對(duì)應(yīng)關(guān)系在每一個(gè)版本中都會(huì)有可能發(fā)生變化,這也是Redis Object的靈活性所在,有著OO的這種多態(tài)性。
- redisObject->refcount表示當(dāng)前對(duì)象的引用計(jì)數(shù),在Redis內(nèi)部為了節(jié)省內(nèi)存采用了共享對(duì)象的方法,當(dāng)某個(gè)對(duì)象被引用的時(shí)候這個(gè)refcount會(huì)加1,釋放的時(shí)候會(huì)減1。
- redisObject->lru表示當(dāng)前對(duì)象的空轉(zhuǎn)時(shí)長(zhǎng),也就是idle time,這個(gè)時(shí)間會(huì)是Redis lru算法用來(lái)釋放對(duì)象的時(shí)間依據(jù)??梢酝ㄟ^(guò)OBJECT idletime命令查看某個(gè)key的空轉(zhuǎn)時(shí)長(zhǎng)lru時(shí)間。
二、Redis內(nèi)存管理策略
Redis在服務(wù)端分別為不同的db index維護(hù)一個(gè)dict,這個(gè)dict稱(chēng)為key space鍵空間。每一個(gè)RedisClient只能屬于一個(gè)db index,在Redis服務(wù)端會(huì)維護(hù)每一個(gè)鏈接的RedisClient。
- typedef struct redisClient {
- uint64_t id;
- int fd;
- redisDb *db;
- } redisClient;
在服務(wù)端每一個(gè)Redis客戶(hù)端都會(huì)有一個(gè)指向redisDb的指針。
- typedef struct redisDb {
- dict *dict;
- dict *expires;
- dict *blocking_keys;
- dict *ready_keys;
- dict *watched_keys;
- struct evictionPoolEntry *eviction_pool;
- int id;
- long long avg_ttl;
- } redisDb;
key space鍵空間就是這里的redisDb->dict。redisDb->expires是維護(hù)所有鍵空間的每一個(gè)key的過(guò)期時(shí)間。
1、鍵過(guò)期時(shí)間、生存時(shí)間
對(duì)于一個(gè)key我們可以設(shè)置它多少秒、毫秒之后過(guò)期,也可以設(shè)置它在某個(gè)具體的時(shí)間點(diǎn)過(guò)期,后者是一個(gè)時(shí)間戳。例如:
- EXPIRE命令可以設(shè)置某個(gè)key多少秒之后過(guò)期;
- PEXPIRE命令可以設(shè)置某個(gè)key多少毫秒之后過(guò)期;
- EXPIREAT命令可以設(shè)置某個(gè)key在多少秒時(shí)間戳之后過(guò)期;
- PEXPIREAT命令可以設(shè)置某個(gè)key在多少毫秒時(shí)間戳之后過(guò)期;
- PERSIST命令可以移除鍵的過(guò)期時(shí)間。
其實(shí)上述命令最終都會(huì)被轉(zhuǎn)換成對(duì)PEXPIREAT命令。在redisDb->expires指向的key字典中維護(hù)著一個(gè)到期的毫秒時(shí)間戳。
TTL、PTTL可以通過(guò)這兩個(gè)命令查看某個(gè)key的過(guò)期秒、毫秒數(shù)。
Redis內(nèi)部有一個(gè)事件循環(huán),這個(gè)事件循環(huán)會(huì)檢查鍵的過(guò)期時(shí)間是否小于當(dāng)前時(shí)間,如果小于則會(huì)刪除這個(gè)鍵。
2、過(guò)期鍵刪除策略
在使用Redis的時(shí)候我們最關(guān)心的就是鍵是如何被刪除的,如何高效準(zhǔn)時(shí)地刪除某個(gè)鍵。其實(shí)Redis提供了兩個(gè)方案來(lái)完成這件事情:惰性刪除、定期刪除雙重刪除策略。
惰性刪除:當(dāng)我們?cè)L問(wèn)某個(gè)key的時(shí)候,Redis會(huì)檢查它是否過(guò)期。
- robj *lookupKeyRead(redisDb *db, robj *key) {
- robj *val;
- expireIfNeeded(db,key);
- val = lookupKey(db,key);
- if (val == NULL)
- server.stat_keyspace_misses++;
- else
- server.stat_keyspace_hits++;
- return val;
- }
- int expireIfNeeded(redisDb *db, robj *key) {
- mstime_t when = getExpire(db,key);
- mstime_t now;
- if (when < 0) return 0; /* No expire for this key */
- if (server.loading) return 0;
- now = server.lua_caller ? server.lua_time_start : mstime();
- if (server.masterhost != NULL) return now > when;
- /* Return when this key has not expired */
- if (now <= when) return 0;
- /* Delete the key */
- server.stat_expiredkeys++;
- propagateExpire(db,key);
- notifyKeyspaceEvent(REDIS_NOTIFY_EXPIRED,"expired",key,db->id);
- return dbDelete(db,key);
- }
定期刪除:Redis通過(guò)事件循環(huán),周期性地執(zhí)行key的過(guò)期刪除動(dòng)作。
- int serverCron(struct aeEventLoop *eventLoop, long long id, void *clientData) {
- /* Handle background operations on Redis databases. */
- databasesCron();
- }
- void databasesCron(void) {
- /* Expire keys by random sampling. Not required for slaves
- * as master will synthesize DELs for us. */
- if (server.active_expire_enabled && server.masterhost == NULL)
- activeExpireCycle(ACTIVE_EXPIRE_CYCLE_SLOW);
- }
要注意的是:
- 惰性刪除是每次只要有讀取、寫(xiě)入都會(huì)觸發(fā)惰性刪除代碼;
- 定期刪除是由Redis EventLoop來(lái)觸發(fā)的。Redis內(nèi)部很多維護(hù)性工作都是基于EventLoop。
3、AOF、RDB處理過(guò)期鍵策略
既然鍵會(huì)隨時(shí)存在過(guò)期問(wèn)題,那么涉及到持久化Redis是如何幫我們處理的?
當(dāng)Redis使用RDB方式持久化時(shí),每次持久化的時(shí)候就會(huì)檢查這些即將被持久化的key是否已經(jīng)過(guò)期,如果過(guò)期將直接忽略,持久化那些沒(méi)有過(guò)期的鍵。
當(dāng)Redis作為master主服務(wù)器啟動(dòng)的時(shí)候,載入rdb持久化鍵時(shí)也會(huì)檢查這些鍵是否過(guò)期,將忽略過(guò)期的鍵,只載入沒(méi)過(guò)期的鍵。
當(dāng)Redis使用AOF方式持久化時(shí),每次遇到過(guò)期的key Redis會(huì)追加一條DEL命令到AOF文件,也就是說(shuō)只要我們順序載入執(zhí)行AOF命令文件就會(huì)刪除過(guò)期的鍵。
如果Redis作為從服務(wù)器啟動(dòng)的話(huà),它一旦與master主服務(wù)器建立鏈接就會(huì)清空所有數(shù)據(jù)進(jìn)行完整同步。當(dāng)然新版本的Redis支持SYCN2的半同步,如果是已經(jīng)建立了master/slave主從同步之后,主服務(wù)器會(huì)發(fā)送DEL命令給所有從服務(wù)器執(zhí)行刪除操作。
4、Redis LRU算法
在使用Redis的時(shí)候我們會(huì)設(shè)置maxmemory選項(xiàng),64位的默認(rèn)是0不限制。線(xiàn)上的服務(wù)器必須要設(shè)置的,要不然很有可能導(dǎo)致Redis宿主服務(wù)器直接內(nèi)存耗盡,最后鏈接都上不去。
所以基本要設(shè)置兩個(gè)配置:
- maxmemory最大內(nèi)存閾值;
- maxmemory-policy到達(dá)閾值的執(zhí)行策略。
可以通過(guò)CONFIG GET maxmemory/maxmemory-policy分別查看這兩個(gè)配置值,也可以通過(guò)CONFIG SET去分別配置。
- maxmemory-policy有一組配置,可以用在很多場(chǎng)景下:
- noeviction:客戶(hù)端嘗試執(zhí)行會(huì)讓更多內(nèi)存被使用的命令直接報(bào)錯(cuò);
- allkeys-lru:在所有key里執(zhí)行l(wèi)ru算法;
- volatile-lru:在所有已經(jīng)過(guò)期的key里執(zhí)行l(wèi)ru算法;
- allkeys-random:在所有key里隨機(jī)回收;
- volatile-random:在已經(jīng)過(guò)期的key里隨機(jī)回收;
- volatile-ttl:回收已經(jīng)過(guò)期的key,并且優(yōu)先回收存活時(shí)間(TTL)較短的鍵。
關(guān)于cache的命中率可以通過(guò)info命令查看鍵空間的命中率和未命中率。
- # Stats
- keyspace_hits:33
- keyspace_misses:5
maxmemory在到達(dá)閾值的時(shí)候會(huì)采用一定的策略去釋放內(nèi)存,這些策略我們可以根據(jù)自己的業(yè)務(wù)場(chǎng)景來(lái)選擇,默認(rèn)是noeviction 。
Redis LRU算法有一個(gè)取樣的優(yōu)化機(jī)制,可以通過(guò)一定的取樣因子來(lái)加強(qiáng)回收的key的準(zhǔn)確度。CONFIG GET maxmemory-samples查看取樣配置,具體可以參考更加詳細(xì)的文章。
三、Redis持久化方式
Redis本身提供持久化功能,有兩種持久化機(jī)制,一種是數(shù)據(jù)持久化RDB,一種是命令持久化AOF,這兩種持久化方式各有優(yōu)缺點(diǎn),也可以組合使用。一旦組合使用,Redis在載入數(shù)據(jù)的時(shí)候會(huì)優(yōu)先載入aof文件,只有當(dāng)AOF持久化關(guān)閉的時(shí)候才會(huì)載入rdb文件。
1、RDB(Redis DataBase)
RDB是Redis數(shù)據(jù)庫(kù),Redis會(huì)根據(jù)一個(gè)配置來(lái)觸發(fā)持久化:
- #save <seconds> <changes>
- save 900 1
- save 300 10
- save 60 10000
- CONFIG GET save
- 1) "save"
- 2) "3600 1 300 100 60 10000"
表示在多少秒之類(lèi)的變化次數(shù),一旦達(dá)到這個(gè)觸發(fā)條件Redis將觸發(fā)持久化動(dòng)作。
Redis在執(zhí)行持久化的時(shí)候有兩種模式BGSAVE、SAVE:
- BGSAVE是后臺(tái)保存,Redis會(huì)fork出一個(gè)子進(jìn)程來(lái)處理持久化,不會(huì)block用戶(hù)的執(zhí)行請(qǐng)求;
- SAVE則會(huì)block用戶(hù)執(zhí)行請(qǐng)求。
- struct redisServer {
- long long dirty;/* Changes to DB from the last save */
- time_t lastsave; /* Unix time of last successful save */
- long long dirty_before_bgsave;
- pid_t rdb_child_pid;/* PID of RDB saving child */
- struct saveparam *saveparams; /* Save points array for RDB */
- }
- struct saveparam {
- time_t seconds;
- int changes;
- };
RedisServer包含的信息很多,其中就包含了有關(guān)于RDB持久化的信息。
redisServer->dirty至上次save到目前為止的change數(shù)。redisServer->lastsave上次save時(shí)間。
saveparam struct保存了我們通過(guò)save命令設(shè)置的參數(shù),time_t是個(gè)long時(shí)間戳。
- typedef __darwin_time_t time_t;
- typedef long __darwin_time_t; /* time() */
- int serverCron(struct aeEventLoop *eventLoop, long long id, void *clientData) {
- for (j = 0; j < server.saveparamslen; j++) {
- struct saveparam *sp = server.saveparams+j;
- if (server.dirty >= sp->changes &&
- server.unixtime-server.lastsave > sp->seconds &&
- (server.unixtime-server.lastbgsave_try >
- REDIS_BGSAVE_RETRY_DELAY ||
- server.lastbgsave_status == REDIS_OK))
- {
- redisLog(REDIS_NOTICE,"%d changes in %d seconds. Saving...",
- sp->changes, (int)sp->seconds);
- rdbSaveBackground(server.rdb_filename);
- break;
- }
- }
- }
Redis事件循環(huán)會(huì)周期性的執(zhí)行serverCron方法,這段代碼會(huì)循環(huán)遍歷server.saveparams參數(shù)鏈表。
如果server.dirty大于等于我們參數(shù)里配置的變化并且server.unixtime-server.lastsave大于參數(shù)里配置的時(shí)間,并且server.unixtime-server.lastbgsave_try減去bgsave重試延遲時(shí)間,或者當(dāng)前server.lastbgsave_status== REDIS_OK則執(zhí)行rdbSaveBackground方法。
2、AOF(Append-only file)
AOF持久化是采用對(duì)文件進(jìn)行追加對(duì)方式進(jìn)行,每次追加都是Redis處理的命令。有點(diǎn)類(lèi)似command sourcing命令溯源的模式,只要我們可以將所有的命令按照?qǐng)?zhí)行順序在重放一遍就可以還原最終的Redis內(nèi)存狀態(tài)。
AOF持久化最大的優(yōu)勢(shì)是可以縮短數(shù)據(jù)丟失的間隔,做到秒級(jí)的丟失率。RDB會(huì)丟失上一個(gè)保存周期到目前的所有數(shù)據(jù),只要沒(méi)有觸發(fā)save命令設(shè)置的save seconds changes閾值數(shù)據(jù)就會(huì)一直不被持久化。
- struct redisServer {
- /* AOF buffer, written before entering the event loop */
- sds aof_buf;
- }
- struct sdshdr {
- unsigned int len;
- unsigned int free;
- char buf[];
- };
aof_buf是命令緩存區(qū),采用sds結(jié)構(gòu)緩存,每次當(dāng)有命令被執(zhí)行當(dāng)時(shí)候都會(huì)寫(xiě)一次到aof_buf中。有幾個(gè)配置用來(lái)控制AOF持久化的機(jī)制。
- appendonly no
- appendfilename "appendonly.aof"
appendonly用來(lái)控制是否開(kāi)啟AOF持久化,appendfilename用來(lái)設(shè)置aof文件名。
- appendfsync always
- appendfsync everysec
- appendfsync no
appendfsync用來(lái)控制命令刷盤(pán)機(jī)制?,F(xiàn)在操作系統(tǒng)都有文件cache/buffer的概念,所有的寫(xiě)入和讀取都會(huì)走cache/buffer,并不會(huì)每次都同步刷盤(pán),因?yàn)檫@樣性能一定會(huì)受影響。所以Redis也提供了這個(gè)選項(xiàng)讓我們來(lái)自己根據(jù)業(yè)務(wù)場(chǎng)景控制。
- always:每次將aof_buf命令寫(xiě)入aof文件并且執(zhí)行實(shí)時(shí)刷盤(pán)。
- everysec:每次將aof_buf命令寫(xiě)入aof文件,但是每隔一秒執(zhí)行一次刷盤(pán)。
- no:每次將aof_buf命令寫(xiě)入aof文件不執(zhí)行刷盤(pán),由操作系統(tǒng)來(lái)自行控制。
AOF也是采用后臺(tái)子進(jìn)程的方式進(jìn)行,與主進(jìn)程共享數(shù)據(jù)空間也就是aof_buf,但是只要開(kāi)始了AOF子進(jìn)程之后Redis事件循環(huán)文件事件處理器會(huì)將之后的命令寫(xiě)入另外一個(gè)aof_buf,這樣就可以做到平滑的切換。
AOF會(huì)不斷的追加命令進(jìn)aof文件,隨著時(shí)間和并發(fā)量的加大aof文件會(huì)極速膨脹,所以有必要對(duì)這個(gè)文件大小進(jìn)行優(yōu)化。Redis基于rewrite重寫(xiě)對(duì)文件進(jìn)行壓縮。
- no-appendfsync-on-rewrite no/yes
- auto-aof-rewrite-percentage 100
- auto-aof-rewrite-min-size 64mb
no-appendfsync-on-rewrite控制是否在bgrewriteaof的時(shí)候還需要進(jìn)行命令追加,如果追加可能會(huì)出現(xiàn)磁盤(pán)IO跑高現(xiàn)象。
上面說(shuō)過(guò),當(dāng)AOF進(jìn)程在執(zhí)行的時(shí)候原來(lái)的事件循環(huán)還會(huì)正常的追加命令進(jìn)aof文件,同時(shí)還會(huì)追加命令進(jìn)另外一個(gè)aof_buf,用來(lái)做新aof文件的重寫(xiě)。這是兩條并行的動(dòng)作,如果我們?cè)O(shè)置成yes就不追加原來(lái)的aof_buf 因?yàn)樾碌腶of文件已經(jīng)包含了之后進(jìn)來(lái)的命令。
auto-aof-rewrite-percentage和auto-aof-rewrite-min -size64mb這兩個(gè)配置前者是文件增長(zhǎng)百分比來(lái)進(jìn)行rewrite,后者是按照文件大小增長(zhǎng)進(jìn)行rewrite。