架構(gòu)選型,究竟啥時候選Redis?
redis是互聯(lián)網(wǎng)分層架構(gòu)中,最常用的KV緩存,但不少同學(xué)仍然不知道,為啥要選擇redis。
畫外音:與之對比最多的,是memcache。
一、復(fù)雜數(shù)據(jù)結(jié)構(gòu),選擇redis更合適
value是哈希,列表,集合,有序集合這類復(fù)雜的數(shù)據(jù)結(jié)構(gòu)時,會選擇redis,因為mc無法滿足這些需求。
最典型的場景,用戶訂單列表,用戶消息,帖子評論列表等。
二、持久化,選擇redis更合適
mc無法滿足持久化的需求,只得選擇redis。但是,這里要提醒的是,真的使用對了redis的持久化功能么?
千萬不要把redis當(dāng)作數(shù)據(jù)庫用:
- redis的定期快照不能保證數(shù)據(jù)不丟失;
- redis的AOF會降低效率,并且不能支持太大的數(shù)據(jù)量;
不要期望redis做固化存儲會比mysql做得好,不同的工具做各自擅長的事情,把redis當(dāng)作數(shù)據(jù)庫用,這樣的設(shè)計八成是錯誤的。
緩存場景,開啟固化功能,有什么利弊?
如果只是緩存場景,數(shù)據(jù)存放在數(shù)據(jù)庫,緩存在redis,此時如果開啟固化功能:
優(yōu)點(diǎn)是,redis掛了再重啟,內(nèi)存里能夠快速恢復(fù)熱數(shù)據(jù),不會瞬時將壓力壓到數(shù)據(jù)庫上,沒有一個cache預(yù)熱的過程。
缺點(diǎn)是,在redis掛了的過程中,如果數(shù)據(jù)庫中有數(shù)據(jù)的修改,可能導(dǎo)致redis重啟后,數(shù)據(jù)庫與redis的數(shù)據(jù)不一致。
因此,只讀場景,或者允許一些不一致的業(yè)務(wù)場景,可以嘗試開啟redis的固化功能。
三、高可用,選擇redis更合適
redis天然支持集群功能,可以實現(xiàn)主動復(fù)制,讀寫分離。
redis官方也提供了sentinel集群管理工具,能夠?qū)崿F(xiàn)主從服務(wù)監(jiān)控,故障自動轉(zhuǎn)移,這一切,對于客戶端都是透明的,無需程序改動,也無需人工介入。
畫外音:memcache,要想要實現(xiàn)高可用,需要進(jìn)行二次開發(fā),例如客戶端的雙讀雙寫,或者服務(wù)端的集群同步。
但是,這里要提醒的是,大部分業(yè)務(wù)場景,緩存真的需要高可用么?
- 緩存場景,很多時候,是允許cache miss;
- 緩存掛了,很多時候可以通過DB讀取數(shù)據(jù);
所以,需要認(rèn)真剖析業(yè)務(wù)場景,高可用,是否真的是對緩存的主要需求?
畫外音:即時通訊業(yè)務(wù)中,用戶的在線狀態(tài),就有高可用需求。
四、存儲的內(nèi)容比較大,選擇redis更合適
memcache的value存儲,最大為1M,如果存儲的value很大,只能使用redis。
當(dāng)然,redis與memcache相比,由于底層實現(xiàn)機(jī)制的差異,也有一些“劣勢”的情況。
情況一:由于內(nèi)存分配機(jī)制的差異,redis可能導(dǎo)致內(nèi)存碎片
memcache使用預(yù)分配內(nèi)存池的方式管理內(nèi)存,能夠省去內(nèi)存分配時間。
redis則是臨時申請空間,可能導(dǎo)致碎片。
從這一點(diǎn)上,mc會更快一些。
情況二:由于虛擬內(nèi)存使用的差異,redis可能會刷盤影響性能
memcache把所有的數(shù)據(jù)存儲在物理內(nèi)存里。
redis有自己的VM機(jī)制,理論上能夠存儲比物理內(nèi)存更多的數(shù)據(jù),當(dāng)數(shù)據(jù)超量時,會引發(fā)swap,把冷數(shù)據(jù)刷到磁盤上。從這一點(diǎn)上,數(shù)據(jù)量大時,mc會更快一些。
畫外音:新版本redis已經(jīng)優(yōu)化。
情況三:由于網(wǎng)絡(luò)模型的差異,redis可能會因為CPU計算影響IO調(diào)度
memcache使用非阻塞IO復(fù)用模型,redis也是使用非阻塞IO復(fù)用模型。
但由于redis還提供一些非KV存儲之外的排序,聚合功能,在執(zhí)行這些功能時,復(fù)雜的CPU計算,會阻塞整個IO調(diào)度。
從這一點(diǎn)上,由于redis提供的功能較多,mc會更快一些。
情況四:由于線程模型的差異,redis難以利用多核特效提升性能
memcache使用多線程,主線程監(jiān)聽,worker子線程接受請求,執(zhí)行讀寫,這個過程中,可能存在鎖沖突。
redis使用單線程,雖無鎖沖突,但難以利用多核的特性提升整體吞吐量。
從這一點(diǎn)上,mc會快一些。
情況五:由于缺乏auto-sharding,redis只能手動水平擴(kuò)展
不管是redis還是memcache,服務(wù)端集群沒有天然支持水平擴(kuò)展,需要在客戶端進(jìn)行分片,這其實對調(diào)用方并不友好。如果能服務(wù)端集群能夠支持水平擴(kuò)展,會更完美一些。
最后說一點(diǎn),可能是很多人喜歡redis的原因之一:源碼可讀性高,代碼質(zhì)量很高。
看過redis和memcache的源碼,從可讀性上說,redis是我見過代碼最清爽的軟件,甚至沒有之一,或許簡單是redis設(shè)計的初衷,編譯redis甚至不需要configure,不需要依賴第三方庫,一個make就搞定了。
而memcache源碼,可能是考慮了太多的擴(kuò)展性,多系統(tǒng)的兼容性,代碼不清爽,看起來費(fèi)勁。
例如網(wǎng)絡(luò)IO的部分,redis源碼1-2個文件就搞定了,mc使用了libevent,一個fd傳過來傳過去,又pipe又線程傳遞的,特別容易把人繞暈。
【本文為51CTO專欄作者“58沈劍”原創(chuàng)稿件,轉(zhuǎn)載請聯(lián)系原作者】