Redis高性能架構(gòu)詳解(圖文全面總結(jié))
IO多路復(fù)用技術(shù)
Redis的高性能,有功于其使用的 IO 多路復(fù)用技術(shù)(IO multiplexing)。
IO 多路復(fù)用是一種 IO 模型,它使單個(gè)線程可以監(jiān)視多個(gè)文件描述符(如:網(wǎng)絡(luò)套接字)。
這種機(jī)制避免了為每個(gè)連接創(chuàng)建一個(gè)線程或進(jìn)程的開銷,從而提升了性能。
Redis 在處理網(wǎng)絡(luò) IO 時(shí),采用異步非阻塞模式,利用了操作系統(tǒng)提供的 IO 多路復(fù)用技術(shù)(如 epoll),可以同時(shí)處理多個(gè)客戶端連接而不會(huì)阻塞整個(gè)服務(wù)進(jìn)程。
如下圖所示:
圖片
IO 多路復(fù)用庫,包括 :select、poll、epoll(Linux)。
在不同的操作系統(tǒng)上,Redis 會(huì)選擇最適合的 IO 多路復(fù)用庫,Linux:主要使用 epoll。
epoll 是 Linux 下的高性能 IO 多路復(fù)用機(jī)制,利用了紅黑樹和事件就緒隊(duì)列,提供了更高效的文件描述符管理和事件通知,適合于需要處理大量并發(fā)連接的場(chǎng)景。
內(nèi)存存儲(chǔ)
Redis之所以性能快,主要原因是它將數(shù)據(jù)存儲(chǔ)在"內(nèi)存"中,而不是在磁盤上。
原因很簡(jiǎn)單,內(nèi)存的讀寫帶寬遠(yuǎn)高于磁盤,支持更高的并發(fā)讀寫操作。
為什么磁盤慢這么多呢?原因是自己的設(shè)計(jì)結(jié)構(gòu),如下圖所示:
圖片
一次數(shù)據(jù)的讀寫,主要會(huì)涉及到:尋道、以及旋轉(zhuǎn)延遲。
尋道
為了讀取、或?qū)懭霐?shù)據(jù),首先,磁頭需要移動(dòng)到正確的軌道上,這就是尋道。
如果每次讀取,都需要定位到正確的軌道,這就需要時(shí)間,特別是機(jī)械硬盤,就非常浪費(fèi)時(shí)間。
所以,磁頭移動(dòng)到目標(biāo)軌道,這是最慢的一步之一。
旋轉(zhuǎn)延遲
當(dāng)磁頭到達(dá)目標(biāo)軌道后,還需要等待盤片,旋轉(zhuǎn)到正確位置以便訪問數(shù)據(jù)塊,這就會(huì)涉及到“旋轉(zhuǎn)延遲”。
旋轉(zhuǎn)延遲,通常占據(jù)了總I/O時(shí)間的一大部分,平均延遲時(shí)間約為盤片轉(zhuǎn)一圈時(shí)間的一半。
所以,這些步驟,都是非常耗費(fèi)性能的。
而內(nèi)存,沒有磁盤旋轉(zhuǎn)、和磁頭移動(dòng)的機(jī)械延遲,訪問時(shí)間在納秒級(jí)別,而磁盤訪問時(shí)間在毫秒級(jí)別。
所以,內(nèi)存的速度會(huì)快非常多,這也是性能快的核心原因。
數(shù)據(jù)結(jié)構(gòu)高效
Redis提供了多種高效的數(shù)據(jù)結(jié)構(gòu)(如:字符串、列表、集合、有序集合、哈希等),如下圖所示:
圖片
這些數(shù)據(jù)結(jié)構(gòu)在內(nèi)存中進(jìn)行優(yōu)化,能夠快速進(jìn)行數(shù)據(jù)操作。
比如:
LPUSH task_queue "task1"
RPOP task_queue
列表使用 QuickList(雙向鏈表),可以在列表兩端快速插入和刪除元素。
常數(shù)時(shí)間復(fù)雜度:在列表兩端進(jìn)行的操作時(shí)間復(fù)雜度為 O(1)。
再比如:
SADD user_tags "tag1"
SISMEMBER user_tags "tag1"
集合基于哈希表實(shí)現(xiàn),能夠在常數(shù)時(shí)間內(nèi)完成添加和檢查操作。
優(yōu)化的網(wǎng)絡(luò)通信協(xié)議
Redis 使用自己優(yōu)化的 RESP(REdis Serialization Protocol),網(wǎng)絡(luò)通信協(xié)議。
該協(xié)議簡(jiǎn)單且高效,能夠減少網(wǎng)絡(luò)通信的開銷,提升數(shù)據(jù)傳輸效率。
總之,Redis 通過上述多個(gè)方面的優(yōu)化、和設(shè)計(jì),使得它成為了一個(gè)高性能的分布式緩存,適用于各種需要快速響應(yīng)、和處理大規(guī)模數(shù)據(jù)的應(yīng)用場(chǎng)景。