自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

20萬(wàn)用戶同時(shí)訪問(wèn)一個(gè)熱Key,如何優(yōu)化緩存架構(gòu)?

開(kāi)發(fā) 架構(gòu) 開(kāi)發(fā)工具
這篇文章,咱們來(lái)聊聊熱點(diǎn)緩存的架構(gòu)優(yōu)化問(wèn)題。使用緩存集群的時(shí)候,最怕的就是熱 Key、大 Value 這兩種情況。

這篇文章,咱們來(lái)聊聊熱點(diǎn)緩存的架構(gòu)優(yōu)化問(wèn)題。使用緩存集群的時(shí)候,最怕的就是熱 Key、大 Value 這兩種情況。

為什么要用緩存集群

啥叫熱 Key 和大 Value 呢?簡(jiǎn)單來(lái)說(shuō),熱 Key,就是你的緩存集群中的某個(gè) Key 瞬間被數(shù)萬(wàn)甚至十萬(wàn)的并發(fā)請(qǐng)求打爆。

大 Value,就是你的某個(gè) Key 對(duì)應(yīng)的 Value 可能有 GB 級(jí)的大小,導(dǎo)致查詢 Value 的時(shí)候出現(xiàn)網(wǎng)絡(luò)相關(guān)的故障問(wèn)題。

先來(lái)看看下面的一幅圖:

簡(jiǎn)單來(lái)說(shuō),假設(shè)你手頭有個(gè)系統(tǒng),他本身是集群部署的,然后后面有一套緩存集群,這個(gè)集群不管你用 Redis Cluster,還是 Memcached,或者是公司自研緩存集群,都可以。

那么,這套系統(tǒng)用緩存集群干什么呢?很簡(jiǎn)單,在緩存里放一些平時(shí)不怎么變動(dòng)的數(shù)據(jù),然后用戶在查詢大量的平時(shí)不怎么變動(dòng)的數(shù)據(jù)的時(shí)候,不就可以直接從緩存里走了嗎?

緩存集群的并發(fā)能力是很強(qiáng)的,而且讀緩存的性能是很高的。舉個(gè)例子,假設(shè)你每秒有 2 萬(wàn)請(qǐng)求,但是其中 90% 都是讀請(qǐng)求,那么每秒 1.8 萬(wàn)請(qǐng)求都是在讀一些不太變化的數(shù)據(jù),而不是寫數(shù)據(jù)。

那此時(shí)你把數(shù)據(jù)都放在數(shù)據(jù)庫(kù)里,然后每秒發(fā)送 2 萬(wàn)請(qǐng)求到數(shù)據(jù)庫(kù)上讀寫數(shù)據(jù),你覺(jué)得合適嗎?

當(dāng)然不太合適了,如果你要用數(shù)據(jù)庫(kù)承載每秒 2 萬(wàn)請(qǐng)求的話,那么不好意思,你很可能就得搞分庫(kù)分表 + 讀寫分離。

比如你得分 3 個(gè)主庫(kù),承載每秒 2000 的寫入請(qǐng)求,然后每個(gè)主庫(kù)掛 3 個(gè)從庫(kù),一共 9 個(gè)從庫(kù)承載每秒 1.8 萬(wàn)的讀請(qǐng)求。

這樣的話,你可能就需要一共是 12 臺(tái)高配置的數(shù)據(jù)庫(kù)服務(wù)器,這是很耗費(fèi)錢的,成本非常高,而且很不合適。

大家看看下面的圖,來(lái)體會(huì)下這種情況:

所以,此時(shí)你完全就可以把平時(shí)不太變化的數(shù)據(jù)放在緩存集群里,緩存集群可以采用 2 主 2 從,主節(jié)點(diǎn)用來(lái)寫入緩存,從節(jié)點(diǎn)用來(lái)讀緩存。

以緩存集群的性能,2 個(gè)從節(jié)點(diǎn)完全可以用來(lái)承載每秒 1.8 萬(wàn)的大量讀了,然后 3 個(gè)數(shù)據(jù)庫(kù)主庫(kù)就是承載每秒 2000 的寫請(qǐng)求和少量其他讀請(qǐng)求就可以了。

大家看看下面的圖,你耗費(fèi)的機(jī)器瞬間變成了 4 臺(tái)緩存機(jī)器 + 3 臺(tái)數(shù)據(jù)庫(kù)機(jī)器 = 7 臺(tái)機(jī)器,是不是比之前的 12 臺(tái)機(jī)器減少了很大的資源開(kāi)銷?

沒(méi)錯(cuò),緩存其實(shí)在系統(tǒng)架構(gòu)里是非常重要的組成部分。很多時(shí)候,對(duì)于那些很少變化但是大量高并發(fā)讀的數(shù)據(jù),通過(guò)緩存集群來(lái)抗高并發(fā)讀,是非常合適的。

這里所有的機(jī)器數(shù)量、并發(fā)請(qǐng)求量都是一個(gè)示例,大家主要是體會(huì)一下這個(gè)意思就好,其目的主要是給一些不太熟悉緩存相關(guān)技術(shù)的同學(xué)一點(diǎn)背景性的闡述,讓這些同學(xué)能夠理解在系統(tǒng)里用緩存集群承載讀請(qǐng)求是什么意思。

20 萬(wàn)用戶同時(shí)訪問(wèn)一個(gè)熱點(diǎn)緩存的問(wèn)題

好了,背景是已經(jīng)給大家解釋清楚了,那么現(xiàn)在就可以給大家說(shuō)說(shuō)今天重點(diǎn)要討論的問(wèn)題:熱點(diǎn)緩存。

我們來(lái)做一個(gè)假設(shè),你現(xiàn)在有 10 個(gè)緩存節(jié)點(diǎn)來(lái)抗大量的讀請(qǐng)求。正常情況下,讀請(qǐng)求應(yīng)該是均勻的落在 10 個(gè)緩存節(jié)點(diǎn)上的,對(duì)吧!

這 10 個(gè)緩存節(jié)點(diǎn),每秒承載 1 萬(wàn)請(qǐng)求是差不多的。然后我們?cè)僮鲆粋€(gè)假設(shè),你一個(gè)節(jié)點(diǎn)承載 2 萬(wàn)請(qǐng)求是極限,所以一般你就限制一個(gè)節(jié)點(diǎn)正常承載 1 萬(wàn)請(qǐng)求就 OK 了,稍微留一點(diǎn) Buffer 出來(lái)。

好,所謂的熱點(diǎn)緩存問(wèn)題是什么意思呢?很簡(jiǎn)單,就是突然因?yàn)槟脑颍霈F(xiàn)大量的用戶訪問(wèn)同一條緩存數(shù)據(jù)。

舉個(gè)例子,某個(gè)明星突然宣布跟某某結(jié)婚,這個(gè)時(shí)候是不是會(huì)引發(fā)可能短時(shí)間內(nèi)每秒都是數(shù)十萬(wàn)的用戶去查看這個(gè)明星跟某某結(jié)婚的那條新聞?

那么假設(shè)那條新聞就是一個(gè)緩存,然后對(duì)應(yīng)就是一個(gè)緩存 Key,就存在一臺(tái)緩存機(jī)器上,此時(shí)瞬時(shí)假設(shè)有 20 萬(wàn)請(qǐng)求奔向那一臺(tái)機(jī)器上的一個(gè) Key。

此時(shí)會(huì)如何?我們看看下面的圖,來(lái)體會(huì)一下這種絕望的感受:

這個(gè)時(shí)候很明顯了,我們剛才假設(shè)的是一個(gè)緩存 Slave 節(jié)點(diǎn)最多每秒就是 2 萬(wàn)的請(qǐng)求,當(dāng)然實(shí)際緩存單機(jī)承載 5 萬(wàn)~10 萬(wàn)讀請(qǐng)求也是可能的,我們這里就是一個(gè)假設(shè)。

結(jié)果此時(shí),每秒突然奔過(guò)來(lái) 20 萬(wàn)請(qǐng)求到這臺(tái)機(jī)器上,會(huì)怎么樣?很簡(jiǎn)單,上面圖里那臺(tái)被 20 萬(wàn)請(qǐng)求指向的緩存機(jī)器會(huì)過(guò)度操勞而宕機(jī)的。

那么如果緩存集群開(kāi)始出現(xiàn)機(jī)器的宕機(jī),此時(shí)會(huì)如何?接著,讀請(qǐng)求發(fā)現(xiàn)讀不到數(shù)據(jù),會(huì)從數(shù)據(jù)庫(kù)里提取原始數(shù)據(jù),然后放入剩余的其他緩存機(jī)器里去。

但是接踵而來(lái)的每秒 20 萬(wàn)請(qǐng)求,會(huì)再次壓垮其他的緩存機(jī)器。以此類推,最終導(dǎo)致緩存集群全盤崩潰,引發(fā)系統(tǒng)整體宕機(jī)。

咱們看看下面的圖,再感受一下這個(gè)恐怖的現(xiàn)場(chǎng):

基于流式計(jì)算技術(shù)的緩存熱點(diǎn)自動(dòng)發(fā)現(xiàn)

其實(shí)這里關(guān)鍵的一點(diǎn),就是對(duì)于這種熱點(diǎn)緩存,你的系統(tǒng)需要能夠在熱點(diǎn)緩存突然發(fā)生的時(shí)候,直接發(fā)現(xiàn)他,然后瞬間立馬實(shí)現(xiàn)毫秒級(jí)的自動(dòng)負(fù)載均衡。

那么我們就先來(lái)說(shuō)說(shuō),你如何自動(dòng)發(fā)現(xiàn)熱點(diǎn)緩存問(wèn)題?首先你要知道,一般出現(xiàn)緩存熱點(diǎn)的時(shí)候,你的每秒并發(fā)肯定是很高的,可能每秒都幾十萬(wàn)甚至上百萬(wàn)的請(qǐng)求量過(guò)來(lái),這都是有可能的。

所以,此時(shí)完全可以基于大數(shù)據(jù)領(lǐng)域的流式計(jì)算技術(shù)來(lái)進(jìn)行實(shí)時(shí)數(shù)據(jù)訪問(wèn)次數(shù)的統(tǒng)計(jì),比如 Storm、Spark Streaming、Flink,這些技術(shù)都是可以的。

然后一旦在實(shí)時(shí)數(shù)據(jù)訪問(wèn)次數(shù)統(tǒng)計(jì)的過(guò)程中,比如發(fā)現(xiàn)一秒之內(nèi),某條數(shù)據(jù)突然訪問(wèn)次數(shù)超過(guò)了 1000,就直接立馬把這條數(shù)據(jù)判定為是熱點(diǎn)數(shù)據(jù),可以將這個(gè)發(fā)現(xiàn)出來(lái)的熱點(diǎn)數(shù)據(jù)寫入比如 Zookeeper 中。

當(dāng)然,你的系統(tǒng)如何判定熱點(diǎn)數(shù)據(jù),可以根據(jù)自己的業(yè)務(wù)還有經(jīng)驗(yàn)值來(lái)就可以了。

大家看看下面這張圖,看看整個(gè)流程是如何進(jìn)行的:

當(dāng)然肯定有人會(huì)問(wèn),那你的流式計(jì)算系統(tǒng)在進(jìn)行數(shù)據(jù)訪問(wèn)次數(shù)統(tǒng)計(jì)的時(shí)候,會(huì)不會(huì)也存在說(shuō)單臺(tái)機(jī)器被請(qǐng)求每秒幾十萬(wàn)次的問(wèn)題呢?

答案是否,因?yàn)榱魇接?jì)算技術(shù),尤其是 Storm 這種系統(tǒng),他可以做到同一條數(shù)據(jù)的請(qǐng)求過(guò)來(lái),先分散在很多機(jī)器里進(jìn)行本地計(jì)算,***再匯總局部計(jì)算結(jié)果到一臺(tái)機(jī)器進(jìn)行全局匯總。

所以幾十萬(wàn)請(qǐng)求可以先分散在比如 100 臺(tái)機(jī)器上,每臺(tái)機(jī)器統(tǒng)計(jì)了這條數(shù)據(jù)的幾千次請(qǐng)求。

然后 100 條局部計(jì)算好的結(jié)果匯總到一臺(tái)機(jī)器做全局計(jì)算即可,所以基于流式計(jì)算技術(shù)來(lái)進(jìn)行統(tǒng)計(jì)是不會(huì)有熱點(diǎn)問(wèn)題的。

熱點(diǎn)緩存自動(dòng)加載為 JVM 本地緩存

我們自己的系統(tǒng)可以對(duì) Zookeeper 指定的熱點(diǎn)緩存對(duì)應(yīng)的 Znode 進(jìn)行監(jiān)聽(tīng),如果有變化他立馬就可以感知到了。

此時(shí)系統(tǒng)層就可以立馬把相關(guān)的緩存數(shù)據(jù)從數(shù)據(jù)庫(kù)加載出來(lái),然后直接放在自己系統(tǒng)內(nèi)部的本地緩存里即可。

這個(gè)本地緩存,你用 Ehcache、Hashmap,其實(shí)都可以,一切都看自己的業(yè)務(wù)需求,主要說(shuō)的就是將緩存集群里的集中式緩存,直接變成每個(gè)系統(tǒng)自己本地實(shí)現(xiàn)緩存即可,每個(gè)系統(tǒng)自己本地是無(wú)法緩存過(guò)多數(shù)據(jù)的。

因?yàn)橐话氵@種普通系統(tǒng)單實(shí)例部署機(jī)器可能就一個(gè) 4 核 8G 的機(jī)器,留給本地緩存的空間是很少的,所以用來(lái)放這種熱點(diǎn)數(shù)據(jù)的本地緩存是最合適的,剛剛好。

假設(shè)你的系統(tǒng)層集群部署了 100 臺(tái)機(jī)器,那么好了,此時(shí)你 100 臺(tái)機(jī)器瞬間在本地都會(huì)有一份熱點(diǎn)緩存的副本。

然后接下來(lái)對(duì)熱點(diǎn)緩存的讀操作,直接系統(tǒng)本地緩存讀出來(lái)就給返回了,不用再走緩存集群了。

這樣的話,也不可能允許每秒 20 萬(wàn)的讀請(qǐng)求到達(dá)緩存機(jī)器的一臺(tái)機(jī)器上讀一個(gè)熱點(diǎn)緩存了,而是變成 100 臺(tái)機(jī)器每臺(tái)機(jī)器承載數(shù)千請(qǐng)求,那么那數(shù)千請(qǐng)求就直接從機(jī)器本地緩存返回?cái)?shù)據(jù)了,這是沒(méi)有問(wèn)題的。

我們?cè)賮?lái)畫一幅圖,一起來(lái)看看這個(gè)過(guò)程:

限流熔斷保護(hù)

除此之外,在每個(gè)系統(tǒng)內(nèi)部,還應(yīng)該專門加一個(gè)對(duì)熱點(diǎn)數(shù)據(jù)訪問(wèn)的限流熔斷保護(hù)措施。

每個(gè)系統(tǒng)實(shí)例內(nèi)部,都可以加一個(gè)熔斷保護(hù)機(jī)制,假設(shè)緩存集群最多每秒承載4萬(wàn)讀請(qǐng)求,那么你一共有 100 個(gè)系統(tǒng)實(shí)例。

你自己就該限制好,每個(gè)系統(tǒng)實(shí)例每秒最多請(qǐng)求緩存集群讀操作不超過(guò) 400 次,一超過(guò)就可以熔斷掉,不讓請(qǐng)求緩存集群,直接返回一個(gè)空白信息,然后用戶稍后會(huì)自行再次重新刷新頁(yè)面之類的。

通過(guò)系統(tǒng)層自己直接加限流熔斷保護(hù)措施,可以很好的保護(hù)后面的緩存集群、數(shù)據(jù)庫(kù)集群之類的不要被打死,我們來(lái)看看下面的圖:

總結(jié)

具體要不要在系統(tǒng)里實(shí)現(xiàn)這種復(fù)雜的緩存熱點(diǎn)優(yōu)化架構(gòu)呢?這個(gè)還要看你們自己的系統(tǒng)有沒(méi)有這種場(chǎng)景了。

如果你的系統(tǒng)有熱點(diǎn)緩存問(wèn)題,那么就要實(shí)現(xiàn)類似本文的復(fù)雜熱點(diǎn)緩存支撐架構(gòu)。

但是如果沒(méi)有的話,那么也別過(guò)度設(shè)計(jì),其實(shí)你的系統(tǒng)可能根本不需要這么復(fù)雜的架構(gòu)。

如果是后者,那么大伙兒就權(quán)當(dāng)看看本文,來(lái)了解一下對(duì)應(yīng)的架構(gòu)思想好了。

作者:中華石杉

中華石杉:十余年 BAT 架構(gòu)經(jīng)驗(yàn),一線互聯(lián)網(wǎng)公司技術(shù)總監(jiān)。帶領(lǐng)上百人團(tuán)隊(duì)開(kāi)發(fā)過(guò)多個(gè)億級(jí)流量高并發(fā)系統(tǒng)?,F(xiàn)將多年工作中積累下的研究手稿、經(jīng)驗(yàn)總結(jié)整理成文,傾囊相授。微信公眾號(hào):石杉的架構(gòu)筆記(ID:shishan100)。

 

責(zé)任編輯:武曉燕 來(lái)源: 51CTO技術(shù)棧
相關(guān)推薦

2021-03-30 09:57:30

Twitter宕機(jī)

2009-03-04 14:29:32

RTX2008

2022-09-05 11:25:22

惡意瀏覽器Chrome惡意擴(kuò)展

2011-12-26 15:31:33

2016-03-17 11:16:39

2022-11-08 09:59:07

數(shù)據(jù)集技術(shù)

2020-07-29 15:09:56

Dave數(shù)據(jù)泄露數(shù)據(jù)庫(kù)泄露

2023-01-31 17:07:06

2023-06-13 15:55:54

2021-04-15 07:53:15

ParkMobile數(shù)據(jù)泄露網(wǎng)絡(luò)犯罪

2010-05-04 22:32:37

手機(jī)木馬網(wǎng)絡(luò)安全360手機(jī)衛(wèi)士

2015-02-09 10:14:33

2021-04-02 11:09:35

MobiKwik 移動(dòng)支付數(shù)據(jù)泄露

2009-02-01 21:11:13

Facebook存儲(chǔ)數(shù)據(jù)中心

2025-02-03 00:00:20

2025-04-28 07:46:03

2011-12-26 09:58:59

2020-07-30 13:30:11

勒索病毒

2022-02-16 09:15:23

數(shù)據(jù)泄露網(wǎng)絡(luò)安全

2021-06-29 10:21:22

騰訊云騰訊會(huì)議TRTC
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)