搞懂限流算法這一篇就夠了
TL;DR(too long don't read)
限流算法:計數(shù)器、滑動窗口、漏桶、令牌桶。
限流方案:Guava的RateLimiter、Alibaba Sentinel
大家都知道,對于高并發(fā)的業(yè)務(wù)場景,我們?yōu)榱吮U戏?wù)的穩(wěn)定,經(jīng)常會祭出三大利器:緩存、熔斷降級和服務(wù)限流。
服務(wù)限流作為一個核心的自保護機制,能夠在非常高并發(fā)的情況下,其他機制都無法保障降級的情況下,保護系統(tǒng)不崩潰,以免產(chǎn)生雪崩效應(yīng)。
我們設(shè)想這么一個場景。
名詞解析,QPS(query per second 每秒查詢數(shù))
單臺機器可以承受的最高QPS為 100,我們有5臺機器,日常服務(wù) QPS 為 300。
那么其實我們是毫無壓力,根據(jù)前置的負載均衡服務(wù)器,每臺 300/5 = 60 ??梢酝昝捞峁┓?wù)。
今天,老板突然搞了一波促銷,QPS 達到了 800。
好了,機器 A 的 QPS 達到了 160,已經(jīng)完全扛不住了,直接宕機了。這時候集群只剩下4臺機器,QPS依然是 800。平均分配到剩下的 4 臺機器上,每臺機器 200。就這樣,機器一臺一臺倒下,雪崩了。
那如果我們的系統(tǒng)有限流,會是什么樣的場景呢?
QPS 達到了800。好了,機器 A 的 QPS 達到了 160,但因為限流了100,所以機器依然正常運行,只是損失了 60 QPS 的客戶,整個集群整體還是正常運行的。這時候就給開發(fā)和運營們留下時間開始降級擴容 bala bala....
可見,限流對于系統(tǒng)的自保護是非常重要的存在,然而很多工程師并沒有正視它,或者說只是會用,并不清楚背后的原理。先說下結(jié)論。
常見的限流算法有:計數(shù)器、滑動窗口、漏桶、令牌桶。
常見的限流方案有:Guava的RateLimiter、基于分布式鎖的令牌桶、Alibaba Sentinel
<計數(shù)器>
一般來說,計數(shù)器比較粗暴,就是看單位時間內(nèi),所接受的 QPS 的請求有多少,如果超過閾值,則直接拒絕服務(wù)。大概場景是這樣的。
有這么一個煎餅果子攤,攤主叫老王,上面的老板說你一分鐘只許賣 6 個餅(計數(shù)限流1分鐘6個)。如果在前 0.1 秒已經(jīng)有人預定了6個餅而且老王剛好神來之筆也已經(jīng)做完了,那么老王在接下來的 59.59 秒只能坐在凳子上,等待下一分鐘的到來。
看,簡單粗暴的計數(shù)器,在系統(tǒng)性能允許的情況下,可能會浪費非常多的資源
<滑動窗口>
滑動窗口可以看做計數(shù)器的精細化實現(xiàn),之前只能一分鐘一分鐘往前趕,現(xiàn)在可以根據(jù)實現(xiàn)的精細化 一秒一秒往前趕,雖然整體原理還是靠計數(shù)器。既往不咎,是一個適當時間里懂得忘記的計數(shù)器。
<漏桶>
看這張圖可以看到漏桶的基礎(chǔ)原理,我們會用一個桶作為緩沖區(qū),所有的請求都先丟到桶里。系統(tǒng)以恒定速率慢慢消化這些請求。比較常見的實現(xiàn)就是隊列,用一個緩沖區(qū)來保存沒處理的請求,然后消費者恒定速度抓取一些請求進行處理。
有這么一個煎餅果子攤,攤主叫老王,老王一秒鐘只能做一個餅?,F(xiàn)在來了 100個顧客,那怎么辦呢?就排隊啊。老王的老婆啊潘,把這批顧客引導到了旁邊的空地上站著,并給他們一個一個標記了號碼。老王做完一個,就大喊一聲號碼,對應(yīng)的的顧客就過來把餅拿走。
你看看這里的要求,要求有空地(桶),而且顧客等得起(等待時間)。
<令牌桶>
我們會有一個令牌管理員,按照一定的策略往令牌桶里放令牌。系統(tǒng)每接受到一個請求的時候,都會請求要一個令牌。如果拿到令牌,那么就處理這個請求,拿不到就直接拒絕這個請求。那么只要令牌發(fā)放的策略正確,這個系統(tǒng)就不會被拖垮,也能對機器的利用率更高。
有這么一個煎餅果子攤,攤主叫老王,老王也不知道自己能做幾個餅。老王的老婆阿潘在老王旁邊放了一個桶,里邊放了一些牌子,并告訴老王,"我?guī)湍憧粗?,你看見有令牌你就做就是?quot;。 現(xiàn)在來了 100個顧客,老王挖糞涂墻,原來一秒鐘只能做一個,現(xiàn)在一秒鐘可以做好多個,老王不看顧客了,每次能拿到令牌就直接做。老王的老婆啊潘,眼睛一直看著老王,看看他手抖沒是不是要上廁所了。如果手抖了或者可能扛不住了,那就少放一點令牌歇一歇。但如果一次性來了五個 vip 客戶,那阿潘就不管那么多了,就直接丟多幾個令牌讓老王忙一點。
我們看到,令牌桶的方法可以根據(jù)系統(tǒng)負載,實時調(diào)節(jié)系統(tǒng)的處理能力,能夠允許一定量級的瞬時高峰流量的快速消化。
好嘞。方案和算法基本上就說完了,現(xiàn)在聊聊限流關(guān)于現(xiàn)有的實現(xiàn),我們當然是非常希望可以不做過多的開發(fā),開箱即用完事,幸運的是,我們已經(jīng)有不少的開源實現(xiàn),就算自己實現(xiàn)也不會特別難。
<RateLimiter>
- <dependency>
- <groupId>com.google.guava</groupId>
- <artifactId>guava</artifactId>
- <version>25.1-jre</version>
- </dependency>
使用Guava的RateLimiter進行限流控制,主要有兩種核心模式,SmoothBursty 和 SmoothWarmingUp。SmoothBursty 每秒鐘發(fā)放N個令牌,也允許預先借用一定數(shù)量的令牌。SmoothWarmingUp,在系統(tǒng)剛剛啟動的時候,只會按最低閾值發(fā)放令牌,然后逐漸增加到設(shè)定的最高閾值。
- RateLimiter smoothBuisty = RateLimiter.create(1);
- RateLimiter smoothWarmingUp = RateLimiter.create(1 , 1 , TimeUnit.SECONDS);
- smoothBuisty.acquire();
- smoothWarmingUp.acquire(5);
acquire() 方法會阻塞,直到令牌桶返回,還可以一次性拿到N個令牌。但是 RateLimiter 是單機版的,如果我們想要實現(xiàn)分布式,那可以基于 RateLimiter 的原理,實現(xiàn)以下分布式的,可以使用 Redis 等分布式鎖來進行實現(xiàn)。
<Alibaba Sentinel>
https://github.com/alibaba/Sentinel.git
Sentinel 是一個帶配置中心的分布式緩存,以 "資源名稱" 為統(tǒng)計點,提供了多種方式的限流方案,可以基于 QPS、線程數(shù),甚至系統(tǒng) load 進行集群規(guī)模的限流。Sentinel 在整個生態(tài)的位置是這樣的。
使用限流的代碼非常簡單,只需要定義一個 String 類型的資源,作為唯一標識,Sentinel 會根據(jù)規(guī)則進行限流。
- try (Entry entry = SphU.entry("HelloWorld")) {
- // Your business logic here.
- System.out.println("hello world");
- } catch (BlockException e) {
- // Handle rejected request.
- e.printStackTrace();
- }
定義限流規(guī)則的也代碼非常簡單,只需要定義一個 String 類型的資源,作為唯一標識,Sentinel 會根據(jù)規(guī)則進行限流。
- private static void initFlowRules(){
- List<FlowRule> rules = new ArrayList<>();
- FlowRule rule = new FlowRule();
- rule.setResource("HelloWorld");
- rule.setGrade(RuleConstant.FLOW_GRADE_QPS);
- // Set limit QPS to 20.
- rule.setCount(20);
- rules.add(rule);
- FlowRuleManager.loadRules(rules);
- }
也提供了 DashBoard 進行實時規(guī)則調(diào)整。
最后總結(jié)一下今天的結(jié)論
限流算法:計數(shù)器、滑動窗口、漏桶、令牌桶。
限流方案:Guava的RateLimiter、基于分布式鎖的令牌桶、Alibaba Sentinel