自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

微服務(wù)系統(tǒng)RPC超時重試,你確定自己懂嗎?

開發(fā) 架構(gòu)
關(guān)于兩個參數(shù)要是沒有設(shè)置好的話,很可能會導(dǎo)致我們的系統(tǒng)被搞垮,但是可能很多人都不知道這里面的問題,所以今天給大家好好講講。

今天給大家分享一知識點,是關(guān)于我們平時開發(fā)系統(tǒng)做 RPC 通信的時候,經(jīng)常會設(shè)置超時和重試兩個參數(shù)。

關(guān)于這兩個參數(shù)要是沒有設(shè)置好的話,很可能會導(dǎo)致我們的系統(tǒng)被搞垮,但是可能很多人都不知道這里面的問題,所以今天給大家好好講講。

業(yè)務(wù)系統(tǒng)架構(gòu)圖

首先,我們還是先引出一個話題,那就是平時我們開發(fā)的系統(tǒng)是什么樣的?其實往簡單了說,就是用 SpringBoot+SSM 開發(fā)一套業(yè)務(wù)代碼,然后用 Nacos+Dubbo 去 RPC 調(diào)用別的系統(tǒng)。

這個架構(gòu)圖非常簡單,如下所示:

微服務(wù)項目技術(shù)難點 1:RPC 的超時機(jī)制

那么在兩個系統(tǒng)進(jìn)行 RPC 調(diào)用的時候,有兩個參數(shù)其實是至關(guān)重要的,一個是 timeout 超時時間,一個是 retry 重試次數(shù),這個 timeout 超時通常用于什么場景呢?

大家可以想象一個場景,如果說我們不設(shè)置 timeout 超時時間,是否可能出現(xiàn)這樣一種情況,就是你調(diào)用的那個系統(tǒng)可能故障了,或者是掛了,或者是他的性能突然很慢很慢,導(dǎo)致你調(diào)用他好幾秒都沒法返回。

如下圖:

如果要是你調(diào)用一個系統(tǒng)時間很久都沒法返回,此時會導(dǎo)致什么問題?

我們要知道,你自己這個系統(tǒng)對外接收請求靠的是線程,假設(shè)我們是 通過 SpringBoot 內(nèi)嵌 Tomcat 對外接收請求的,那么其實 Tomcat 就會開很多線程,每個 Http 請求過來了,每個請求都是要交給一個線程來處理的。

如下圖所示:

那么一個線程拿到了一個請求開始處理之后,他就會去調(diào)用別的系統(tǒng),如果要是調(diào)用別的系統(tǒng)這個過程中因為他故障了,導(dǎo)致調(diào)用時間超長,好幾秒都沒個響應(yīng),這個時候會怎么樣呢?

那還不簡單,這會導(dǎo)致 Tomcat 一個線程一直阻塞好幾秒都沒法去處理別的請求。那么這個時候,如果所有線程都因為調(diào)用一個服務(wù)被阻塞住了,是不是就導(dǎo)致新的請求過來沒有一個線程可以處理了?

如下圖:

所以說,往往來說,我們對于別的服務(wù) RPC 調(diào)用一般都得設(shè)置一個超時時間,比如說,設(shè)置 timeout=1s,那么意思就是說,我們調(diào)用別的系統(tǒng)如果超過 1s 沒有響應(yīng),就直接拋個異常就返回了,這樣就可以避免我們的 Tomcat 線程 長時間阻塞了。

如下圖:

微服務(wù)項目技術(shù)難點 2:RPC 的重試機(jī)制

那么除了這個 timeout 超時時間以外,還有另外一個參數(shù)是 retry,這個 retry 的意思,就是說如果你 RPC 調(diào)用一個服務(wù)要是失敗了,此時就可以通過 retry 設(shè)置自動做一個重試。

比如說自動可以重試 2 次,那么這個時候如果是因為網(wǎng)絡(luò)偶然抖動導(dǎo)致的調(diào)用失敗,就可以通過重試 2 次讓他能夠成功完成調(diào)用了。

如下圖:

生產(chǎn)項目中 timeout 和 retry 一般設(shè)置成多少呢?

好了,現(xiàn)在 timeout 和 retry 兩個參數(shù)講完了,下面就可以講這兩個參數(shù)設(shè)置不當(dāng)是如何導(dǎo)致系統(tǒng)出現(xiàn)故障的了。

先來說這個 timeout,這個 timeout 設(shè)置可一定要慎重啊,因為如果要是設(shè)置的不謹(jǐn)慎,可能導(dǎo)致你的系統(tǒng)莫名其妙就直接跨掉了。

比如說,這個 timeout 你要是設(shè)置的時間太長了,好比說 5s,10s,那么可能在極端情況下,比如對方系統(tǒng)故障了,你每個請求都要 5s、10s 才能返回,那不就會導(dǎo)致剛才上面說的問題了?

就是 Tomcat 每個線程都得阻塞 5s、10s 才能返回,這就導(dǎo)致你的系統(tǒng)沒法處理新的請求了。

如下圖:

那么如果要是 timeout 設(shè)置的太短了呢?比如說設(shè)置 timeout=500ms,那好,這可能也有很大問題了。

因為有可能某一天因為搞活動流量比較大,你調(diào)用的系統(tǒng)因為壓力比較大,導(dǎo)致他的 CPU 負(fù)載很高,然后平時一般請求都是 300~400ms 可以返回,結(jié)果今天搞成 500~600ms 了,剛好超過了 timeout 時間。

此時就會導(dǎo)致,你大量的請求即將處理完畢要返回的時候,結(jié)果一到 500ms 就超時異常拋出,一到 500ms 就超時異常拋出。

如下圖:

所以說,timeout 超時參數(shù)設(shè)置,通常是這么設(shè)置的,對于你要調(diào)用的系統(tǒng)你要看看他平時調(diào)用要多久能返回,然后比正常的耗時設(shè)置的多個 50% 就可以了。

比如平時一般正常在 100~200ms,偶爾高峰會在 500ms,那你設(shè)置個 timeout=800ms 或者 1s 其實都可以。

然后就是 retry 這個參數(shù),這個參數(shù)也是不能胡亂設(shè)置的,尤其是對于一些調(diào)用別的系統(tǒng)寫入數(shù)據(jù)的接口。

如果你要是對別的服務(wù)的寫接口設(shè)置了 retry,就可能有這樣一種場景,某一次寫入接口可能耗時稍微長了一些,導(dǎo)致了超時出錯,結(jié)果你又 retry 再次重試寫入,就可能導(dǎo)致數(shù)據(jù)會有重復(fù)的問題。

所以說通常都建議 retry 參數(shù)對讀接口可以設(shè)置一下,但是對寫接口最好是不要設(shè)置。

好了,今天關(guān)于 RPC 超時和重試參數(shù)的分享就到這里了。

責(zé)任編輯:姜華 來源: 今日頭條
相關(guān)推薦

2022-05-06 07:44:10

微服務(wù)系統(tǒng)設(shè)計重試機(jī)制

2021-10-18 08:52:42

技術(shù)

2017-02-21 13:16:49

微服務(wù)RPC技術(shù)

2022-04-19 07:51:11

RPC 通信架構(gòu)

2019-08-21 08:44:52

RPC框架Java

2021-03-04 15:48:05

微服務(wù)語言開源

2020-04-10 13:04:19

微服務(wù)架構(gòu)RPC

2020-07-30 08:03:36

MQ死信隊列

2019-12-11 10:07:02

緩存架構(gòu)數(shù)據(jù)庫

2021-04-12 06:00:01

MongoDB數(shù)據(jù)庫存儲

2018-05-10 09:06:24

2011-06-14 10:57:31

SQL Server管理

2022-06-21 09:53:03

FedoraUbuntuLinux

2024-05-29 09:20:41

2022-08-28 19:58:59

LinkerdKubernetes

2019-11-28 10:45:28

ZooKeeper源碼分布式

2016-09-26 14:45:46

微服務(wù)

2017-06-16 15:16:15

2017-07-02 16:50:21

2019-09-05 11:14:12

監(jiān)控系統(tǒng)拓?fù)鋱D
點贊
收藏

51CTO技術(shù)棧公眾號