自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考華為認證廠商認證 IT技術(shù)PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設(shè)置退出

攜程注冊中心整體架構(gòu)與設(shè)計取舍

作者：Siegfried 2024-07-05 12:57:35

業(yè)務(wù)回暖已經(jīng)持續(xù)接近2年，攜程注冊中心穩(wěn)定運行，強勁地支撐業(yè)務(wù)復蘇與擴張，特別是支撐了業(yè)務(wù)日?；蚓o急情況下短時間內(nèi)大量擴縮容的場景。今天就來簡單介紹一下攜程注冊中心的整體架構(gòu)和設(shè)計取舍。

作者簡介

Siegfried，攜程軟件技術(shù)專家，負責攜程注冊中心的研發(fā)。

一、前言

目前，攜程大部分業(yè)務(wù)已經(jīng)完成了微服務(wù)改造，基本架構(gòu)如圖。每一個微服務(wù)的實例都需要和注冊中心進行通訊：服務(wù)端實例向注冊中心注冊自己的服務(wù)地址，客戶端實例通過向注冊中心查詢得知服務(wù)端地址，從而完成遠程調(diào)用。同時，客戶端會訂閱自己關(guān)心的服務(wù)端地址，當服務(wù)端發(fā)生變更時，客戶端會收到變更消息，觸發(fā)自己重新查詢服務(wù)端地址。

疫情剛過去那會，公司業(yè)務(wù)回暖跡象明顯，微服務(wù)實例總數(shù)在1個月左右的時間里上漲30%，個別服務(wù)的單服務(wù)實例數(shù)在業(yè)務(wù)高峰時可達萬級別。按照這個勢頭，預計全公司實例總數(shù)可能會在短時間內(nèi)翻倍。

實例數(shù)變大會引起連接數(shù)變大，請求量變高，網(wǎng)絡(luò)報文變大等一系列現(xiàn)象，對注冊中心的性能產(chǎn)生挑戰(zhàn)。

如果注冊中心遇到性能瓶頸或是運行不穩(wěn)定，從業(yè)務(wù)視角看，這會導致新增的實例無法及時接入流量，以至被調(diào)方緊急擴容見效慢；或者導致下線的實例不能被及時拉出，以至調(diào)用方業(yè)務(wù)訪問到已下線的實例產(chǎn)生報錯。

如今，業(yè)務(wù)回暖已經(jīng)持續(xù)接近2年，攜程注冊中心穩(wěn)定運行，強勁地支撐業(yè)務(wù)復蘇與擴張，特別是支撐了業(yè)務(wù)日?；蚓o急情況下短時間內(nèi)大量擴縮容的場景。今天就來簡單介紹一下攜程注冊中心的整體架構(gòu)和設(shè)計取舍。

二、整體架構(gòu)

攜程注冊中心采用兩層結(jié)構(gòu)，分為和數(shù)據(jù)層(Data)和會話層(Session)。Data負責存放被調(diào)方的元信息與實例狀態(tài)、計算RPC調(diào)用相關(guān)的路由策略。Session與SDK直接通訊，負責扛連接數(shù)，聚合轉(zhuǎn)發(fā)SDK發(fā)起的心跳/查詢請求。

注冊 – 定時心跳

微服務(wù)架構(gòu)下，服務(wù)端的一個實例（被調(diào)方）想要被客戶端（調(diào)用方）感知，它需要將自己注冊到注冊中心里。服務(wù)端實例會發(fā)起5秒1次的心跳請求，由Session轉(zhuǎn)發(fā)到對應(yīng)分片的Data。如果數(shù)據(jù)層能夠持續(xù)不斷的收到一個實例的心跳請求，那么數(shù)據(jù)層就會判斷這個實例是健康的。

與此同時，數(shù)據(jù)層會對這一份數(shù)據(jù)設(shè)置TTL，一旦超過TTL沒有收到后續(xù)的心跳請求，那么這份數(shù)據(jù)也就會被判定為過期。也就是說，注冊中心認為對應(yīng)的這個實例不應(yīng)再被調(diào)方繼續(xù)訪問了。

發(fā)現(xiàn) - 事件推送/保底輪詢

當收到新實例的第一個心跳時，數(shù)據(jù)層會產(chǎn)生一個NEW事件，相對應(yīng)地，當實例信息過期時，數(shù)據(jù)層會產(chǎn)生一個DELETE事件。NEW/DELETE事件會通過SDK發(fā)起的訂閱連接通知到調(diào)用方。

由于網(wǎng)絡(luò)等一些不可控的因素，事件推送是有可能丟失，因而SDK也會定時地發(fā)起全量查詢請求，以彌補可能丟失的事件。

多分片方案

如圖所示，Data被分成了多分片，不同分片的數(shù)據(jù)互不重復，從而解決了單臺Data的垂直瓶頸問題（比如內(nèi)存大小、心跳QPS等）。

Session會對服務(wù)ID進行哈希，根據(jù)哈希結(jié)果將心跳請求、訂閱請求、查詢請求分發(fā)到對應(yīng)的Data分片中。調(diào)用方SDK對多個被調(diào)方進行信息查詢時，可能會涉及到多個Data分片，那么Session會發(fā)起多個請求，并最終負責將所有必要信息聚合起來一并返回給客戶端。

單點故障

與很多其他系統(tǒng)類似，注冊中心也會遇到故障/維護等場景從而遭遇單點故障。我們把具體情況分為Data單點故障和Session單點故障，在兩種情況下，我們都需要保證系統(tǒng)整體的可用性。

單點故障 – Data

如圖所示，SDK發(fā)起的心跳請求會被復制到多臺Data上，以保證同一分片中每一臺Data的數(shù)據(jù)完整性。也就是說，同一個分片的每臺Data都會擁有該分片對應(yīng)的所有服務(wù)的數(shù)據(jù)。當任一Data出現(xiàn)故障，或是參與到日常運維被踢出集群的情況下，其他任一Data能夠很好的接替它的工作。

這樣的多寫機制相比于之前版本注冊中心采用的Data間復制機制更加簡單。在Data層發(fā)生故障時，當前方案對于集群的物理影響會更小，可以做到無需物理切換，因而也更加可靠。

在當前多寫機制下，Data層的數(shù)據(jù)是最終一致的。心跳請求被分成多個副本后是陸續(xù)到達各個Data實例的，在實例發(fā)生上線或者下線時，每臺data變更產(chǎn)生的時間點通常會略有不同。

為了盡可能避免上述情況對調(diào)用方產(chǎn)生影響，每臺Session會在每個Data分片中選擇一臺Data進行粘滯。同時，SDK對Session也會盡可能地粘滯。

單點故障 – Session

參考上文提到Data分片方案，任一Session都可以獲取到所有Data分片的數(shù)據(jù)，所有Session節(jié)點都具備相同的能力。

因此，任一Session故障時，SDK只需要切換到其他Session即可。

集群自發(fā)現(xiàn)

攜程注冊中心是基于Redis做集群自發(fā)現(xiàn)的。如下圖所示，Redis維護了所有注冊中心實例的信息。當一個注冊中心實例被創(chuàng)建時，新實例首先會向Redis索要所有其他實例的信息，同時開始持續(xù)對Redis發(fā)起心跳請求，于是Redis維護的實例信息中也會新增新實例。新實例還會根據(jù)從Redis拿到的數(shù)據(jù)向其他注冊中心實例發(fā)起內(nèi)部的心跳請求。一旦其他實例從Redis獲得了新實例的信息，再加上收到的心跳，就會認可新實例加入集群。

如下圖所示，當時注冊中心實例需要維護或故障時，實例停止運行后不再發(fā)起內(nèi)部心跳。其他實例在該節(jié)點的內(nèi)部心跳過期后，標記該節(jié)點為unhealthy，并在任何功能中都不會再使用該節(jié)點。這里有一個細節(jié)，節(jié)點下線不會參考Redis側(cè)的數(shù)據(jù)，Redis故障無法響應(yīng)查詢請求時，所有注冊中心實例都以兩兩心跳為準。

我們可以了解到，注冊中心實例的上線是強依賴Redis的，但是運行時并不依賴Redis。在Redis故障和運維時，注冊中心的基本功能不受影響，只是無法進行擴容。

三、設(shè)計取舍

新增代理還是Smart SDK？

注冊中心設(shè)計之初只有Data一層，由于要引入分片機制，才有了Session。那么是不是也可以把分片的邏輯做到SDK，而不引入Session這一層呢？

這也是一種方式，業(yè)界也一直有著代理和Smart SDK之爭。我們基于注冊中心所對應(yīng)的業(yè)務(wù)場景，認為新增一層代理是更加合適的。

最重要的一點，注冊中心的相關(guān)功能運行不在BU業(yè)務(wù)邏輯主鏈路上，其響應(yīng)時間并非直接影響業(yè)務(wù)的響應(yīng)時間。因此我們對注冊中心的請求響應(yīng)時間并沒有極致的要求，代理層引入的幾百微秒的延遲可以被接受。

其次注冊中心的請求是一定程度容忍失敗的，SDK請求數(shù)據(jù)失敗后可以繼續(xù)使用內(nèi)存中的老數(shù)據(jù)，不會對業(yè)務(wù)線產(chǎn)生致命影響。因此代理層引入的失敗率也可以被接受。

另一側(cè)，代理的加入帶來了諸多好處。最直接地，落地分片邏輯不需要所有的SDK升級，分片邏輯迭代時，對業(yè)務(wù)也是無感。

其次，代理層也隔離了連接數(shù)這一瓶頸，當SDK層的實例不斷變多，連接數(shù)不斷增加時，只需要擴容代理層就能解決連接數(shù)的問題。這也是我們將它取名為Session的原因。

同時，我們也希望作為物理層的SDK邏輯更加輕量，比較重的邏輯放在邏輯層，這樣穩(wěn)定性更強更不容易出錯。比如后續(xù)會提到的“Data按業(yè)務(wù)隔離分組”就是在Session層實現(xiàn)的。

普通哈希還是一致性哈希？

攜程注冊中心的數(shù)據(jù)分片是采用普通哈希的，并沒有采用一致性哈希。

我們知道，一致性哈希相比普通哈希的最大賣點是當節(jié)點數(shù)量變化時，不需要遷移所有數(shù)據(jù)。

結(jié)合注冊中心的場景，我們用服務(wù)ID做哈希，而服務(wù)數(shù)量（也包括實例數(shù)量）是相對穩(wěn)定的，因此哈希節(jié)點的擴容周期會比較長，基本用不到一致性哈希的優(yōu)勢特性。哪怕一段時間內(nèi)業(yè)務(wù)迅速擴張，只要提前做好預估，留好余量一次性擴容就好了。

我們選擇普通的固定的哈希，并讓每一個分片都具備多個備份節(jié)點，這樣就基本可以認為每個分片都不會徹底掛掉，不用去實現(xiàn)數(shù)據(jù)遷移的邏輯，整個機制更簡單了。

要知道，數(shù)據(jù)遷移需要對注冊請求、查詢請求和訂閱請求進行同步切換，要處理好各種狀態(tài)，避免在數(shù)據(jù)遷移過程中錯查到空數(shù)據(jù)或者丟失變更事件，非常復雜危險。

自發(fā)現(xiàn)是否強依賴Redis？

前面也提到，注冊中心自發(fā)現(xiàn)的運行時是不依賴Redis的。有的同學可能會想到，如果運行時強依賴Redis，就可以去掉兩兩注冊了。

兩兩注冊確實是一個不好的設(shè)計，隨著集群的節(jié)點數(shù)越來越大，其產(chǎn)生的性能開銷肯定也會更大，影響整個注冊中心集群的拓展能力。

但在目前規(guī)模下，內(nèi)部心跳占用的系統(tǒng)資源并不可觀。哪怕規(guī)模再拓展，通過降低心跳的頻率，進一步降低資源開銷。

最大的好處是，Redis集群故障或者維護時，并不會對注冊中心的功能產(chǎn)生影響。

基于Redis還是用Java寫？

目前注冊中心的Data是用Java實現(xiàn)的。有的同學可能會想，Data層主要就是維護微服務(wù)實例的存活狀態(tài)，能不能直接用Redis實現(xiàn)呢？如果用Redis，不就可以直接復用Redis體系的擴容/切換能力了嗎？

比如基于Redis 6.0的Client Cache功能，通過Invalidate機制通知SDK重新更新服務(wù)信息。

不過在攜程注冊中心設(shè)計之初，Redis版本還比較老，沒有這些新feature，感覺基于pub/sub機制做注冊中心還挺麻煩的?，F(xiàn)在注冊中心已經(jīng)穩(wěn)定運行了好久，加了很多功能，比如路由策略一部分的計算過程就是在Data層完成的，暫時沒有必要推倒重建。

總的來說，用Java寫更可控，后續(xù)自定義程度更高。

四、需要注意的場景

突發(fā)流量

在遇到節(jié)假日，或是公司促銷活動，亦或是友商故障的情況下，公司集群會因為業(yè)務(wù)量急劇上升而迅速自動擴容，因而注冊中心會受到強勁的流量沖擊。

期間因為系統(tǒng)資源被榨干，注冊/發(fā)現(xiàn)請求可能會偶發(fā)失敗，事件推送延遲和丟失率會上升。嚴重時，部分調(diào)用方業(yè)務(wù)會無法及時感知到被調(diào)方的變動，從而導致請求失敗，或流量無法被分攤到新擴容的被調(diào)方實例。

我們發(fā)現(xiàn)，這些場景產(chǎn)生的流量有著很高的重復度，比如某個被調(diào)方實例擴容，調(diào)用方的眾多實例需要知道的信息是完全一樣的，又比如調(diào)用方實例擴容，這些新擴的實例部署著相同的代碼，它們依賴的被調(diào)方信息也是完全一樣的。

因此我們針對性的做了不少聚合與去重，大大降低了突發(fā)流量情況下的資源開銷。

流量不均衡

關(guān)于Data粘滯，這里有一個細節(jié)。那么多Data機器，Session選誰呢？目前Session是用類似隨機的方式選擇Data的。那就會有一個場景，我們對Data層進行版本更替，逐個實例重新發(fā)布，當一個實例被重置時，Session就會因為丟失粘滯對象而重新隨機選擇。

我們會發(fā)現(xiàn)，最后一個Data實例完成發(fā)布時，它不會被任何Session選中。而第一個發(fā)布的Data實例，它傾向于被更多的Session選中。

通常來說，越早發(fā)布的Data實例，就會被越多的Session選中。也正因為如此，更早發(fā)布的Data會承擔更多的流量，而最后發(fā)布的Data一般不承擔流量。這顯然是不合理的。

解決這個問題的方法也很簡單，我們引入擁有全局視角的第三者，整體調(diào)控Session的粘滯，保證Data盡可能地被相同數(shù)量的Session選中。

全局風險

前面也提到，Data層被分成了多分片，Session會對服務(wù)ID進行哈希，將心跳請求、訂閱請求、查詢請求分發(fā)到對應(yīng)的Data層分片中。

當程序出現(xiàn)預期外的問題（程序bug，OOM等等）導致某個Data無法正常的履行功能職責時，那些被分配到這個Data實的服務(wù)就會受到影響。

如果調(diào)配方式是對服務(wù)ID做哈希，那么所有業(yè)務(wù)線的任意服務(wù)都可能參與其中，從業(yè)務(wù)視角去看，就是整個公司都受到了影響。

對服務(wù)ID做哈希是有它的優(yōu)勢的，它無需引入過多的外部依賴，只需要一小段代碼就能工作。但我們還是認為避免全局故障更加重要。

因此我們最近對Data引入了業(yè)務(wù)語義，將Data分為多個組，以各個業(yè)務(wù)線命名。且我們可以按服務(wù)粒度對數(shù)據(jù)進行分配。默認情況下，我們會將服務(wù)分配到自己BU的分組上。

這樣，我們就具備了以下能力：

1）不同業(yè)務(wù)線的數(shù)據(jù)可以被很好的隔離，任一業(yè)務(wù)線的Data數(shù)據(jù)出現(xiàn)問題，不會影響到其他業(yè)務(wù)線。

2）注冊中心將獲得故障切換的能力，當個別服務(wù)的數(shù)據(jù)出現(xiàn)問題時，我們可以將它單獨切走。

3）我們可以將一些不重要的應(yīng)用單獨隔離到一個灰度分組，新代碼可以先發(fā)布到灰度分組上，盡可能避免新代碼引入的問題直接影響核心業(yè)務(wù)分組。

4）注冊中心將獲得應(yīng)用粒度的部署能力。在集群分配上，具備更強的靈活度，針對業(yè)務(wù)規(guī)模的大小合理分配系統(tǒng)資源。

從圖中可以看到，我們在引入分組邏輯的同時也兼容老的分片邏輯，這樣做是為了在分組邏輯上線過程初期，服務(wù)信息在Data層的分布可以盡可能保持不變，可以讓少數(shù)的服務(wù)先灰度切換到新增的分組上進行驗證。

當然，從去復雜度的角度考慮，最終分片邏輯還是要下線，垂直擴容的能力也可以由分組實現(xiàn)。

五、后續(xù)規(guī)劃

因為注冊中心引入了分組機制，并對各個業(yè)務(wù)線數(shù)據(jù)進行了隔離，注冊中心的集群規(guī)模也在因此膨脹，分組數(shù)量較多，運維成本也隨之上升。

后續(xù)我們計劃進一步優(yōu)化優(yōu)化單機性能，精簡優(yōu)化一些不必要的機制，降低機器數(shù)量。

同時，我們也希望注冊中心能夠支持彈性，能夠在業(yè)務(wù)高峰時自動擴容，在業(yè)務(wù)低峰時自動縮容。

責任編輯：張燕妮來源：攜程技術(shù)

攜程注冊中心

51CTO技術(shù)棧公眾號

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學堂精培企業(yè)培訓 CTO訓練營

<sub id="w1dwr"></sub>

<cite id="w1dwr"></cite>

^{<blockquote id="w1dwr"></blockquote>}

<cite id="w1dwr"></cite>

<sub id="w1dwr"></sub>