自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

我來教你如何組裝一個注冊中心?

開發(fā) 前端
本文打算從需求分析開始,一步步拆解各個模塊,整個注冊中心以一種如無必要,勿增實(shí)體的原則進(jìn)行組裝,但也不會是個玩具,向生產(chǎn)可用對齊。

hello,大家好呀,我是小樓。今天不寫B(tài)UG,來聊一聊注冊中心。

標(biāo)題本來想叫《如何設(shè)計一個注冊中心》,但網(wǎng)上已經(jīng)有好多類似標(biāo)題的文章了。所以打算另辟蹊徑,換個角度,如何組裝一個注冊中心。

組裝意味著不必從0開始造輪子,這也比較符合許多公司對待自研基礎(chǔ)組件的態(tài)度。

知道如何組裝一個注冊中心有什么用呢?

第一可以更深入理解注冊中心。以我個人經(jīng)歷來說,注冊中心的第一印象就是Dubbo的Zookeeper(以下簡稱zk),后來逐漸深入,學(xué)會了如何去zk上查看Dubbo注冊的數(shù)據(jù),并能排查一些問題。后來了解了Nacos,才發(fā)現(xiàn),原來注冊中心還可以如此簡單,再后來一直從事服務(wù)發(fā)現(xiàn)相關(guān)工作,對一些細(xì)枝末節(jié)也有了一些新的理解。

第二可以學(xué)習(xí)技術(shù)選型的方法,注冊中心中的每個模塊,都會在不同的需求下有不同的選擇,最終的選擇取決于對需求的把握以及技術(shù)視野,但這兩項是內(nèi)功,一時半會練不成,學(xué)個選型的方法還是可以的。

本文打算從需求分析開始,一步步拆解各個模塊,整個注冊中心以一種如無必要,勿增實(shí)體的原則進(jìn)行組裝,但也不會是個玩具,向生產(chǎn)可用對齊。

當(dāng)然在實(shí)際項目中,不建議重復(fù)造輪子,盡量用現(xiàn)成的解決方案,所以本文僅供學(xué)習(xí)參考。

需求分析

圖片

本文的注冊中心需求很簡單,就三點(diǎn):可注冊、能發(fā)現(xiàn)、高可用。

服務(wù)的注冊和發(fā)現(xiàn)是注冊中心的基本功能,高可用則是生產(chǎn)環(huán)境的基本要求,如果高可用不要求,那本文可講解的內(nèi)容就很少,上圖中的高可用標(biāo)注只是個示意,高可用在很多方面都有體現(xiàn)。

至于其他花里胡哨的功能,我們暫且不表。

我們這里介紹三個角色,后文以此為基礎(chǔ):

  • 提供者(Provider):服務(wù)的提供方(被調(diào)用方)
  • 消費(fèi)者(Consumer):服務(wù)的消費(fèi)方(調(diào)用方)
  • 注冊中心(Registry):本文主角,服務(wù)提供列表、消費(fèi)關(guān)系等數(shù)據(jù)的存儲方

接口定義

注冊中心和客戶端(SDK)的交互接口有三個:

  • 注冊(register),將服務(wù)提供方注冊到注冊中心
  • 注銷(unregister),將注冊的服務(wù)從注冊中心中刪除
  • 訂閱(subscribe),服務(wù)消費(fèi)方訂閱需要的服務(wù),訂閱后提供方有變更將通知到對應(yīng)的消費(fèi)方

注冊、注銷可以是服務(wù)提供方的進(jìn)程發(fā)起,也可以是其他的旁路程序輔助發(fā)起,比如發(fā)布系統(tǒng)在發(fā)布一臺機(jī)器完成后,可調(diào)用注冊接口,將其注冊到注冊中心,注銷也是類似流程,但這種方式并不多見,而且如果只考慮實(shí)現(xiàn)一個注冊中心,必然是可以單獨(dú)運(yùn)行的,所以通常注冊、注銷由提供方進(jìn)程負(fù)責(zé)。

有了這三個接口,我們該如何去定義接口呢?注冊服務(wù)到底有哪些字段需要注冊?訂閱需要傳什么字段?以什么序列化方式?用什么協(xié)議傳輸?

這些問題接踵而來,我覺得我們先不急著去做選擇,先看看這個領(lǐng)域有沒有相關(guān)標(biāo)準(zhǔn),如果有就參考或者直接按照標(biāo)準(zhǔn)實(shí)現(xiàn),如果沒有,再來分析每一點(diǎn)的選擇。

服務(wù)發(fā)現(xiàn)還真有一套標(biāo)準(zhǔn),但又不完全有。它叫OpenSergo,它其實(shí)是服務(wù)治理的一套標(biāo)準(zhǔn),包含了服務(wù)發(fā)現(xiàn):

OpenSergo 是一套開放、通用的、面向分布式服務(wù)架構(gòu)、覆蓋全鏈路異構(gòu)化生態(tài)的服務(wù)治理標(biāo)準(zhǔn),基于業(yè)界服務(wù)治理場景與實(shí)踐形成通用標(biāo)準(zhǔn)規(guī)范。OpenSergo 的最大特點(diǎn)就是以統(tǒng)一的一套配置/DSL/協(xié)議定義服務(wù)治理規(guī)則,面向多語言異構(gòu)化架構(gòu),做到全鏈路生態(tài)覆蓋。無論微服務(wù)的語言是 Java, Go, Node.js 還是其它語言,無論是標(biāo)準(zhǔn)微服務(wù)還是 Mesh 接入,從網(wǎng)關(guān)到微服務(wù),從數(shù)據(jù)庫到緩存,從服務(wù)注冊發(fā)現(xiàn)到配置,開發(fā)者都可以通過同一套 OpenSergo CRD 標(biāo)準(zhǔn)配置針對每一層進(jìn)行統(tǒng)一的治理管控,而無需關(guān)注各框架、語言的差異點(diǎn),降低異構(gòu)化、全鏈路服務(wù)治理管控的復(fù)雜度。

官網(wǎng):https://opensergo.io/

我們需要的服務(wù)注冊與發(fā)現(xiàn)也被納入其中:

圖片

說有但也不是完全有是因為這個標(biāo)準(zhǔn)還在建設(shè)中,服務(wù)發(fā)現(xiàn)相關(guān)的標(biāo)準(zhǔn)在寫這篇文章的時候還沒有給出。

既然沒有標(biāo)準(zhǔn),可以結(jié)合現(xiàn)有的系統(tǒng)以及經(jīng)驗來定義,這里我用json的序列化方式給出,以下為筆者的總結(jié),不能囊括所有情形,需要時根據(jù)業(yè)務(wù)適當(dāng)做一些調(diào)整:

服務(wù)注冊入?yún)?/strong>?

{
"application":"provider_test", // 應(yīng)用名
"protocol":"http", // 協(xié)議
"addr":"127.0.0.1:8080", // 提供方的地址
"meta":{ // 攜帶的元數(shù)據(jù),以下三個為示例
"cluster":"small",
"idc":"shanghai",
"tag":"read"
}
}

服務(wù)訂閱入?yún)?/strong>

{
"subscribes":[
{
"provider":"test_provider1", // 訂閱的應(yīng)用名
"protocol":"http", // 訂閱的協(xié)議
"meta":{ // 攜帶的元數(shù)據(jù),以下為示例
"cluster":"small",
"idc":"shanghai",
"tag":"read"
}
},
{
"provider":"test_provider2",
"protocol":"http",
"meta":{
"cluster":"small",
"tag":"read"
}
}
]
}

服務(wù)發(fā)現(xiàn)出參

{
"version":"23des4f", // 版本
"endpoints":[ // 實(shí)例
{
"application":"provider_test",
"protocol":"http",
"addr":"127.0.0.1:8080",
"meta":{
"cluster":"small",
"idc":"shanghai",
"tag":"read"
}
},
{
"application":"provider_test",
"protocol":"http",
"addr":"127.0.0.2:8080",
"meta":{
"cluster":"small",
"idc":"shanghai",
"tag":"read"
}
}
]
}

變更推送 & 服務(wù)健康檢查

有了定義,我們?nèi)绾芜x擇序列化方式?選擇序列化方式有兩個重要參考點(diǎn):

  • 語言的適配程度,比如 json 幾乎所有編程語言都能適配。除非能非常確定5-10年內(nèi)不會有多語言的需求,否則我還是非常建議你選擇一個跨語言的序列化協(xié)議
  • 性能,序列化的性能包含了兩層意思,序列化的速度(cpu消耗)與序列化后的體積,設(shè)想一個場景,一個服務(wù)被非常多的應(yīng)用訂閱,如果此時該服務(wù)發(fā)布,則會觸發(fā)非常龐大的推送事件,此時注冊中心的cpu和網(wǎng)絡(luò)則有可能被打滿,導(dǎo)致服務(wù)不可用

至于編程語言的選擇,我覺得應(yīng)該更加偏向團(tuán)隊對語言的掌握,以能hold住為最主要,這點(diǎn)沒什么好說的,一般也只會在 Java / Go 中去選,很少見用其他語言實(shí)現(xiàn)的注冊中心。

對于注冊、訂閱接口,無論是基于TCP的自定義私有協(xié)議,還是用HTTP協(xié)議,甚至基于HTTP2的gRPC我覺得都可以。

但變更推送這個技術(shù)點(diǎn)的實(shí)現(xiàn),有多種實(shí)現(xiàn)方式:

  • 定時輪詢,每隔一段時間向注冊中心請求查詢訂閱的服務(wù)提供列表
  • 長輪詢,向注冊中心查詢訂閱的服務(wù)提供列表,如果列表較上次沒有變化,則服務(wù)端hold住請求,等待有變化或者超時(較長時間)才返回
  • UDP推送,服務(wù)列表有變化時通過UDP將事件通知給客戶端,但UDP推送不一定可靠,可能會丟失、亂序,故要配合定時輪詢(較長時間間隔)來作為一個兜底
  • TCP長連接推送,客戶端與注冊中心建立一個TCP長連接,有變更時推送給客戶端

從實(shí)現(xiàn)的難易、實(shí)時性、資源消耗三個方面來比較這四種實(shí)現(xiàn)方式:


實(shí)現(xiàn)難易

實(shí)時性

資源消耗

備注

定時輪詢

簡單

實(shí)時性越高,資源消耗越多

長輪詢

中等

中等

服務(wù)端hold住很多請求

UDP推送

中等

推送可能丟失,需要配合定時輪詢(間隔較長)

TCP長連接推送

中等

中等

服務(wù)端需要保持很多長連接

似乎我們不好抉擇到底使用哪種方式來做推送,但以我自己的經(jīng)驗來看,定時輪詢應(yīng)該首先被排除,因為即便是一個初具規(guī)模的公司,定時輪詢的消耗也是巨大的,更何況這種消耗隨著實(shí)時性以及服務(wù)的規(guī)模日漸龐大,最后變得不可維護(hù)。

剩下三種方案都可以選擇,我們可以繼續(xù)結(jié)合服務(wù)節(jié)點(diǎn)的健康檢查來綜合判斷。

服務(wù)啟動時注冊到注冊中心,當(dāng)服務(wù)停止時,從注冊中心摘除,通常摘除會借助劫持kill?信號實(shí)現(xiàn),如果是Java則有封裝好的ShutdownHook,當(dāng)進(jìn)程被 kill 時,觸發(fā)劫持邏輯,從注冊中心摘除,實(shí)現(xiàn)優(yōu)雅退出。

但事情不總是如預(yù)期,如果有人執(zhí)行了kill -9強(qiáng)制殺死進(jìn)程,或者機(jī)器出現(xiàn)硬件故障,會導(dǎo)致提供者還在注冊中心,但已無法提供服務(wù)。

此時需要一種健康檢查機(jī)制來確保服務(wù)宕機(jī)時,消費(fèi)者能正常感知,從而切走流量,保證線上服務(wù)的穩(wěn)定性。

關(guān)于健康檢查機(jī)制,在之前的文章《??服務(wù)探活的五種方式??》中有專門的總結(jié),這里也列舉一下,以便做出正確的選擇:


優(yōu)點(diǎn)

缺點(diǎn)

消費(fèi)者被動探活

不依賴注冊中心

需在服務(wù)調(diào)用處實(shí)現(xiàn)邏輯;用真實(shí)流量探測,可能會有滯后性

消費(fèi)者主動探活

不依賴注冊中心

需在服務(wù)調(diào)用處實(shí)現(xiàn)邏輯

提供者上報心跳

對調(diào)用無入侵

需消費(fèi)者服務(wù)發(fā)現(xiàn)模塊實(shí)現(xiàn)邏輯,服務(wù)端處理心跳消耗資源大

注冊中心主動探測

對客戶端無要求

資源消耗大,實(shí)時性不高

提供者與注冊中心會話保持

實(shí)時性好,資源消耗少

與注冊中心需保持TCP長連接

我們暫時無法控制調(diào)用動作,故而前2項依賴消費(fèi)者的方案排除,提供者上報心跳如果規(guī)模較小還好,上點(diǎn)規(guī)模也會不堪重任,這點(diǎn)在Nacos中就體現(xiàn)了,Nacos 1.x版本使用提供者上報心跳的方式保持服務(wù)健康狀態(tài),由于每次上報健康狀態(tài)都需要寫入數(shù)據(jù)(最后健康檢查時間),故對資源的消耗是非常大的,所以Nacos 2.0版本后就改為了長連接會話保持健康狀態(tài)。

所以健康檢查我個人比較傾向最后兩種方案:注冊中心主動探測與提供者與注冊中心會話保持的方式。

結(jié)合上述變更推送,我們發(fā)現(xiàn)如果實(shí)現(xiàn)了長連接,好處將很多,很多情況下,一個服務(wù)既是消費(fèi)者,又是提供者,此時一條TCP長連接可以解決推送和健康檢查,甚至在注冊注銷接口的實(shí)現(xiàn),我們也可以復(fù)用這條連接,可謂是一石三鳥。

長連接技術(shù)選型

長連接的技術(shù)選型,在《Nacos架構(gòu)與原理》這本電子書中有有詳細(xì)的介紹,我覺得這部分堪稱技術(shù)選型的典范,我們參考下,本節(jié)內(nèi)容大量參考《Nacos架構(gòu)與原理》,如有雷同,那便是真是雷同。

首先是長連接的核心訴求:

圖片

圖來自《Nacos架構(gòu)與原理》

  • 低成本快速感知:客戶端需要在服務(wù)端不可用時盡快地切換到新的服務(wù)節(jié)點(diǎn),降低不可用時間

客戶端正常重啟:客戶端主動關(guān)閉連接,服務(wù)端實(shí)時感知

服務(wù)端正常重啟 : 服務(wù)端主動關(guān)閉連接,客戶端實(shí)時感知

  • 防抖:網(wǎng)絡(luò)短暫不可用,客戶端需要能接受短暫網(wǎng)絡(luò)抖動,需要一定重試機(jī)制,防止集群抖動,超過閾值后需要自動切換 server,但要防止請求風(fēng)暴
  • 斷網(wǎng):斷網(wǎng)場景下,以合理的頻率進(jìn)行重試,斷網(wǎng)結(jié)束時可以快速重連恢復(fù)
  • 低成本多語言實(shí)現(xiàn):在客戶端層面要盡可能多的支持多語言,降低多 語言實(shí)現(xiàn)成本
  • 開源社區(qū):文檔,開源社區(qū)活躍度,使用用戶數(shù)等,面向未來是否有足夠的支持度

據(jù)此,我們可選的輪子有:


gRPC

Rsocket

Netty

Mina

客戶端感知斷連

基于 stream 流 error complete 事件可實(shí)現(xiàn)

支持

支持

支持

服務(wù)端感知斷連

支持

支持

支持

支持

心跳?;?/p>

應(yīng)用層自定義,ping-pong 消息

自定義 kee palive frame

TCP+ 自定義

自定義 kee palive filter

多語言支持

強(qiáng)

一般

只Java

只Java

我比較傾向gRPC,而且gRPC的社區(qū)活躍度要強(qiáng)于Rsocket。

數(shù)據(jù)存儲

注冊中心數(shù)據(jù)存儲方案,大致可分為2類:

  • 利用第三方組件完成,如Mysql、Redis等,好處是有現(xiàn)成的水平擴(kuò)容方案,穩(wěn)定性強(qiáng);壞處是架構(gòu)變得復(fù)雜
  • 利用注冊中心本身來存儲數(shù)據(jù),好處是無需引入額外組件;壞處是需要解決穩(wěn)定性問題

第一種方案我們不必多說,第二種方案中最關(guān)鍵的就是解決數(shù)據(jù)在注冊中心各節(jié)點(diǎn)之間的同步,因為在數(shù)據(jù)存儲在注冊中心本身節(jié)點(diǎn)上,如果是單機(jī),機(jī)器故障或者掛掉,數(shù)據(jù)存在丟失風(fēng)險,所以必須得有副本。

數(shù)據(jù)不能丟失,這點(diǎn)必須要保證,否則穩(wěn)定性就無從談起了。保證數(shù)據(jù)不丟失怎么理解?在客戶端向注冊中心發(fā)起注冊請求后,收到正常的響應(yīng),這就意味著數(shù)據(jù)存儲了起來,除非所有注冊中心節(jié)點(diǎn)故障,否則數(shù)據(jù)就一定要存在。

如下圖,比如提供者往一個節(jié)點(diǎn)注冊數(shù)據(jù)后,正常響應(yīng),但是數(shù)據(jù)同步是異步的,在同步完成前,nodeA節(jié)點(diǎn)就掛掉,則這條注冊數(shù)據(jù)就丟失了。

圖片

所以,我們要極力避免這種情況。

而一致性算法(如raft)就解決了這個問題,一致性算法能保證大部分節(jié)點(diǎn)是正常的情況下,能對外提供一致的數(shù)據(jù)服務(wù),但犧牲了性能和可用性,raft算法在選主時便不能對外提供服務(wù)。

有沒有退而求其次的算法呢?還真有,像Nacos、Eureka提供的AP模型,他們的核心點(diǎn)在于客戶端可以recover數(shù)據(jù),也就是注冊中心追求最終一致性,如果某些數(shù)據(jù)丟失,服務(wù)提供方是可以重新將數(shù)據(jù)注冊上來。

比如我們將提供方與注冊中心之間設(shè)計為長連接,提供方注冊服務(wù)后,連接的節(jié)點(diǎn)還沒來得及將數(shù)據(jù)同步到其他節(jié)點(diǎn)就掛了,此時提供方的連接也會斷開,當(dāng)連接重新建立時,服務(wù)提供方可以重新注冊,恢復(fù)注冊中心的數(shù)據(jù)。

對于注冊中心選用AP、還是CP模型,業(yè)界早有爭論,但也基本達(dá)成了共識,AP要優(yōu)于CP,因為數(shù)據(jù)不一致總比不可用要好吧?你說是不是。

高可用

其實(shí)高可用的設(shè)計散落在各個細(xì)節(jié)點(diǎn),如上文提到的數(shù)據(jù)存儲,其基本要求就是高可用。除此之外,我們的設(shè)計也都必須是面向失敗的設(shè)計。

假設(shè)我們的服務(wù)器會全部掛掉,怎樣才能保持服務(wù)間的調(diào)用不受影響?

通常注冊中心不侵入服務(wù)調(diào)用,而是在內(nèi)存(或磁盤)中緩存一份服務(wù)列表,當(dāng)注冊中心完全掛了,大不了這份緩存不再更新,但也不影響現(xiàn)有的服務(wù)調(diào)用,但新應(yīng)用啟動就會受到影響。

總結(jié)

本文內(nèi)容略多,用一幅圖來總結(jié):

圖片

組裝一個線上可用的注冊中心最小集,從需求分析出發(fā),每一步都有許多選擇,本文通過一些核心的技術(shù)選型來描繪出一個大致藍(lán)圖,剩下的工作就是用代碼將這些組裝起來。

責(zé)任編輯:武曉燕 來源: 捉蟲大師
相關(guān)推薦

2022-08-26 01:46:33

注冊中心NacosDNS

2018-10-11 21:00:18

2024-05-16 10:59:16

Vue項目前端

2024-03-06 11:14:13

ViteReact微前端

2018-07-06 13:58:18

程序員學(xué)習(xí)互聯(lián)網(wǎng)

2019-01-23 10:11:43

Python爬蟲IP

2018-10-08 15:00:47

Python區(qū)塊鏈編程語言

2018-07-19 09:15:27

2021-05-27 11:10:23

注冊中心業(yè)務(wù)

2023-09-04 08:45:07

分布式配置中心Zookeeper

2013-08-26 13:58:20

2020-01-11 17:00:07

DjangoPythonWeb API

2023-07-11 06:32:03

2023-07-12 07:06:23

2019-09-30 09:26:29

Java編程語言國旗

2019-07-31 07:36:12

架構(gòu)運(yùn)維技術(shù)

2022-03-07 05:53:41

線程CPU代碼

2017-03-16 15:27:10

面試官測試技術(shù)

2009-07-14 21:41:10

數(shù)據(jù)中心計算機(jī)系統(tǒng)

2017-02-13 08:21:36

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號