干貨滿滿!史上超全 Oracle ADG 部署架構(gòu)、變化及應(yīng)急處置思路
天下武功,唯快不破!
運(yùn)維應(yīng)急處置,唯快不破!
當(dāng)內(nèi)外部監(jiān)管處罰力度,以分鐘計(jì)算時(shí),應(yīng)急處置,分秒必爭(zhēng)!
要實(shí)現(xiàn)快速應(yīng)急處置,漂亮的將危機(jī)轉(zhuǎn)化為赫赫戰(zhàn)功,一個(gè)好架構(gòu)設(shè)計(jì),及清晰處置思路,會(huì)讓你無(wú)往不勝!
注意,下面要講的,是史上最全的ADG架構(gòu)及變化,以及處置思路,全都來(lái)自實(shí)際生產(chǎn)運(yùn)維的血淚總結(jié)!極具收藏和反復(fù)查閱價(jià)值!
1. 什么是 Oracle ADG
簡(jiǎn)單的說(shuō),ADG 是 Oracle 的一種容災(zāi)架構(gòu),可以確保在主站點(diǎn)(往往使用RAC架構(gòu))出現(xiàn)異常時(shí),應(yīng)急處置切換到備用 ADG 站點(diǎn)繼續(xù)提供服務(wù)。
主備站點(diǎn)的距離,可以是同一個(gè)機(jī)房?jī)?nèi)、同一個(gè)數(shù)據(jù)中心內(nèi)、同城、異地,都可以是實(shí)現(xiàn)ADG容災(zāi)結(jié)構(gòu)。由于ADG往往配置為人工切換,而非自動(dòng)切換模式。
因此人工切換的效率直接體現(xiàn)了應(yīng)急處置的效果!
2. Oracle ADG 基礎(chǔ)部署架構(gòu)
以負(fù)載均衡+應(yīng)用服務(wù)器+Oracle RAC(ADG)三層結(jié)構(gòu)為例,基礎(chǔ)架構(gòu)如下圖所示。
當(dāng) OracleRAC 主庫(kù)出現(xiàn)問(wèn)題的時(shí)候,通過(guò) failover 切換到ADG庫(kù),繼續(xù)提供服務(wù)。
但是僅僅一個(gè)failover命令是不夠的,因?yàn)樵谶@個(gè)過(guò)程當(dāng)中,數(shù)據(jù)庫(kù)對(duì)外服務(wù)的地址發(fā)生了改變,從原來(lái)主庫(kù)的地址IP1改變?yōu)閍dg的地址IP2。
這時(shí)候?qū)嶋H上前端的應(yīng)用服務(wù)器連接到數(shù)據(jù)庫(kù)是失效的,無(wú)法對(duì)外提供正常服務(wù)。
對(duì)于數(shù)據(jù)庫(kù)的地址,變或不變,相應(yīng)帶來(lái)架構(gòu)規(guī)劃上的變化,下面逐一說(shuō)明。
3. 架構(gòu)規(guī)劃變化,及適用場(chǎng)景
變化1,RAC地址與ADG服務(wù)地址在同一網(wǎng)段
應(yīng)急處置操作思路
- failover切換到adg庫(kù)
- 修改ADG庫(kù)IP2為主庫(kù)地址IP1
- 驗(yàn)證業(yè)務(wù)是否恢復(fù)
注意,這種情況下,如果應(yīng)用服務(wù)器支持重連,那么就不需要再做任何操作,服務(wù)就會(huì)恢復(fù)正常。
如果應(yīng)用服務(wù)器不支持重連操作,那么需要再做一次應(yīng)用服務(wù)器的重啟操作。
變化2,RAC和ADG處于不同網(wǎng)段,RAC與ADG,使用同一套應(yīng)用服務(wù)器
應(yīng)急處置操作思路
- failover切換到ADG庫(kù)
- 修改應(yīng)用服務(wù)器數(shù)據(jù)源,修改為adg庫(kù)的地址IP2
- 重啟應(yīng)用服務(wù)器集群連接ADG庫(kù)
- 驗(yàn)證業(yè)務(wù)是否恢復(fù)
注意,如果應(yīng)用服務(wù)器的數(shù)量較少,可以較快地完成應(yīng)用服務(wù)器的重啟,并恢復(fù)業(yè)務(wù)。
但是如果應(yīng)用服務(wù)器的數(shù)量較多,又處于業(yè)務(wù)高峰期,那么在應(yīng)用服務(wù)器逐個(gè)重啟的過(guò)程當(dāng)中,高并發(fā)的業(yè)務(wù)量會(huì)將已經(jīng)重啟的應(yīng)用服務(wù)器壓垮,從而導(dǎo)致服務(wù)始終不能恢復(fù)正常。
變化3,RAC和ADG處于不同網(wǎng)段,且各自部署一套應(yīng)用服務(wù)器
應(yīng)急處置操作思路
- failover切換到ADG庫(kù)
- 業(yè)務(wù)更換訪問(wèn)地址2
- 驗(yàn)證業(yè)務(wù)是否恢復(fù)
注意,如果業(yè)務(wù)人員數(shù)量規(guī)模較大,難以一一通知到更換訪問(wèn)地址,會(huì)影響處置效率。
變化4,RAC和ADG處于不同網(wǎng)段,各自部署一套應(yīng)用服務(wù)器,以負(fù)載均衡統(tǒng)一業(yè)務(wù)訪問(wèn)地址。
應(yīng)急處置操作思路
- failover切換到ADG庫(kù)
- 更改負(fù)載均衡指向,為ADG庫(kù)的應(yīng)用服務(wù)器集群
- 驗(yàn)證業(yè)務(wù)是否恢復(fù)
總結(jié)
思維導(dǎo)圖如下