自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

突破存儲跨中心雙活方案設計階段難點之五:雙中心間通訊不可控

存儲 存儲軟件
雙中心間通訊不可控問題:一是鏈路穩(wěn)定狀況不可控;二是IO延時指標不可控。這些不可控因素非常容易造成災難性影響,輕則導致數(shù)據(jù)庫讀寫性能災難,重則導致數(shù)據(jù)庫節(jié)點直接處于僵死狀態(tài)。

存儲跨中心雙活最關鍵、最難點就是鏈路質(zhì)量,如何把控該風險?

雙中心間通訊不可控問題:一是鏈路穩(wěn)定狀況不可控;二是IO延時指標不可控。這些不可控因素非常容易造成災難性影響,輕則導致數(shù)據(jù)庫讀寫性能災難,重則導致數(shù)據(jù)庫節(jié)點直接處于僵死狀態(tài)。另外,鏈路的不穩(wěn)定會導致存儲鏈路頻繁切換,甚至會導致集群仲裁頻繁發(fā)生,這對于業(yè)務連續(xù)性更是一個災難。

[[207787]]

解析和解答

鄧毓 某農(nóng)信社資深骨干工程師

無論什么雙活,只要上升到了跨中心的層面,就必然需要跨中心的鏈路作為雙活的通訊介質(zhì)。這個通訊不但要求高可用性和冗余度,而且又對通訊質(zhì)量要求又很高。并且鏈路所帶來的風險隱患又是巨大的,中斷或者響應時間高都將可能導致雙活集群發(fā)生腦裂仲裁,出于保護的目的,將IO HANG住一段時間,將所有沒有落入磁盤的數(shù)據(jù)全部刷盤,才繼續(xù)在某個存活的站點繼續(xù)恢復讀寫訪問。所以阻礙存儲跨中心雙活技術發(fā)展的最直接的因素就是雙中心間鏈路不可控。尤其對風險、穩(wěn)定性要求苛刻的金融機構來說,更加不敢輕易做跨中心的雙活。所以鏈路成為了存儲雙活的最難點,如何既提高鏈路穩(wěn)定性,又保證鏈路的性能,還又有合理的故障保障機制,是每一個存儲廠商和企業(yè)用戶都要深思的關鍵點。

在這里我也不刻意去解決該難題,而是提出些許我的想法。

1.鏈路冗余度

通常我們企業(yè)做雙活,都是自己購買波分設備,然后租用運營商的裸光纖,作為通訊的鏈路。所以波分設備需要冗余,裸光纖也要冗余,波分設備好辦,購買即可。裸光纖通常租用兩家或兩家以上的運營商線路,比如電信和聯(lián)通,電信的裸光纖也需要冗余,聯(lián)通的裸光纖也需要冗余,防止單根裸光纖意外割斷或者損壞。然而單家運營商的裸纖都通常在一個弱點井中,一起意外割斷的事情常有,所以需要兩家運營商互相冗余。這兩家運營商裸纖的路線還不能一致,弱電井需要在不同的街道,并且分別走不同的路線到達目的地。所以可以看到,由于我們是租用,根本不可能要求運營商完全達到你的要求,***的方式只能自建,成本太高,好像根本不現(xiàn)實。

示意圖:

2.鏈路質(zhì)量

鏈路質(zhì)量包括光衰、抖動和帶寬等。一方面,光衰和抖動無法控制,只能靠波分設備去探測,發(fā)現(xiàn)光衰和抖動,立即中斷該鏈路,切向備鏈路,這對后端的SAN網(wǎng)絡無感知,但對波分設備的要求很高,需要購買和建設時注意。至于帶寬,可以監(jiān)測,達到帶寬預警閾值后,可向運營商申請?zhí)嵘龓?。另一方面,對于鏈路質(zhì)量的監(jiān)測機制一定要在建設存儲雙活或者其他雙活之前建立,由于是運營商的鏈路,鏈路經(jīng)過了多少中繼、多少設備我們是不得知的,我們只能在波分端建立有效的監(jiān)測機制,有些波分設備也有專門的監(jiān)控軟件支持。而且也要要求和運營商建立監(jiān)測聯(lián)動機制,運營商監(jiān)測到鏈路質(zhì)量(是質(zhì)量而不是中斷)有問題,也需要***時間告知,做出合理的決策。

3.存儲雙活控制器的機制

由于跨中心的雙活控制器間的通訊是實時的,完整寫周期必須兩個站點的控制器都完成寫操作。他們間的通訊又是靠鏈路完成的,鏈路質(zhì)量和鏈路中斷都將導致性能波動甚至超時,對于中斷,控制器的處理機制都還不錯,對于質(zhì)量,控制器的處理機制往往不夠,需要長時間的嘗試,才會做出合理的決策,甚至沒有決策,導致上層數(shù)據(jù)庫或者應用磁盤IO超時,而異常掛起甚至宕機。所以這個機制是決定好的雙活體系的重要因素,有時候?qū)幙闪⒓捶艞壱贿叄惨WTO,但目前為止我還未發(fā)現(xiàn)雙活存儲控制器有好的鏈路質(zhì)量處理機制。知道的也請分享。

4.雙活存儲上端的OS、應用和數(shù)據(jù)庫合理的超時參數(shù)

OS識別磁盤、應用訪問文件系統(tǒng)、數(shù)據(jù)庫訪問裸設備或者文件系統(tǒng),存儲IO HANG住,將導致層層超時,尤其是數(shù)據(jù)庫,超時將徹底中斷宕機,甚至出現(xiàn)邏輯損壞等莫名奇妙的問題。有時候超時響應慢是可以等,而不是中止,所以需要OS、數(shù)據(jù)庫層進行合理的超時聯(lián)動設置。

5.盡量避免跨站點讀,減少跨站點寫頻率

沒有跨站點讀,就意味著本地可讀,對鏈路質(zhì)量沒有要求;減少跨站點寫頻率,就意味著,性能影響弱化,被控制器、數(shù)據(jù)庫、操作系統(tǒng)等層層緩存暫存的寫數(shù)據(jù),會減少跨站點寫的次數(shù),進一步弱化鏈路質(zhì)量所會帶來的影響。

責任編輯:武曉燕 來源: talkwithtrend
相關推薦

2017-10-19 08:23:02

存儲雙活性能

2017-10-18 08:24:11

存儲雙活腦裂風險

2017-10-24 11:12:26

存儲數(shù)據(jù)錯誤

2017-10-20 10:22:15

存儲風險設計

2015-03-20 10:49:09

雙活數(shù)據(jù)中心方案CeBIT展華為

2015-03-19 13:59:31

雙獲數(shù)據(jù)中心/華為

2014-11-03 16:24:55

阿里云

2015-03-02 11:31:34

雙活數(shù)據(jù)中心解決方案重慶大學華為

2022-07-07 07:51:00

數(shù)據(jù)中心存儲層腦裂

2016-07-06 16:16:59

數(shù)據(jù)中心

2017-10-20 10:34:37

存儲雙活實施

2017-11-16 08:31:01

系統(tǒng)存儲難點

2015-10-29 17:55:32

存儲雙活宕機銀行

2017-11-22 17:14:47

華為

2015-04-02 13:59:36

雙活數(shù)據(jù)中心華為

2015-01-15 16:14:24

HDS/雙活GAD

2024-12-02 12:23:25

2018-11-30 12:11:11

Oracle存儲配置

2025-04-28 08:35:07

2015-03-30 17:12:31

雙活數(shù)據(jù)中心遼寧人民醫(yī)院華為
點贊
收藏

51CTO技術棧公眾號