雙活還有真和假?
Live Volume with Auto-Failover (LVAFO)是Dell SC系列存儲內(nèi)置的解決方案功能,通俗的講就是兩套SC系列存儲建立同步復(fù)制的卷能夠同時被前端主機(jī)進(jìn)行讀寫訪問,而且還能夠?qū)崿F(xiàn)存儲級別的自動故障轉(zhuǎn)移,從而實(shí)現(xiàn)存儲的“雙活”。 兩臺存儲上的Live volume卷將使用相同的設(shè)備ID,當(dāng)主機(jī)掃描到備存儲上的卷時,不會將這個卷當(dāng)做一個新的設(shè)備,而是主機(jī)上的卷設(shè)備連接多了幾條路徑。 以一個500GB卷為例,在沒有將備存儲上的LV卷映射給主機(jī)前,主機(jī)上看到2條到主存儲LV卷的路徑。 [root@ljjr910-a ~]# multipath -ll mpathd(36000d31000f19000000000000000020f) dm-3 COMPELNT,Compellent Vol size=500G features='1 queue_if_no_path' hwhandler='0' wp=rw `-+- policy='round-robin 0' prio=1 status=active |- 3:0:9:2 sdb 8:16 active ready running `- 3:0:17:2 sde 8:64 active ready running 映射備存儲上的卷后,主機(jī)上看到一共看到4條路徑,其中2條是到主存儲的路徑,2條是到備存儲的路徑。 [root@ljjr910-a ~]# multipath -ll mpathd (36000d31000f19000000000000000020f) dm-3 COMPELNT,Compellent Vol size=500G features='1 queue_if_no_path' hwhandler='0' wp=rw `-+- policy='round-robin 0' prio=1 status=active |- 3:0:9:2 sdb 8:16 active ready running <-到主存儲的路徑 |- 3:0:17:2 sde 8:64 active ready running <-到主存儲的路徑 |- 3:0:13:2 sdg 8:96 active ready running <-到備存儲的路徑 `- 3:0:19:2 sdi 8:128 active ready running <-到備存儲的路徑 關(guān)閉主存儲后,主機(jī)上就只能看到到備存儲的2條路徑。 [root@ljjr910-a ~]# multipath -ll mpathd(36000d31000f19000000000000000020f) dm-3 COMPELNT,Compellent Vol size=500G features='1 queue_if_no_path' hwhandler='0' wp=rw `-+- policy='round-robin 0' prio=1 status=active |- 3:0:13:2 sdg 8:96 active ready running `- 3:0:19:2 sdi 8:128 active ready running LV with AFO如何實(shí)現(xiàn) Live Volume with Auto-Failover的實(shí)現(xiàn)主要有兩個關(guān)鍵點(diǎn),一是兩套SC存儲內(nèi)部LV卷都使用與主卷創(chuàng)建時相同的設(shè)備ID,二是通過主機(jī)上的多路徑在完成對設(shè)備的封裝后,變成一個卷,這個卷同時有到主存儲和備存儲的路徑。一旦主存儲出現(xiàn)意外(如斷電導(dǎo)致整個存儲不可用),主機(jī)上的IO只是發(fā)生路徑的切換,整個切換過程應(yīng)用不會中斷,保障業(yè)務(wù)的連續(xù)運(yùn)行。 LV with AFO 可靠么 檢驗(yàn)方案是否可靠,我們以事實(shí)說話,Dell部署服務(wù)團(tuán)多次以實(shí)戰(zhàn)來檢驗(yàn)過,真正的“雙活”是不怕測的。 如下是一個比較完整的具有Windows、VMware、Linux平臺應(yīng)用都有的存儲雙活典型案例。 VMware vSphere環(huán)境實(shí)戰(zhàn) 在VMware主機(jī)層面,2臺Dell PowerEdge 服務(wù)器部署 vSphere 6.0 U2 虛擬化平臺,配置了集群并啟用了HA功能,可以在一定程度上避免因?yàn)橹鳈C(jī)的硬件或軟件故障引起的非計劃停機(jī)和業(yè)務(wù)中斷。在存儲層面,Dell SC Storage Live Volume Auto-Failover (LVAFO) 提供的存儲雙活解決方案能避免因單套存儲因素引起的服務(wù)中斷,將2套存儲的live volume卷同時映射給虛擬化集群內(nèi)所有的vSphere 服務(wù)器,DataStore所在卷具有如下多路徑配置。 在DSM存儲管理界面,關(guān)閉主存儲,模擬主存儲故障。 在DSM中查看live volume存儲狀態(tài),可以看到LV卷的存儲角色自動故障轉(zhuǎn)移成功完成。 登錄到虛擬化服務(wù)器,確認(rèn)存儲卷是否能正常訪問,業(yè)務(wù)系統(tǒng)虛擬機(jī)是否正常運(yùn)行。 文件可以正常上傳,虛擬機(jī)可以正常運(yùn)行,不會因?yàn)橹鞔鎯Φ年P(guān)機(jī)而導(dǎo)致IO停止。 2 Windows平臺的Oracle RAC環(huán)境實(shí)戰(zhàn) 2臺Dell PowerEdge服務(wù)器安裝windows 2012 R2 服務(wù)器操作系統(tǒng),通過將SC4020主備存儲劃分過來的磁盤通過ASM整合后部署Oracle Rac數(shù)據(jù)庫,在一定程度上避免因?yàn)橹鳈C(jī)的硬件或軟件故障引起的非計劃停機(jī)和業(yè)務(wù)中斷。在存儲層面,Dell SC Storage Live Volume Auto-Failover (LVAF) 提供的存儲雙活解決方案能避免因單套存儲因素引起的服務(wù)中斷,將2套存儲的live volume卷同時映射給2臺Windows 2012服務(wù)器節(jié)點(diǎn),存儲卷多路徑設(shè)置如下。 在每個RAC節(jié)點(diǎn)下,調(diào)整ASM磁盤超時的參數(shù)asm_hbeatiowait,該參數(shù)在Oracle11.2.0.4中默認(rèn)是15秒,建議修改為120秒。 登錄到DSM管理界面,關(guān)閉主存儲,模擬主存儲故障。 在DSM管理頁面可以看到存儲狀態(tài)切換成功。 登錄到Windows服務(wù)器節(jié)點(diǎn),可以看到存儲卷還有兩條路徑在線。 主機(jī)層面卷可以正常識別,在Oracle應(yīng)用層面再確認(rèn)存儲卷是否能正常訪問,最后發(fā)現(xiàn)RAC數(shù)據(jù)庫依舊能正常運(yùn)行。 3 Linux平臺的Oracle RAC環(huán)境實(shí)戰(zhàn) Oracle RAC運(yùn)行于Linux平臺是目前比較常見的部署方式,而且最大限度的保障業(yè)務(wù)的連續(xù)運(yùn)行是Dell客戶比較關(guān)系的話題。 通過將Linux平臺的Oracle RAC 與LVAFO結(jié)合,能實(shí)現(xiàn)一個雙機(jī)雙柜的架構(gòu)模型。在主機(jī)層面通過Oracle RAC實(shí)現(xiàn)高可用性,當(dāng)一個主機(jī)出現(xiàn)故障后,RAC中的其它節(jié)點(diǎn)能繼續(xù)提供數(shù)據(jù)庫服務(wù)。在存儲層面,當(dāng)一臺存儲出現(xiàn)故障后,IO切換到另一臺存儲上。 在存儲SC4020-A上創(chuàng)建一個數(shù)據(jù)卷Data Disk和一個Voting Disk,將卷同時映射給服務(wù)器R910-A、R910-B。 在服務(wù)器上使用ASMLIB封裝數(shù)據(jù)卷Data Disk和 Voting Disk。 服務(wù)器A、B之間運(yùn)行Oracle RAC。 [root@ljjr910-a ~]# crs_stat -t Name Type Target State Host ------------------------------------------------- ora.DATA.dg ora....up.type ONLINE ONLINE ljjr910-a ora.GRID.dg ora....up.type ONLINE ONLINE ljjr910-a ora....ER.lsnr ora....er.type ONLINE ONLINE ljjr910-a ora....N1.lsnr ora....er.type ONLINE ONLINE ljjr910-b ora.asm ora.asm.type ONLINE ONLINE ljjr910-a ora.cvu ora.cvu.type ONLINE ONLINE ljjr910-b ora.dsc.db ora....se.type ONLINE ONLINE ljjr910-a ora.gsd ora.gsd.type OFFLINE OFFLINE ora....SM1.asm application ONLINE ONLINE ljjr910-a ora....-A.lsnr application ONLINE ONLINE ljjr910-a ora....0-a.gsd application OFFLINE OFFLINE ora....0-a.ons application ONLINE ONLINE ljjr910-a ora....0-a.vip ora....t1.type ONLINE ONLINE ljjr910-a ora....SM2.asm application ONLINE ONLINE ljjr910-b ora....-B.lsnr application ONLINE ONLINE ljjr910-b ora....0-b.gsd application OFFLINE OFFLINE ora....0-b.ons application ONLINE ONLINE ljjr910-b ora....0-b.vip ora....t1.type ONLINE ONLINE ljjr910-b ora....network ora....rk.type ONLINE ONLINE ljjr910-a ora.oc4j ora.oc4j.type ONLINE ONLINE ljjr910-b ora.ons ora.ons.type ONLINE ONLINE ljjr910-a ora.scan1.vip ora....ip.type ONLINE ONLINE ljjr910-b 將數(shù)據(jù)卷Data Disk和Voting Disk卷配置成Live Volume Auto Failover,將數(shù)據(jù)從SC4020-A 同步復(fù)制到SC4020-B,確保相關(guān)卷的live volume配對關(guān)系正常。 在SC4020-B上將數(shù)據(jù)卷Data Disk和 Voting Disk卷對應(yīng)的Live Volume卷也映射給服務(wù)器R910-A、R910-B;在服務(wù)器上查看,每個設(shè)備各有4條路徑。 [root@ljjr910-a ~]# multipath -ll mpathe (36000d31000f190000000000000000267) dm-2 COMPELNT,Compellent Vol size=1.0G features='1 queue_if_no_path' hwhandler='0' wp=rw `-+- policy='round-robin 0' prio=1 status=active |- 3:0:7:1 sda 8:0 active ready running |- 3:0:11:1 sdc 8:32 active ready running |- 3:0:15:1 sdh 8:112 active ready running `- 3:0:21:1 sdj 8:144 active ready running mpathd (36000d31000f19000000000000000020f) dm-3 COMPELNT,Compellent Vol size=500G features='1 queue_if_no_path' hwhandler='0' wp=rw `-+- policy='round-robin 0' prio=1 status=active |- 3:0:9:2 sdb 8:16 active ready running |- 3:0:17:2 sde 8:64 active ready running |- 3:0:13:2 sdg 8:96 active ready running `- 3:0:19:2 sdi 8:128 active ready running 如果使用了多個Voting Disk,還需要調(diào)整ASM磁盤超時的參數(shù)asm_hbeatiowait,該參數(shù)在Oracle11.2.0.4中默認(rèn)是15秒,建議修改為120秒。 使用HammerDB對RAC數(shù)據(jù)庫進(jìn)行壓力測試。 在DSM管理界面,關(guān)掉主存儲,存儲角色自動切換到備存儲。 而在測試過程中,在HammerDB的管理界面上可以看到,應(yīng)用出現(xiàn)短暫停頓后繼續(xù)運(yùn)行。
【責(zé)任編輯:張燕妮 TEL:(010)68476606】