存儲系統(tǒng)運(yùn)維可能遭遇的 8 個(gè)難點(diǎn)、雷區(qū)的處理
1、 v7000更換硬盤有哪些注意事項(xiàng)?
1) v7k和ds4k 5k有很多的不同,換磁盤就是其一!直接插拔磁盤不能完成磁盤的更換,而且將導(dǎo)致 legacy drive信息的產(chǎn)生,必須借助 CLI命令才能去除。
2) 按 Follow DMP (Directed Maintenance Procedures) 的指導(dǎo),從 fix procedure 的GUI界面完成;
3) 如果按照dmp的指導(dǎo)不能更換,請按照下面的步驟來:
確認(rèn)壞盤的id,這個(gè)自己去看文檔了!一定要確認(rèn)壞盤的物理位置,而且盤的燈確認(rèn)是琥珀色的。拔出壞盤,更換新盤。
進(jìn)入gui以后看見新盤也是offline和fail狀態(tài),右鍵這個(gè)磁盤,標(biāo)記為unused,成功后再改成candidate,再次成功后再改成spare 。
稍等,mdisk就會(huì)重建。
2、 DS5020 邏輯驅(qū)動(dòng)降級了如何處理?
1) 正常情況是存儲出現(xiàn)一塊硬盤損壞亮黃燈,這時(shí)熱備盤會(huì)代替壞硬盤,查看日志確認(rèn)硬盤損壞,換一塊新硬盤即可,這時(shí)熱備盤中的數(shù)據(jù)同步到新硬盤中,熱備盤恢復(fù)原來的熱備功能。樓主的情況需要最近再觀察存儲的工作狀態(tài)才能確認(rèn)是否是硬盤壞了。
2) 降級就是卷組存在故障磁盤,丟失一個(gè)或多個(gè)校驗(yàn)位磁盤,雖然數(shù)據(jù)仍然是完整的,但喪失了Raid保護(hù)機(jī)制,如果再有磁盤故障,數(shù)據(jù)丟失的風(fēng)險(xiǎn)會(huì)很大。實(shí)際情況可能是沒有配置熱備磁盤,也可能是當(dāng)前故障盤多余熱備盤。如果發(fā)現(xiàn)降級情況,應(yīng)該及時(shí)更換狀態(tài)異常的磁盤。
3、 存儲系統(tǒng)狀態(tài)是impending failure的盤如何處理?
針對這個(gè)問題分三步操作:
1) 手工Fail Drive
2) 拔下硬盤
3) 等待30秒以上,插入新的硬盤,查看狀態(tài),應(yīng)該正在同步,等待陣列同步完成,時(shí)間視數(shù)據(jù)量大小而定。
4、 異構(gòu)平臺的存儲監(jiān)控
1) 通過SNMP trap或者syslog將錯(cuò)誤信息自動(dòng)發(fā)出去,如果有短信平臺,可以直接發(fā)到短信平臺;
2) 買一套可以支持異構(gòu)存儲的管理軟件,比如IBM TPC ,HP SE,EMC ECC等等,不過管理軟件還是對自家存儲支持好,第三方的支持一定要仔細(xì)確認(rèn)一下。
5、 VNX陣列劃分一個(gè)LUN,推薦優(yōu)化配置是多大?
1) 通常LUN劃分多少大主要是看前端應(yīng)用的需求。比如你要?jiǎng)?chuàng)建一個(gè)2TB的LUN給一臺Windows主機(jī)做共享目錄,那你可以選擇創(chuàng)建一個(gè)2TB的Pool LUN(可以是Thin LUN,這樣前端用多少空間就占用存儲端多少空間;如果是Thick LUN,那一開始就會(huì)占用存儲端2TB的空間)。除了虛擬資源分配,Pool LUN還支持全自動(dòng)存儲分層(FAST),如果你陣列中有SSD閃存盤,性能可以上一個(gè)臺階。
2) 如果是給oracle用的話,一塊盤大小在66G到133G左右性能較好,一般推薦100G一塊盤,給文件系統(tǒng)使用的話當(dāng)然一塊大盤就可以了,至于存儲端劃盤受限,中端存儲一個(gè)pool Lun可以到幾十TB,系統(tǒng)端的受限來自磁盤數(shù)量和大小的限制都有,我記得Linux默認(rèn)可以支持256個(gè)Lun,當(dāng)然改設(shè)置的話支持到4096個(gè),而大小的限制主要是fdisk分區(qū)的話支持2TB。
3) lun的大小要以業(yè)務(wù)應(yīng)用的要求為準(zhǔn)。lun的大小不易包含過多的硬盤,包含的硬盤數(shù)量越多,故障點(diǎn)也就越多,需要在性能與故障之間平衡硬盤的數(shù)量。
6、 V5000和V7000換電池控制器等操作真的是個(gè)雷區(qū)嗎?
V7000每控制器會(huì)固定帶有一塊電池,V7000中的兩塊電池在兩個(gè)控制器之間,是共享的,如果有一塊電池?fù)p壞,當(dāng)V7000意外斷電的時(shí)候,狀態(tài)正常的一塊電池可以擁有足夠的電量把V7000配置信息以及寫緩存中的數(shù)據(jù)安全的寫入到 V7000的內(nèi)部磁盤中。當(dāng)V7000中電池充電不足或者兩塊電池均損壞的情況下,V7000無法啟動(dòng)系統(tǒng),必須等待充電完成或修復(fù)電池才可正常啟動(dòng)。
7、 DS8700怎么在線更換控制器風(fēng)扇?
1) 通過SMC(Storage Management Console)走Repair流程。跟HMC界面差不多。Repair過程會(huì)在后臺切換控制器,將風(fēng)扇故障控制器poweroff,接下來的事兒就是給P6 570更換風(fēng)扇了。繼續(xù)Repair流程,SD8700會(huì)啟動(dòng)控制器,并自動(dòng)切換負(fù)載。要一步一步仔細(xì)看Repair流程的說明。
2) 普通中低存儲一盤來說都是熱插拔的。但是高端存儲沒有聽說可以直接拔插的,IBM DS8000、EMC DMX、HP XP這些都是要從管理控制臺走相應(yīng)的修復(fù)流程的!IBM DS8000系列存儲都要通過HMC的Repair流程修復(fù),不能直接更換!HMC流程有提示你更換步驟和方法的!
8、 虛擬化方案如何規(guī)劃存儲?
在進(jìn)行存儲I/O設(shè)計(jì)時(shí),我們可以參考以下設(shè)計(jì)原則:
1) 請確保您的數(shù)據(jù)均勻地分布在所有的物理磁盤中。如果您的數(shù)據(jù)僅位于幾個(gè)盤中,那么使用多個(gè)邏輯單元號(LUN)或物理磁盤又有什么實(shí)際意義呢?
2) 如果您使用了SAN或其他類型的存儲陣列,那么您應(yīng)該嘗試在創(chuàng)建陣列時(shí)使它們具有相同的大小和類型。您還應(yīng)該在創(chuàng)建它們時(shí),為每個(gè)陣列使用LUN,然后將所有的邏輯卷分散到卷組中的所有物理卷。
3) 您還應(yīng)該確保鏡像位于不同的磁盤和適配器。
4) 數(shù)據(jù)庫索引表空間容器和數(shù)據(jù)表空間容器也應(yīng)該位于不同的物理磁盤。
5) 對于表空間容器和數(shù)據(jù)庫日志,應(yīng)該存放到不同的RAID GROUP上。
6) 物理設(shè)備方面。使用高速適配器連接磁盤驅(qū)動(dòng)器,具有大的Cache,這一點(diǎn)是非常重要的,但是您必須確??偩€本身不會(huì)成為瓶頸。要防止這種情況發(fā)生,確保將適配器分散到多個(gè)總線。同時(shí),不要將過多的物理磁盤或LUN連接到任何一個(gè)適配器,因?yàn)檫@樣做也會(huì)對性能產(chǎn)生極大的影響。您配置的適配器越多越好,特別是在大量磁盤的利用率都很高的情況下。
7) 您還應(yīng)該確保設(shè)備驅(qū)動(dòng)程序盡可能支持多路徑 I/O (MPIO),MPIO支持 I/O 子系統(tǒng)的負(fù)載平衡和流量控制。
8) 監(jiān)控存儲Cache的命中率,確保Cache的大小設(shè)置應(yīng)該與業(yè)務(wù)特點(diǎn)(是OLTP還是OLAP業(yè)務(wù)類型)和數(shù)據(jù)頁(data page)的大小設(shè)置合理。
9) 選擇合適的RAID級別。根據(jù)自己應(yīng)用系統(tǒng)的業(yè)務(wù)類型來選擇合適的RAID級別。一般來說,有以下兩種典型的業(yè)務(wù)類型:
70/30/50--70%讀,30%寫,Cache命中率50%,這是典型的高并發(fā)OLTP系統(tǒng)。
100/100--100%讀,100%寫,這是典型的OLAP、DSS系統(tǒng)。
對于小I/O的數(shù)據(jù)庫類型操作,如ERP、銀行賬務(wù)系統(tǒng)、移動(dòng)計(jì)費(fèi)系統(tǒng)等應(yīng)用,建議采用RAID 10;而大型文件存儲、數(shù)據(jù)倉庫,如報(bào)表系統(tǒng)、數(shù)據(jù)集市系統(tǒng),從空間利用的角度,建議采用RAID 5。
10) 在存儲上選擇合適的條帶化大小(stripe size),確保條帶化大小要和數(shù)據(jù)庫的I/O特點(diǎn)結(jié)合,因?yàn)閷τ贠LTP應(yīng)用,數(shù)據(jù)庫I/O基本是隨機(jī)小塊讀寫;而對于OLAP應(yīng)用,數(shù)據(jù)庫I/O是連續(xù)大塊讀寫。
11) 確保操作系統(tǒng)層面和存儲層面的條帶化大小設(shè)置一致,操作系統(tǒng)方面的條帶化大小盡量大些。