提高Forefront系統(tǒng)容錯(cuò)性能策略
作為企業(yè)級(jí)安全防護(hù)產(chǎn)品,如果部署之后突然出現(xiàn)故障,使得內(nèi)網(wǎng)用戶無(wú)法訪問(wèn)互聯(lián)網(wǎng),使企業(yè)不想看到的。為此如何提高系統(tǒng)在發(fā)生故障時(shí)的繼續(xù)工作的能力,也是衡量Forefront產(chǎn)品可用性的一個(gè)重要方面。實(shí)際上Forefront系統(tǒng)容錯(cuò)性能上提供了許多可圈可點(diǎn)的方法,筆者就借這個(gè)機(jī)會(huì)跟大家分享一下自己在這方面的經(jīng)驗(yàn)。
提高Forefront系統(tǒng)容錯(cuò)性能措施一:?jiǎn)吸c(diǎn)故障最小化
單點(diǎn)故障最小化,簡(jiǎn)單的說(shuō),就是如何有效降低單點(diǎn)故障發(fā)生的機(jī)率。在Forefront產(chǎn)品中,推薦使用都是重復(fù)部署硬件設(shè)置,來(lái)為其提供部分容錯(cuò)能力,從而實(shí)現(xiàn)單點(diǎn)故障最小化的目標(biāo)。采用這種策略的話,能夠應(yīng)對(duì)大部分的單點(diǎn)故障。如假設(shè)現(xiàn)某個(gè)數(shù)據(jù)輸入輸出路徑或者某個(gè)服務(wù)器的物理硬件組件發(fā)生故障,則重復(fù)部署的硬件配置能夠讓硬件繼續(xù)進(jìn)行工作。這個(gè)原理跟服務(wù)器冗余類似。這里只是采用了硬件的冗余策略。
一般來(lái)說(shuō),用來(lái)減少單點(diǎn)故障的硬件根據(jù)創(chuàng)建冗余的所使用的組件不同而有所不同。特別是有些比較重視容錯(cuò)性的廠商,會(huì)將重復(fù)的硬件部署(硬件冗余方案)作為其可用性的一個(gè)重要組成部分。
對(duì)于Forefront安全系統(tǒng)(包括安全網(wǎng)關(guān)與服務(wù)器),筆者建議對(duì)于一些比較關(guān)鍵的設(shè)備盡量采取冗余的策略。特別是對(duì)于網(wǎng)卡來(lái)說(shuō),要使用雙網(wǎng)絡(luò)適配器。因?yàn)楦鶕?jù)筆者的經(jīng)驗(yàn),由于Forefront服務(wù)器往往是24小時(shí)不間斷的工作,網(wǎng)絡(luò)適配器的工作負(fù)荷比較大。而且這個(gè)設(shè)備也比較脆弱,容易受到電壓、雷電等外界因素的影響。平時(shí)出現(xiàn)故障的幾率比較高。為此***給Forefront服務(wù)器配置穩(wěn)定性比較高的網(wǎng)絡(luò)適配器,并在可能的情況下對(duì)其實(shí)現(xiàn)冗余,即實(shí)現(xiàn)雙網(wǎng)絡(luò)適配器配置。
提高Forefront系統(tǒng)容錯(cuò)性能措施二:有條件的需要電源備份
要讓Forefront長(zhǎng)時(shí)間的不間斷的提供保護(hù)服務(wù),不僅僅軟件自身需要有比較高的穩(wěn)定性,對(duì)于服務(wù)器也有這方面的要求。其實(shí)大部分管理員都會(huì)有這方面的認(rèn)識(shí)。長(zhǎng)期運(yùn)作的穩(wěn)定性大部分時(shí)候關(guān)口都在于硬件。也就是說(shuō),硬件能否365*24小時(shí)不間斷的工作。這對(duì)于服務(wù)器來(lái)說(shuō),壓力特別的大。
根據(jù)筆者的經(jīng)驗(yàn),在這種長(zhǎng)時(shí)間運(yùn)作的情況下,往往電源是***受不了的。這主要是多方面的原因造成的。一方面現(xiàn)在國(guó)內(nèi)的電壓穩(wěn)定性并不是很高。當(dāng)電壓上下浮動(dòng)的頻率過(guò)高的話,會(huì)對(duì)電源產(chǎn)生致命的打擊。如由于用電的關(guān)系,大部分企業(yè)白天的電壓會(huì)比較低,而且隨著大型機(jī)械的啟動(dòng),上下波動(dòng)幅度很大。而到了晚上,電壓又會(huì)比較高。同時(shí),一年四個(gè)季度,也有所差別。如夏天用電負(fù)荷大,電壓比較低。同時(shí)電壓的變化也比較大。這些因素對(duì)于電源會(huì)造成比較大的負(fù)面影響,大大降低電源的壽命。
為了保護(hù)電源,讓其能夠?yàn)镕orefront服務(wù)器不間斷的提供供電,筆者有兩個(gè)建議。
一是在服務(wù)器層面使用雙電源供電。現(xiàn)在很多品牌的服務(wù)器,如IBM服務(wù)器,都提供雙電源系統(tǒng)。其實(shí)這也是一個(gè)硬件的冗余操作。在服務(wù)器中部署兩個(gè)電源。當(dāng)其中一個(gè)電源出現(xiàn)問(wèn)題的時(shí)候,另外一個(gè)電源能夠馬上啟用,向服務(wù)器供電。如此的話,就可以避免因?yàn)殡娫闯霈F(xiàn)問(wèn)題而導(dǎo)致服務(wù)器斷電,F(xiàn)orefront系統(tǒng)無(wú)法正常工作。同時(shí)在必要的情況下,要讓服務(wù)器能夠自動(dòng)報(bào)警。即當(dāng)某個(gè)電源不能夠供電的時(shí)候,即使告知管理員采取必要的措施,如更換電源。特別是需要查清楚電源損壞的原因。如是電源正常的老化,還是電壓不穩(wěn)所造成的。如果電壓不穩(wěn)的話,要及時(shí)采取必要的措施,以免下次再次發(fā)生這種情況。
二是有條件的企業(yè),要采用UPS不間斷電源。UPS不簡(jiǎn)單電源在這里有兩方面的作用,一是UPS電源往往有穩(wěn)壓的作用。也就是說(shuō),通過(guò)一定的機(jī)制,可以為服務(wù)器電源提供比較穩(wěn)定的電壓。避免外界電壓不穩(wěn)給電源造成的負(fù)面影響。另外一個(gè)作用就是可以防止斷電,讓服務(wù)器突然當(dāng)機(jī)。由于種種原因,突然斷電的情況在企業(yè)中比較常見(jiàn)。如企業(yè)可能部署了空氣開(kāi)關(guān),當(dāng)某個(gè)線路的電荷超過(guò)規(guī)定負(fù)荷的時(shí)候,就會(huì)自動(dòng)跳閘,此時(shí)就會(huì)發(fā)生斷電的情況。這不僅會(huì)給服務(wù)器帶來(lái)比較大的負(fù)面影響,而且也會(huì)導(dǎo)致服務(wù)器當(dāng)機(jī)。而UPS通過(guò)蓄電池在外界斷電的情況下,仍然可以在一定時(shí)間內(nèi)為服務(wù)器持續(xù)供電。這可以給管理員留足比較充裕的時(shí)間,來(lái)進(jìn)行相關(guān)的應(yīng)急處理。如手工關(guān)閉服務(wù)器,或者采用后備電源等等。
提高Forefront系統(tǒng)容錯(cuò)性能措施三:推薦使用RAID磁盤陣列配置
眾所周知,對(duì)于服務(wù)器的硬盤實(shí)現(xiàn)RAID配置的話,能夠帶來(lái)很多方面的好處。如可以提升數(shù)據(jù)的讀取效率,降低磁盤的I/O沖突。在數(shù)據(jù)庫(kù)服務(wù)器或者文件服務(wù)器中,這已經(jīng)是推薦的配置。其實(shí)RAID磁盤陣列的作用不僅僅表現(xiàn)在這些方面。在容錯(cuò)能力上也有非常不錯(cuò)的表現(xiàn)。
對(duì)于Forefront服務(wù)器來(lái)說(shuō),筆者就建議采用RAID配置。因?yàn)橥ㄟ^(guò)使用RAID,可以提高Forefront部署的容錯(cuò)能力。這主要是因?yàn)镽AID在多個(gè)磁盤上保存相同的數(shù)據(jù)用于冗余、提高性能并延長(zhǎng)平均故障時(shí)間。這主要是RAID的特性決定的。因?yàn)樵赗AID配置中,部分物理存儲(chǔ)空間包含硬盤中保存數(shù)據(jù)的冗余信息。如對(duì)于RAID5來(lái)說(shuō),即使由于某種原因,一塊硬盤出現(xiàn)了物理故障,服務(wù)器仍然可以正常使用。因?yàn)榇疟P陣列系統(tǒng)會(huì)根據(jù)其他硬盤上的冗余信息來(lái)恢復(fù)故障硬盤中的數(shù)據(jù),從而提高服務(wù)器的容錯(cuò)能力。
為此筆者建議,為了確保Forefront服務(wù)器在單個(gè)磁盤出現(xiàn)故障的使用仍然能夠正常為企業(yè)提供服務(wù),***能夠利用RAID磁盤鏡像或者帶奇偶校驗(yàn)的磁盤分段來(lái)防止單個(gè)物理硬盤故障而導(dǎo)致數(shù)據(jù)丟失。
不過(guò)筆者需要提醒的是,RAID配置并不能夠防止文件損壞或者其他文件錯(cuò)誤。如某個(gè)配置文件被意外刪除或者更改,此時(shí)RAID不能夠恢復(fù)。因?yàn)橹灰浔桓幕蛘邉h除之后,相應(yīng)的信息會(huì)寫入到各塊磁盤中。另外,采用RAID只能夠避免單塊硬盤的故障。如服務(wù)器中如果同時(shí)有兩塊硬盤出現(xiàn)故障(雖然這個(gè)幾率并不是很高),此時(shí)數(shù)據(jù)仍然會(huì)丟失。因?yàn)橥瑫r(shí)兩塊硬盤出現(xiàn)故障的話,RAID就無(wú)法修復(fù)故障硬盤上的數(shù)據(jù)。出于這些方面的考慮,筆者建議在使用RAID的同時(shí),還有必要做好服務(wù)器上數(shù)據(jù)的備份工作?;蛘哒f(shuō)讓RAID與數(shù)據(jù)備份相輔相成,共同提高Forefront服務(wù)器的可用性。
提高Forefront系統(tǒng)容錯(cuò)性能措施四:學(xué)會(huì)使用SQLServer日志傳送
數(shù)據(jù)庫(kù)日志傳送則主要從保護(hù)數(shù)據(jù)的層面來(lái)提高Forefront的容錯(cuò)能力。簡(jiǎn)單的說(shuō),SQLServer日志傳送可以將事務(wù)日志從一個(gè)數(shù)據(jù)庫(kù)傳送到另外一個(gè)數(shù)據(jù)庫(kù)(這個(gè)傳送是實(shí)時(shí)的)。從而當(dāng)某個(gè)數(shù)據(jù)庫(kù)出現(xiàn)故障無(wú)法正常使用的時(shí)候,另外一個(gè)數(shù)據(jù)庫(kù)可以馬上啟用。因?yàn)檫@個(gè)數(shù)據(jù)庫(kù)通過(guò)日志傳送功能,其內(nèi)容跟故障的數(shù)據(jù)庫(kù)一模一樣。如此的話,就可以在另一數(shù)據(jù)庫(kù)出現(xiàn)故障時(shí),仍然可以持續(xù)的為企業(yè)用戶服務(wù)。
【編輯推薦】
- Forefront性能優(yōu)化四步走
- 讓ForeFront TMG來(lái)做企業(yè)網(wǎng)絡(luò)的守門人
- Forefront Security應(yīng)用程序使用技巧
- 淺談Forefront Security的管理策略和事件
- ForeFront讓郵箱服務(wù)器遠(yuǎn)離侵襲三建議