自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

IT故障排查工作中的六條不變法則

譯文
運維 系統(tǒng)運維
本文提到的技術(shù)知識可能從未出現(xiàn)在課堂之中,但卻足以指導(dǎo)我們在紛繁復(fù)雜的故障排查工作中找到問題突破口。希望能為大家的實際工作帶來助益。

  【51CTO精選譯文】IT運維大師是每個人追尋的夢想,他們那敏銳的嗅覺似乎總能揪出計算系統(tǒng)故障的根本原因。這種快速反應(yīng)、準(zhǔn)確定位的能力源自多年來處理復(fù)雜數(shù)據(jù)中心基礎(chǔ)設(shè)施難題的經(jīng)驗積累與個人知識儲備,而且其成功很難被復(fù)制。顯然還沒有哪家機(jī)構(gòu)愿意為這種近乎“超自然”的神級判斷能力頒發(fā)認(rèn)證資質(zhì)。

  盡管如此,高強(qiáng)度故障排查工作往往會遵循一些通用且不成文的實踐規(guī)則。在本文中,我將結(jié)合自身經(jīng)歷總結(jié)出六條不變法則,希望能為大家的實際工作帶來助益。請注意,這些法則只適用于大多數(shù)--而非全部--情況。

1、永遠(yuǎn)不要對當(dāng)前連接的服務(wù)器或者網(wǎng)絡(luò)設(shè)備接口進(jìn)行修改

  雖然這種做法聽起來非常愚蠢,但某些人確實會頻繁對正在用于設(shè)備通信的網(wǎng)絡(luò)接口進(jìn)行修改,這也是很多故障發(fā)生的根本原因。雖然有時候如此處理也是逼不得已,但我們完全可以利用其它機(jī)制消除這種潛在缺陷。在必要時為接口配置輔助IP,并暫時將其與其它設(shè)備、子網(wǎng)、串行控制臺或者KVM之類相連。對于那些位于遠(yuǎn)程辦公環(huán)境中且周遭沒有IT人員的設(shè)備,這種處理方式就顯得更為必要。

  有時候我會偷個小懶,利用寫好的腳本在Linux設(shè)備中更改IP、進(jìn)行ping測試并在出現(xiàn)錯誤時取消變更。但這其實有點作弊嫌疑。

2、保證所有操作都具備恢復(fù)余地

  只要有可能,請務(wù)必為自己的操作準(zhǔn)備一套恢復(fù)機(jī)制。這可能意味著大家需要在處理故障磁盤之前備份整個目錄結(jié)構(gòu)下的所有文件,雖然看似麻煩,但這能幫助我們保有全部存在潛在價值的數(shù)據(jù)。另外,大家也可以在處理損壞的操作系統(tǒng)前直接從物理服務(wù)器的RAID 1陣列中取出一塊磁盤。當(dāng)然,這一切在虛擬機(jī)環(huán)境下將更加輕松,只需保存一份快照即可搞定。

3、記錄、記錄再記錄

  在今天提到的各項法則中,這一條恐怕是最難遵循的??梢钥隙ǖ氖?,在一片混亂當(dāng)中心平氣和地記錄下問題與判斷確實有點不切實際。但即使如此,我們?nèi)匀恍枰谑虑榻Y(jié)束之后為自己保留一份分析資料,記錄下處理過程中的執(zhí)行步驟以及解決途徑。請記得把記錄保管在安全的地方,***是由企業(yè)內(nèi)網(wǎng)托管的維基條目--并在其它位置多備份幾份。

  4、IT工作不相信魔法,但卻仰仗運氣

  正如托馬斯·杰斐遜所說,"我發(fā)現(xiàn)自己工作得越努力,幸運女神就越是垂青于我。"同樣的道理也適用于IT領(lǐng)域。大家在基礎(chǔ)設(shè)施研究方面投入的時間越多、對路由器、交換機(jī)、服務(wù)器的運作狀況越熟悉,實際管理時也就越輕松。定期做好這項功課能幫助我們培養(yǎng)出敏銳的嗅覺,在問題早期就做出準(zhǔn)確判斷,并在出現(xiàn)問題時更快做出響應(yīng)。培養(yǎng)IT好運的辦法還有很多。舉例來說,利用工具對網(wǎng)絡(luò)設(shè)備配置進(jìn)行自動化備份能在交換機(jī)無法工作時幫助大家在幾分鐘內(nèi)部署好替代方案,而不再需要花費幾個小時。

5、在進(jìn)行修改前對每個配置文件做好備份

  這條規(guī)則一般只適用于Unix服務(wù)器及網(wǎng)絡(luò)設(shè)備,因為其配置文件幾乎存在于設(shè)備配置體系中的各個環(huán)節(jié)。在我們改動敏感配置之前,***先在交換機(jī)閃存或者TFTP主機(jī)中保留一份副本。在Unix系統(tǒng)方面,只需將*.conf以另外保存為*.conf.orig即可。

  如此一來,我們就能在緊要關(guān)頭輕松將服務(wù)恢復(fù)至原先的正常運行狀態(tài)--將文件復(fù)制回去并重新啟動服務(wù),就這么簡單。但這種做法在Windows環(huán)境中就幫不上忙了,注冊表的存在與Windows的系統(tǒng)特性大大增加了簡單概念的實際復(fù)雜程度。即便如此,大家仍然可以在動手修改前導(dǎo)出一份注冊表,這樣麻煩出現(xiàn)時咱們也能做到手中有糧、心里不慌。注意:由于Windows注冊表如此關(guān)鍵,對其做出變更等于是將服務(wù)器的命脈握在手中,千萬馬虎不得。

6、監(jiān)控、監(jiān)控再監(jiān)控

  所謂預(yù)防勝于治療,每月找個周末仔細(xì)檢查一遍業(yè)務(wù)環(huán)境非常必要。大家應(yīng)該認(rèn)真監(jiān)控數(shù)據(jù)中心的每個方面,從室內(nèi)溫度開始、到機(jī)架、再到服務(wù)器--另外,服務(wù)器進(jìn)程檢查、正常運行時間檢查等等,這是一項無窮無盡、略顯枯燥但卻極為關(guān)鍵的工作。我們還需要對所有網(wǎng)絡(luò)設(shè)備進(jìn)行集中式系統(tǒng)日志整理,并通過趨勢及圖形工具監(jiān)控帶寬使用率、溫度、磁盤分區(qū)用量以及其它重要數(shù)據(jù)指標(biāo)。所有這些監(jiān)控機(jī)制都應(yīng)當(dāng)在數(shù)據(jù)超過合理閾值時向我們提出警告。

  當(dāng)某個磁盤分區(qū)空間不足而導(dǎo)致數(shù)據(jù)庫損壞時,提前一小時發(fā)來的電子郵件或短信很可能幫助我們擺脫噩夢般的緊急加班與系統(tǒng)停機(jī)。我們沒有理由不在數(shù)據(jù)中心內(nèi)充分利用監(jiān)控這一利器。

  今天的規(guī)則匯總就說到這里。它們不僅應(yīng)該被嚴(yán)格遵守,更有理由成為IT工作中根深蒂固的指導(dǎo)性原則。對于深刻理解IT工作內(nèi)涵的技術(shù)人員,這六條法則只不過是必須堅守的觀念;但在其他人看來,它們則如同IT大師一般只是個可望而不可即的神話。

  原文鏈接:

  http://www.infoworld.com/t/education-and-skills/the-six-immutable-laws-troubleshooting-it-680

【編輯推薦】

 

  1. Ubuntu性能調(diào)優(yōu):故障排查
  2. Linux服務(wù)器故障排查實用指南
  3. Linux系統(tǒng)故障排查和修復(fù)技巧
  4. 提高系統(tǒng)故障排查效率的五法寶

 

【責(zé)任編輯:黃丹 TEL:(010)68476606】

責(zé)任編輯:黃丹 來源: 51CTO.com
相關(guān)推薦

2010-10-08 15:42:09

2023-10-04 07:52:37

2010-04-02 12:41:16

Oracle六條總結(jié)

2013-09-25 10:54:03

2010-09-26 11:49:47

2009-12-07 14:48:54

谷歌信念

2010-05-05 11:40:30

Oracle數(shù)據(jù)庫

2013-10-22 10:26:14

創(chuàng)業(yè)工作

2017-12-04 10:00:11

2010-10-12 12:02:58

2021-10-16 07:27:19

數(shù)據(jù)中心安全數(shù)據(jù)安全安全威脅

2009-12-22 10:26:25

路由器IP地址原理

2016-09-18 10:43:29

Linux

2011-10-09 16:27:39

移動互聯(lián)網(wǎng)創(chuàng)業(yè)

2011-08-03 18:01:54

MySQL數(shù)據(jù)庫提高查詢速度

2010-01-15 17:52:21

識別交換機(jī)優(yōu)劣

2019-04-11 17:24:48

數(shù)據(jù)科學(xué)可視化白皮書

2023-10-07 10:27:29

2021-07-15 08:12:31

體系感面試邏輯思維

2010-01-18 13:08:12

點贊
收藏

51CTO技術(shù)棧公眾號