讓Linux系統(tǒng)管理更輕松的技巧
【51CTO新鮮譯文】 “救火隊(duì)員、緊迫感”,絕大多數(shù)系統(tǒng)管理員都這樣形容他們的工作,這絕對是真的,他們大部分時(shí)間都在解決問題,剛教會(huì)一個(gè)MM接收郵件,銷售部的打印機(jī)又被卡住了,不久又發(fā)現(xiàn)服務(wù)器的硬盤出了問題,我們身邊的系統(tǒng)管理員就這樣忙碌地度過他們的每一天。在經(jīng)歷了長期的折磨后,一些系統(tǒng)管理員變聰明了,他們開始利用各種工具和技術(shù)幫助自己完成一些任務(wù),本文就來揭秘一下讓系統(tǒng)管理工作變得更輕松的技巧。
我要介紹的這些技術(shù)都很基礎(chǔ),但不要笑我,作為“救火隊(duì)員”的你應(yīng)該和我一樣認(rèn)真對待這些技術(shù)。
首先,我們來看看消極系統(tǒng)管理員的工作態(tài)度:
● 這工作太煩了。
●只想做自己能做的事情。
那么有什么辦法消除這種痛苦呢?首先,系統(tǒng)管理員應(yīng)擁有一套好的工具箱,好的工具就像金子,不管你是自己編譯,還是下載或購買,必須要有精良的武器裝備。其次,做好一切準(zhǔn)備工作,不要干應(yīng)急的事情,應(yīng)急工作會(huì)讓你的生活充滿驚慌,甚至影響到你的親人,并可能讓你的脾氣暴躁,聽我的,避免臨時(shí)抱佛腳,像童子軍一樣做好準(zhǔn)備吧。第三,善用別人的成果,好好利用在你之前別人做好的成果,如使用其它項(xiàng)目的代碼,不要重新發(fā)明車輪,當(dāng)然,你也應(yīng)該記錄下你的工作點(diǎn)滴,你也會(huì)成為前輩的。第四,思考,思考,再思考,如果你不善于思考,工作就不可能變得更輕松。
◇硬件
硬件是系統(tǒng)管理員做事的基礎(chǔ),因此確保硬件運(yùn)行正常很重要,我們繼承了以往的系統(tǒng),如果不這樣它們就只能慢慢等死,如果你不喜歡某個(gè)系統(tǒng),或它的問題太多,最好借此機(jī)會(huì)關(guān)掉,這樣的系統(tǒng)你扭住不放對你的組織是沒有任何好處的,下面是和硬件相關(guān)的一些其它提示:
●實(shí)施熄燈管理。
●如果你使用惠普服務(wù)器可通過iLO,如果是戴爾服務(wù)器則通過DRAC,如果是Sun服務(wù)器則通過LOM,它們都允許你遠(yuǎn)程連接到服務(wù)器,獲得一個(gè)控制臺(tái)窗口,可遠(yuǎn)程重啟服務(wù)器,或進(jìn)行遠(yuǎn)程診斷,它們的價(jià)值是無法估量的,我知道惠普服務(wù)器默認(rèn)是帶有iLO的,無論如何,遠(yuǎn)程控制功能是購買服務(wù)器時(shí)必須考慮的一個(gè)功能。
●如果你不能遠(yuǎn)程訪問服務(wù)器,你可以使用一臺(tái)舊電腦和一些X10設(shè)備自己DIY一個(gè),但如果你不是極客,顯然這對你來說太難了。
RAID
RAID不是殺蟲劑,而是一種廉價(jià)冗余磁盤陣列,你的服務(wù)器至少會(huì)支持RAID-1(一對磁盤,鏡像),除非你在做Hadoop,RAID對磁盤故障有一定的承受能力,如果某塊磁盤壞掉,不至于要從頭開始搭建系統(tǒng)。
冗余
從冗余電源到冗余網(wǎng)絡(luò)接口卡,從來沒有人因做了一些冗余而被解雇的。
#p#
◇虛擬化和云
不必對虛擬化或云感到害怕,如果你的應(yīng)用程序可以遷移到虛擬機(jī)或云端,應(yīng)該認(rèn)真考慮,你看你因此遠(yuǎn)離曾讓你頭痛的硬件問題。
但虛擬化和云并不是萬能的,將應(yīng)用程序部署到這些平臺(tái)之前,最好仔細(xì)測試一下。
消除硬件方面的問題后,你就可以把精力放在服務(wù)上了,不用在凌晨2點(diǎn)再往數(shù)據(jù)中心趕了。
◇更聰明的軟件
有許多不同的工具可以讓你的工作變得更加簡單,幫助你為你的組織提供更好的服務(wù)質(zhì)量,如果你覺得某些工具不適合你,可以尋找一些替代品。
監(jiān)控
如果你還沒有建立一套監(jiān)控系統(tǒng),應(yīng)立即著手創(chuàng)建,這樣你可以遠(yuǎn)程了解數(shù)據(jù)中心的運(yùn)轉(zhuǎn)情況,這類工具實(shí)在是太多了,如Nagios,Hobbit或Groundwork,一個(gè)個(gè)地嘗試吧,總有一個(gè)適合你,如果你現(xiàn)在的監(jiān)控系統(tǒng)不好用,那用它們來代替吧。
自動(dòng)化安裝
準(zhǔn)備機(jī)器是我們系統(tǒng)管理員的例行工作之一,如果你還在手工處理,那你就Out了,并且也容易引入錯(cuò)誤。
Kickstart
談到自動(dòng)化安裝時(shí),Kickstart可能是Linux世界的事實(shí)標(biāo)準(zhǔn),Red Hat和Ubuntu家族都支持它,它很靈活,可擴(kuò)展性也很好,我自己多年來就一直在使用它。
Preseed
Preseed是Debian以及基于Debian的發(fā)行版使用的,包括Ubuntu,它的功能相當(dāng)強(qiáng)大,但文檔需要加強(qiáng)。
鏡像
通過使用鏡像軟件,如Ghost,G4U或Acronis可以克隆一個(gè)系統(tǒng),我發(fā)現(xiàn),如果你的硬件平臺(tái)多樣化,這個(gè)方法比自動(dòng)化安裝還要快,但管理多平臺(tái)的鏡像將成為管理員頭疼的問題。
不管你使用哪種自動(dòng)化安裝方法,最好花點(diǎn)時(shí)間開啟PXE網(wǎng)絡(luò)啟動(dòng),這樣你就不需要安裝介質(zhì)了。
軟件包
無論何時(shí),下載和使用與平臺(tái)對應(yīng)的軟件包格式,如果沒有現(xiàn)成的,那么你應(yīng)該學(xué)習(xí)如何創(chuàng)建軟件包,那樣可以節(jié)省許多安裝和調(diào)試時(shí)間,然后做一次系統(tǒng)鏡像。
如果你不熟悉軟件包創(chuàng)建技術(shù),你可能需要從CheckInstall開始創(chuàng)建RPM,Debian包或Slackware tar包。
#p#
◇配置管理
版本控制
不管你使用Subversion,Mercurial,CVS還是商業(yè)產(chǎn)品,如Perforce,都應(yīng)該將配置文件放入版本控制系統(tǒng)的倉庫中,實(shí)現(xiàn)版本化控制,花點(diǎn)時(shí)間為每個(gè)主機(jī)建立目錄樹,并將它們的配置文件上傳進(jìn)去,如果你像軟件一樣對待你的配置文件,更新配置后如果出現(xiàn)問題,你還有機(jī)會(huì)進(jìn)行回滾。
為了使管理變得容易,你可以創(chuàng)建一個(gè)元數(shù)據(jù)包,將所有配置都打包進(jìn)去,也實(shí)行版本控制,也許開始實(shí)施時(shí)會(huì)感到很復(fù)雜,但它的確能幫你消除許多可能的操作錯(cuò)誤。
配置自動(dòng)化
前面我們提到創(chuàng)建元數(shù)據(jù)包,如果全部靠手工來處理是不現(xiàn)實(shí)的,其實(shí)有很多工具可以使用,如Puppet,Chef或Cfengine,這些工具將會(huì)真正推送和強(qiáng)制配置你的服務(wù)器,但它們需要一種完全不同的思維和行動(dòng)方式,并且需要花時(shí)間測試。
不管怎樣,你的配置信息都應(yīng)該是可控制的,在故障排除期間將會(huì)感受到它的好處。
備份
備份是你最后一道防線,不管怎樣,你應(yīng)準(zhǔn)備一套良好的備份策略,并確保它得到嚴(yán)格執(zhí)行。有了備份,你可以利用備份資源執(zhí)行恢復(fù)操作。只有一種情況你不需要備份,那就是系統(tǒng)沒有數(shù)據(jù)值得備份,你可以使用kickstart從一個(gè)裸機(jī)安裝一個(gè)新系統(tǒng)。無論如何,數(shù)據(jù)庫服務(wù)器是需要備份的。
可供選擇的備份軟件很多,你可以逐個(gè)嘗試,直到找到你滿意的。
◇小結(jié)
最后我想說的是,提前做好準(zhǔn)備總是有益的,有條件最好實(shí)現(xiàn)彈性或冗余架構(gòu),盡量讓操作自動(dòng)化,將你的時(shí)間放在那些更重大的項(xiàng)目上,你的組織也會(huì)從這些穩(wěn)定的系統(tǒng)獲益,你也不用擔(dān)心會(huì)被解雇。缺少障礙的環(huán)境會(huì)變得敏捷起來,你的日常工作將會(huì)變得井井有條,你的生活也會(huì)因此而充滿陽光。
【本文乃51CTO精選譯文,轉(zhuǎn)載請標(biāo)明出處!】
【編輯推薦】
- 將你Windows上的設(shè)置和數(shù)據(jù)遷移到Linux
- 為什么要在你的Linux系統(tǒng)上啟用barrier?
- CairoPlot讓Linux服務(wù)器的日志文件更直觀