自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

系統(tǒng)管理員與救火隊(duì)員

原創(chuàng)
運(yùn)維 系統(tǒng)運(yùn)維
在大多數(shù)非IT人員的想象中,系統(tǒng)管理員是一個(gè)類似于勤雜工和服務(wù)員的角色;對(duì)很多企業(yè)老板而言,只有在服務(wù)器出問題的時(shí)候才會(huì)想起公司里還有這些系統(tǒng)管理員。但是,系統(tǒng)管理員真的只是救火隊(duì)員么?

【51CTO獨(dú)家特稿】上個(gè)月的最后一個(gè)星期五是全世界的第十一個(gè)“系統(tǒng)管理員日”。在有關(guān)系統(tǒng)管理員日的介紹中,我們可以看到這樣一句話:

系統(tǒng)管理者有許多綽號(hào):技客(Geek)、大大、無名英雄、黑客斗士、第一線救火員、企業(yè)的生命線。

在大多數(shù)非IT人員的想象中,系統(tǒng)管理員是一個(gè)類似于勤雜工和服務(wù)員的角色,是在自己和同事的電腦死機(jī)、藍(lán)屏或上不了網(wǎng)的時(shí)候求助的對(duì)象。

對(duì)很多企業(yè)老板而言,只有在服務(wù)器出問題的時(shí)候才會(huì)想起公司里還有這些系統(tǒng)管理員,而在業(yè)務(wù)運(yùn)行正常的時(shí)候,往往會(huì)將他們遺忘。

這是很多系統(tǒng)管理員的工作現(xiàn)狀——救火隊(duì)員。而很多非IT人士和業(yè)內(nèi)新人也誤以為救火就是系統(tǒng)管理員主要的工作。但是事實(shí)上,一個(gè)企業(yè)如果僅僅把系統(tǒng)管理員當(dāng)做救火員來使用,那么只有兩種可能:

1、他們把IT技術(shù)支持人員(最終用戶支持)和系統(tǒng)管理員的工作職能搞混了

2、他們的服務(wù)器們正處于岌岌可危的狀態(tài)下

保證系統(tǒng)和服務(wù)盡可能長時(shí)間不間斷的正常運(yùn)行,是系統(tǒng)管理員的主要工作。簡單的說,系統(tǒng)管理員的職責(zé)主要是防火,而非救火。一般規(guī)模不大、業(yè)務(wù)重要性不強(qiáng)的企業(yè)可能容易對(duì)平時(shí)的防護(hù)有所忽略,然而對(duì)于電子商務(wù)、網(wǎng)上銀行、乃至于規(guī)模大一些的門戶網(wǎng)站而言,哪怕是一秒鐘的服務(wù)中斷都會(huì)造成極大的經(jīng)濟(jì)損失,所以除非是遇到地震或是大規(guī)模斷電斷網(wǎng)這種情況,原則上是不允許業(yè)務(wù)出現(xiàn)中斷的。

雖然防護(hù)的等級(jí)不同,但是無論對(duì)于哪個(gè)企業(yè)的系統(tǒng)管理員而言,針對(duì)自己企業(yè)的業(yè)務(wù)對(duì)穩(wěn)定性和連續(xù)性的需求,配合手上可以調(diào)配的資源,盡可能的保持服務(wù)正常運(yùn)行,都是他的本職工作。

下面讓我們來看看系統(tǒng)管理員們平時(shí)可能會(huì)遇到哪些故障,以及如何進(jìn)行基本的防護(hù)。

服務(wù)器可能遇到的故障多種多樣,比較常見的有:

◆硬件壞了

◆一臺(tái)服務(wù)器跑多個(gè)服務(wù)造成服務(wù)紊亂

◆服務(wù)器流量忽然大幅上漲(如Slashdot Effect就屬于這種),服務(wù)器由于短時(shí)間內(nèi)過于繁忙而宕機(jī)

◆安全攻擊

還有其他一些不算是故障,但是屬于隱患的問題,比如Apache或Nginx的漏洞,遠(yuǎn)程用戶的權(quán)限,可能被當(dāng)做攻擊目標(biāo)的端口等等,也需要運(yùn)維人員及時(shí)處理。

以下內(nèi)容根據(jù)與做運(yùn)維的幾個(gè)朋友的聊天整理而來,描述了眾多管理員平時(shí)遇到的問題中的很小的一部分,算是管理員防火救火工作的一個(gè)縮影吧:

◆我們公司硬件少,一臺(tái)服務(wù)器上要跑很多程序,動(dòng)不動(dòng)就紊亂了!

◆硬件問題軟件問題,多多少少都遇到過啊,無非就是換設(shè)備或者重啟。

◆我們公司那個(gè)JBOSS端口總是被Java占用,導(dǎo)致公司主頁無法打開,每次我都要去kill。

◆被黑過。不過一般黑客還是比較客氣的。

◆曾經(jīng)發(fā)現(xiàn)過被放了一個(gè)木馬在目錄下,后來發(fā)現(xiàn)是php的漏洞搞的!

◆硬盤啊,內(nèi)存啊,主板啊……都?jí)倪^。

◆服務(wù)器這兩天總是莫名其妙自動(dòng)重啟……

根據(jù)51CTO編輯的了解,在很多中小規(guī)模的網(wǎng)站中,大多數(shù)服務(wù)器故障都是由于服務(wù)紊亂所引起,服務(wù)器被黑也比較常見;而由于中小網(wǎng)站的服務(wù)器數(shù)量比較少,對(duì)于單獨(dú)服務(wù)器宕機(jī)的預(yù)備處理做的往往并不到位,因此一臺(tái)服務(wù)器的癱瘓很容易就造成整個(gè)服務(wù)的訪問速度變慢甚至中斷。這種問題隨著硬件的添加和相應(yīng)容錯(cuò)策略的完善,往往會(huì)有所好轉(zhuǎn)。

在規(guī)模較大的企業(yè)中,由于硬件充足,服務(wù)紊亂的狀況基本沒有,主要面臨的問題在于流量過大與黑客的攻擊,而且由于硬件多,硬件仿佛也更加容易壞掉了(有一句話是這樣說的:如果你有一千臺(tái)服務(wù)器,那你平均每天都會(huì)遇到一臺(tái)掛掉的服務(wù)器;如果你有很多萬臺(tái)服務(wù)器,那么每時(shí)每刻都會(huì)有某些服務(wù)器是掛掉的)。由于大型網(wǎng)站的高可用性方面都做的比較充分,即使一兩臺(tái)服務(wù)器停止運(yùn)行,它們上面的服務(wù)自動(dòng)就被轉(zhuǎn)移到其他服務(wù)器上處理了,只要及時(shí)恢復(fù)這些節(jié)點(diǎn),完全不會(huì)影響到整個(gè)服務(wù)的運(yùn)轉(zhuǎn)。

而像是Google這樣規(guī)模的企業(yè),它在購買服務(wù)器的時(shí)候都是撿便宜的買,大量的購買(Google現(xiàn)在總共大約有100萬臺(tái)服務(wù)器),同時(shí)Google的服務(wù)從架構(gòu)設(shè)計(jì)層面就包含考慮了服務(wù)器壞掉的因素,可以說是把服務(wù)器當(dāng)做消耗品來使用。這樣即使每天都有很多服務(wù)器掛掉,也是在預(yù)期范圍內(nèi)(所謂的高容錯(cuò))。說起來在運(yùn)行大規(guī)模服務(wù)(云計(jì)算)這個(gè)領(lǐng)域,Google也算是數(shù)一數(shù)二了,如果你對(duì)Google的數(shù)據(jù)中心架構(gòu)感興趣,可以閱讀一下《Google的整體架構(gòu)猜想》以及《探索Google App Engine背后的奧秘》這整個(gè)系列,其中敘述的十分深入;同時(shí)Google自己開發(fā)的GFS文件系統(tǒng),也處處體現(xiàn)了這方面的考慮。

當(dāng)然,無論是在中小網(wǎng)站還是在大企業(yè),預(yù)防服務(wù)中斷的首位指導(dǎo)原則都是一樣的:監(jiān)控系統(tǒng),分析系統(tǒng)日志。

  1. 你怎樣才能知道你有哪些程序占用了多少硬件和網(wǎng)絡(luò)資源?
  2. 你怎樣才能知道你的硬件是不是總是很繁忙?
  3. 你怎樣才能知道你的服務(wù)器受到了攻擊?
  4. 你怎樣才能知道某個(gè)進(jìn)入了服務(wù)器的木馬是從哪里來的?

所有這些有關(guān)你服務(wù)器的情況,服務(wù)器的管理員必須要時(shí)刻掌握。想要時(shí)刻明明白白你的服務(wù)器?51CTO編輯為大家提供了一系列小技巧進(jìn)行分享。

Linux/Unix下的監(jiān)控工具很多,有命令行的和GUI的,51CTO將其整理成為一個(gè)Linux監(jiān)控工具的展覽館,以供參考。另外還有撫琴煮酒的一個(gè)系列:

明明白白你的Linux/Unix服務(wù)器硬件篇 網(wǎng)絡(luò)篇 日志篇 安全篇

里面的很多技巧都可以省系統(tǒng)管理員不少心力。

對(duì)于Windows系統(tǒng)而言,微軟推薦使用SCOM這款專門的監(jiān)控和運(yùn)維軟件,不過這款軟件需要另外購買,配置起來比較麻煩,而一般規(guī)模的業(yè)務(wù)也用不到,所以主要使用的是Windows Server自帶的Windows可靠性與性能監(jiān)控器。日志也是,用Windows自帶的日志一般就夠了。

如果你的企業(yè)有足夠多的硬件,那么負(fù)載均衡、高可用這些策略你應(yīng)該也不陌生。這些相關(guān)的文章可以在51CTO組網(wǎng)頻道的負(fù)載均衡欄目下找到很多,比如撫琴煮酒的揭秘企業(yè)級(jí)web負(fù)載均衡完美架構(gòu),19個(gè)心得 明明白白說Linux下的負(fù)載均衡,都是不錯(cuò)的參考文章。Windows環(huán)境下的高可用實(shí)現(xiàn)更加方便,尤其是Windows Server 2008上面的故障轉(zhuǎn)移群集、網(wǎng)絡(luò)負(fù)載平衡等功能,靈活性強(qiáng),操作起來也十分方便。

上面這些都是屬于防火的工作。至于真正遇到故障發(fā)生,需要排障的時(shí)候,則情況比較復(fù)雜了。除了檢查硬件、換硬件、加節(jié)點(diǎn)、檢查病毒和系統(tǒng)補(bǔ)丁、kill進(jìn)程和重啟服務(wù)器之外,一些常見的故障和解決方案可以參考《網(wǎng)管員必讀——故障排除》這本書。但是,真實(shí)環(huán)境下遇到的故障是多種多樣的,需要更為靈活的處理方式和更多的經(jīng)驗(yàn)。51CTO將一直關(guān)注這方面的內(nèi)容與大家分享,您可以長期關(guān)注我們的頻道。

當(dāng)然,除了所有這些防火和救火的策略之外,還有最后一個(gè)終極殺手锏:備份,頻繁備份,并定期確認(rèn)備份是可以恢復(fù)的。系統(tǒng)的備份,數(shù)據(jù)庫的備份,重要服務(wù)的備份,在不同服務(wù)器之間的備份,異地的備份……51CTO系統(tǒng)頻道的專題提供了一些Windows備份Linux備份的基礎(chǔ)策略和工具介紹,而更加深入的備份概念與技術(shù),讀者們可以參考51CTO的子站Watchstor.com

如果您是一位系統(tǒng)管理員,而您整日被救火的工作所困擾,那么您應(yīng)該要好好規(guī)劃一下自己的技術(shù)成長和職業(yè)發(fā)展道路了。

【編輯推薦】

  1. 有關(guān)系統(tǒng)管理員的傳聞大匯總
  2. 系統(tǒng)管理員不可不知的三條黃金法則
  3. 給系統(tǒng)管理員們的節(jié)日禮物
責(zé)任編輯:yangsai 來源: 51CTO.com
相關(guān)推薦

2010-04-12 09:33:58

系統(tǒng)管理員

2012-09-24 10:14:46

Linux系統(tǒng)管理

2011-10-20 10:29:22

VMwareVMworld虛擬化

2013-06-26 09:29:30

系統(tǒng)管理員

2013-09-29 09:50:21

系統(tǒng)管理員Ubuntu JujuJuju

2010-11-10 09:36:38

系統(tǒng)管理員守則

2012-06-06 10:41:37

系統(tǒng)管理員運(yùn)維

2013-08-20 10:11:20

Go系統(tǒng)管理員

2018-08-15 14:00:18

LinuxBash系統(tǒng)管理員

2010-08-10 09:13:52

Unix系統(tǒng)管理員Ubuntu

2010-05-06 18:07:33

Unix命令

2013-03-30 21:59:13

系統(tǒng)管理員必備工具iftop

2019-09-09 14:45:29

系統(tǒng)管理員SRE

2009-10-22 16:53:08

2018-08-01 08:12:34

Linux管理員網(wǎng)絡(luò)管理

2013-04-17 14:37:39

Linux系統(tǒng)管理員susudo

2011-09-29 09:14:25

系統(tǒng)管理員運(yùn)維

2012-11-01 11:33:11

IBMdw

2015-07-13 14:06:00

系統(tǒng)管理容器技術(shù)Docker

2009-03-05 10:04:42

NTFS系統(tǒng)安全權(quán)限
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)