自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

再談大型數據中心的運維工作

網絡
隨著數據中心的建設規(guī)模不斷擴大,新技術層出不窮,數據中心變得越來越復雜。數據中心往往是由很多規(guī)模龐大的集群系統組成的,運維工作需要具備方方面面的知識,包括硬件上,業(yè)務上的東西,需要上下打通地去做運維工作。

隨著數據中心的建設規(guī)模不斷擴大,新技術層出不窮,數據中心變得越來越復雜。數據中心往往是由很多規(guī)模龐大的集群系統組成的,運維工作需要具備方方面面的知識,包括硬件上,業(yè)務上的東西,需要上下打通地去做運維工作。因為很多數據中心的規(guī)模非常大,面臨的挑戰(zhàn)和問題非常超前,很多不是問題的問題在這樣的規(guī)模下也就凸顯出來了,所以要做好大型數據中心的運維工作,對整個數據中心技術的系統的學習就要花費比較長的時間,只有對這個數據中心整體非常了解,才能有針對性地制定一些運維方案,甚至可以二次開發(fā)一些監(jiān)控軟件,對整個數據中心進行管理與監(jiān)控,提升整個數據中心的運行效率,減少故障的發(fā)生,從而將運維工作推向新的高度。一個大型的數據中心內部包含了很多小系統,運維工作都是圍繞著這些具體的應用系統展開的,具體的可以分為五大部分,三十多個小項,覆蓋了數據中心的所有組成部分,本文就來說一說一般大型的數據中心應該具備的哪些運維方法。

 [[139729]]

從數據中心安全方面來考慮,運維工作就是十幾個小項:攻擊保護、固件管理、備份、抓BUG/找BUG、腳本工具、自動化維修、數據安全、性能優(yōu)化、服務巡檢等項目,其中每一項拿出來其實都包含很多的內容。比如說到攻擊與保護,這個主要指的是防止外來的異常入侵者對數據中心發(fā)起的惡意和無意攻擊,惡意攻擊就是有人故意的使用各種攻擊方法,進入到數據中心內部,將重要的數據竊取或者破壞,達到其不可告人的目的。也有的是無意的攻擊,因為整個數據中心是要與外界保持互聯互通的,運行是動態(tài)的,變化的,不可避免會有一些異常流量攻擊數據中心,有時甚至來自于數據中心內部,比如某些服務器中毒,或者硬件故障,構造出了環(huán)路,異常流量等網絡故障,這些都會影響到數據中心的運行,所以如何做好數據中心的攻擊與保護是一個很大的題目,這并不是在數據中心里部署幾臺安全設備就能解決的,需要對整個數據中心進行全面的統一規(guī)劃,并有針對性地部署一些安全防護措施,而且隨著各種黑客技術的提升,安全防護措施也要不斷提升,這是一個不斷學習與完善的過程,只要數據中心還在運行,這個完善就不會停止。為了方便運維,也要做好一些執(zhí)行腳本,以便在出現突發(fā)事件時,能夠快速部署。比如如果一個數據中心的業(yè)務出現異常,為了快速恢復業(yè)務,需要將路由進行調整,將流量全部引到其它的數據中心,這就需要在核心路由器上進行調整,這時有個現成的腳本就可以自動執(zhí)行,達到快速切換的目的。數據中心還應該準備很多其它工作的腳本,以便緊急的時候快速使用。

從數據中心的基礎運維管理方面考慮,則主要有網絡抓包/過濾、可維護性優(yōu)化、配置管理、監(jiān)控、報警處理、自動化運維、斷網,斷電、機房容災等運維工作。其中自動化運維能提升運維的工作效率,盡量減少人為的參與,讓數據中心自己管理自己,釋放人力。同時針對數據中心可能發(fā)生的故障還做好監(jiān)控與報警處理,以便能夠在故障發(fā)生的第一時間知曉問題,往往一次大的故障都是從開始的一點小故障逐漸擴展最終引發(fā)整個大系統的崩潰的,所以在出現一些小的異常時一定要及時消除,而這些異常就要靠完善的監(jiān)控和報警系統來檢測。

從數據中心的日常業(yè)務運維方面考慮,則主要有資源、機器分配、Coredump、服務、內存使用、網絡吞吐、故障恢復、應用,集群搭建、流量,壓力,擴容,升級、上下級業(yè)務關聯情況、資源利用率、異常處理、降級預案等等。這些日常運維工作實際上要花費大量的人力和時間,是運維工作的主體,也最煩瑣,但卻最不能體現業(yè)績的部分。一個數據中心能夠長久安全穩(wěn)定運行,就是靠這些日常的工作積累的,只有平時注意這些細微的變化,才能不斷優(yōu)化。壓力測試、軟件升級、業(yè)務部署、異常處理等幾乎成為了運維工作的日常必修課,只有將這些工作做好,才能避免出現大的故障,并能夠快速部署新的業(yè)務,新的擴容設備。

從數據中心網絡方面考慮,則主要有網絡硬件設備、ACL、VIP、流量、負載均衡、二三四七層情況、網絡監(jiān)控、萬兆板卡、SAS/SATA/SSD等。網絡是數據中心的重要組成部分,是一切工作運行的基本,沒有網絡數據中心就無法運轉起來,所以保證網絡穩(wěn)定是數據中心運維工作中的重中之重。這里主要關注的就是網絡的硬件問題,ACL部署還有流量情況。網絡可以說是包羅萬象,涉及太多的設備和協議技術,所以也需要不斷地學習,加深對網絡技術的理解,這樣才能做好網絡運維工作。

從數據中心服務器方面考慮,則主要有文件系統、內核參數調優(yōu)、各種硬盤驅動、內核版本、Kernel panic等。Linux系統不僅在服務器,在網絡操作系統也占據著主流地位,掌握Linux系統的使用才能更好地處理服務器和網絡設備的運維工作,Linux是運維工作的一項基本技能。除了熟悉Linux系統的操作,還要對服務器的運行狀態(tài)和內核運行狀態(tài)進行監(jiān)控與管理,減少服務器故障的發(fā)生。一般大型的數據中心都包含有成千上萬臺的服務器,幾乎每天都會有服務器出現各種各樣的問題,只有對服務器有深入理解才能很好地消除問題。為了防止服務器故障引發(fā)業(yè)務中斷,所以一般在服務器上都要部署虛擬化技術或者集群技術,當一臺服務器物理硬件故障時,業(yè)務可以平滑切換到其它服務器上,業(yè)務不會受到任何影響。這些虛擬化技術增加了運維的難度,也需要對虛擬化技術進行不斷學習。

通過上面的羅列您一定很驚訝,原來數據中心運維包含這么多內容,大大小小數十項,而且每一項包含的內容說起來都不那么簡單,也涉及很多的技術知識。一個數據中心能否穩(wěn)定運行,能夠高效運行,運維是關鍵。只有將這些運維工作很好地部署和執(zhí)行下去,數據中心才能長期穩(wěn)定。

責任編輯:何妍 來源: 企業(yè)網D1Net
相關推薦

2015-06-10 10:40:11

數據中心運維管理

2015-06-10 17:25:41

數據中心運維工作

2016-01-27 13:31:00

數據中心

2009-12-31 16:20:52

數據中心之變 運維

2016-01-07 15:21:26

2016-12-02 15:47:31

數據中心運維云數據中心

2018-08-22 08:36:19

數據中心運維數據

2009-07-09 14:35:16

數據中心運維管理游龍科技

2023-11-23 15:28:38

2018-03-21 10:24:25

2018-06-01 10:30:24

數據中心運維危機

2017-02-13 15:45:59

戴爾

2012-11-12 14:05:17

數據中心防地震

2017-11-17 11:10:53

數據中心運維路標

2015-12-11 13:18:15

2009-12-27 19:06:18

2018-01-03 11:08:50

數據中心運維網絡

2011-01-05 10:32:58

企業(yè)數據中心運維管理北塔

2015-08-25 09:02:59

2015-11-19 13:55:07

數據中心運維安全
點贊
收藏

51CTO技術棧公眾號