無需深厚技術(shù)背景 也可做好系統(tǒng)和應用維護管理
【51CTO.com 綜合報道】做好系統(tǒng)和應用維護勢在必行
如何做好IT系統(tǒng)的運行維護是IT領(lǐng)域的熱點問題. 隨著信息化技術(shù)的蓬勃發(fā)展,信息化建設(shè)的深入,運維管理的難度也越來越大。 如何管理好IT系統(tǒng),保證其可用、安全、可靠、高效地運行,提高用戶滿意度、降低運維服務成本、保證系統(tǒng)能夠在遇到突發(fā)事件時快速地解決。是當下嚴峻而又現(xiàn)實的問題。
作為運維服務提供者,無論是管理人員還是運維人員,經(jīng)常會遇到這樣的情景:
夢深時分,急促的鈴聲響起,電話接通,在電話的另一頭,有人急切地說道:“一位公司領(lǐng)導反映,公司的網(wǎng)站登錄不了,郵件無法正常發(fā)送,首頁顯示空白”,一般這種情況下,你會要求現(xiàn)場人員嘗試恢復服務,但現(xiàn)場人員往往不能獨立解決,此時你需要協(xié)調(diào)技術(shù)專家去出面搞定這個問題,但如果問題棘手呢,那此時就需要綜合各方高人進行會診。通過逐一詢問運維組的檢查情況,細致了解了包括防火墻、入侵監(jiān)測、操作系統(tǒng)、數(shù)據(jù)庫的設(shè)置、Web服務器以及自身的運行情況后,系統(tǒng)問題仍然無法定位。
就在你準備放棄的時候,打算采取應急方案的時候,正常的界面又忽然顯示了,只是很快,但刷新后又重復出現(xiàn)非正常。他們的聯(lián)系在哪里,問題在哪里,你得找出根本原因。
經(jīng)過多番種種努力,你忽然想到一點,昨天客戶好像提過要對硬件做升級,如果所料不錯的話,應該是昨天晚上就進行了,但因為某種原因,升級并沒有成功,客戶的操作步驟也沒提前通知,具體操作如何誰也不清楚。這時候你會給客戶打電話匯報情況,并要求客戶方安排人員來解決,
終于在多方人員的努力下,系統(tǒng)恢復正常運行,大家一起舒了一口長氣,同時開始抱怨“怎么能這樣?他們也太過分了,居然進行升級都不跟我們打個招呼,明天一定得好好的跟他們領(lǐng)導反映”。
以上的情景我相信絕大多數(shù)運維服務提供者都能遇到,并且不止一次兩次。為什么會產(chǎn)生這些問題呢?如果在此次事件中,整個系統(tǒng)有了變更管理環(huán)節(jié),當客戶進行升級,就必須通過變更管理的審核和批準,否則是無法進行相應操作的,也自然不會出現(xiàn)應用無法訪問的問題,這對運營維護好IT系統(tǒng)以及提供完善的IT服務有著重要的意義。
系統(tǒng)與應用維護都有哪些困難
◆服務器操作系統(tǒng)
操作系統(tǒng)是服務器運行的軟件基礎(chǔ),其重要性不用說大家都明白。如果使用Windows xp或Windows 2000 Server作為操作系統(tǒng),維護起來還是比較容易的,只要按時打好補丁,定時查看日志就可以。但如果是LINUX和UNIX操作系統(tǒng)的話,需要對運維人員的技術(shù)有相當高的要求,需要具備一定的專業(yè)知識。
◆服務器上的應用維護
服務器上的應用軟件是企業(yè)的核心數(shù)據(jù),是企業(yè)最重要的數(shù)據(jù)之一,如果數(shù)據(jù)丟失或者服務異常終止對于企業(yè)來說所造成的損失是不可估量的,企業(yè)的應用已經(jīng)成了企業(yè)生存和發(fā)展的重要組成部分。當企業(yè)應用的規(guī)模越來越大時,應用也隨之越來越多,如何快速有效的對這些關(guān)鍵應用進行監(jiān)控就成為了迫切的問題。
◆7*24小時服務周期
除了上述二點列出的技術(shù)上的困難之外,還有一個重要的問題就是企業(yè)的服務器以及上面所運行的應用都是實時性很高的業(yè)務,必須得保證7*24小時不間斷提供服務,單純的靠人工維護的話實時性太差,管理員不可能一天二十四小時盯著服務器,所以在現(xiàn)實情況中,經(jīng)常出現(xiàn)服務器宕機或者服務器上的應用不能訪問,運維人員往往無法第一時間知曉,而是由實際使用服務器或使用應用的人去通知,此時業(yè)務可能已經(jīng)停止了很長時間,這對于企業(yè)來說無疑是很大的損失,從而造成對IT運維人員的滿意度下降。#p#
系統(tǒng)和應用誰來維護,誰來管理
所謂系統(tǒng)和應用維護就是指能夠面對并處理IT系統(tǒng)涉及到計算機所出現(xiàn)的各種故障,說白了就是軟硬兼施。故障從系統(tǒng)級到應用級,從網(wǎng)絡(luò)到硬件設(shè)備。
在系統(tǒng)和應用維護中,人的因素至關(guān)重要。因為我們都知道人可以解決問題,但人又同樣會帶來問題,比如一個資深的運維人員離崗后,問題再次發(fā)生時就很難快速響應,即使交接人技術(shù)很強卻也無法獲取到前人的運維經(jīng)驗。這使得系統(tǒng)和應用維護管理的不穩(wěn)定因素日益增多,如何減少由人員變更導致得系統(tǒng)和應用維護管理的難度加大,是擺在我們眼前而必須解決的問題。
維護管理軟件的產(chǎn)生,使得人在運維管理中所起到的作用被量化和標準化。通過運維管理軟件,所有IT設(shè)備都可以被監(jiān)控管理。設(shè)備遇到問題,會自動分類報警,無論是系統(tǒng)自動報警還是使用人工故障上報,工程師只要按照系統(tǒng)相關(guān)知識庫的知識,一步一步操作下去就可以,因此,對于工程師來說,不需要很高的技術(shù)水平,就可以進行維護支持。
為了發(fā)揮IT系統(tǒng)的最大作用,系統(tǒng)和應用不僅僅需要人的運維,更需要有合適的維護管理軟件來支撐,幫助企業(yè)實現(xiàn)IT運維自動化,標準化。
通常情況下,維護管理軟件應主動告訴我們應該關(guān)注什么內(nèi)容,指導我們?nèi)绾稳ミM行管理,問題出在哪里,該從什么角度入手分析,主動定位問題的位置等等。它至少應具備以下幾個方面的特點:
a)提供綜合的一體化管理平臺:整合網(wǎng)絡(luò)、主機、應用、服務等各層面 IT 資源的、統(tǒng)一的IT 服務管理信息視圖。
b)提供直觀的管理呈現(xiàn)方式:統(tǒng)一的監(jiān)控資源視圖。
c)提供多種發(fā)現(xiàn)問題和準確定位的管理機制:能夠準確、快速地定位故障產(chǎn)生的根本原因。
d)提供統(tǒng)計報告和分析圖表,方便公司領(lǐng)導層做出決策。
e)保障業(yè)務系統(tǒng)的穩(wěn)定運行:從業(yè)務角度切入,以業(yè)務為導向,通過對整個業(yè)務系統(tǒng)的關(guān)注,從而達到保障業(yè)務系統(tǒng)穩(wěn)定運行和透明化管理的目的。#p#
簡單易用的維護管理軟件的優(yōu)勢
簡單易用最主要的標準,就是無需深厚技術(shù)背景,也可以輕松做好系統(tǒng)和應用維護管理。
“哪怕是一個只有基礎(chǔ)技術(shù)能力的人,也能做專業(yè)IT維護”,這是我們維護管理軟件應該幫助用戶達到的運維水平。
◆監(jiān)控信息統(tǒng)一展現(xiàn)
面向業(yè)務監(jiān)控和統(tǒng)一portal展現(xiàn),整合第三方監(jiān)控系統(tǒng),提供覆蓋網(wǎng)絡(luò)、系統(tǒng)及應用服務等全方位監(jiān)控的統(tǒng)一頁面展現(xiàn)。統(tǒng)一告警平臺匯總、壓縮和關(guān)聯(lián)各種設(shè)備或服務的告警信息,實現(xiàn)統(tǒng)一監(jiān)控和展現(xiàn)。
![]() |
圖1 |
可針對不同角色的管理人員,提供各取所需的不同內(nèi)容。比如為部門經(jīng)理提供實時的服務儀表盤Dashboard,輔助IT決策,為運維人員提供資源可用性與性能指標,確定資源狀態(tài)。
◆網(wǎng)絡(luò)拓撲圖
日常的運維工作中,系統(tǒng)維護管理人員對網(wǎng)絡(luò)的監(jiān)控只是單點地針對設(shè)備,無法對整體進行有效的監(jiān)控。網(wǎng)絡(luò)拓撲圖應提供網(wǎng)絡(luò)資源實時監(jiān)控功能,能夠?qū)崟r展現(xiàn)網(wǎng)絡(luò)所有設(shè)備各個部分工作狀態(tài)變化,能真實地體現(xiàn)網(wǎng)絡(luò)中的物理運行狀態(tài)。能夠支持自動發(fā)現(xiàn)網(wǎng)絡(luò)拓撲,也支持手工繪制各種網(wǎng)絡(luò)拓撲,使網(wǎng)絡(luò)管理員能夠更加集中、方便和有效的管理企業(yè)的網(wǎng)絡(luò)資源。
![]() |
圖2 |
◆可視化管理
可視化管理用于對企業(yè)的各種系統(tǒng)、應用、數(shù)據(jù)庫等資源進行實時的性能監(jiān)控和診斷的軟件產(chǎn)品,它是個實時系統(tǒng)狀態(tài)監(jiān)控軟件,在前端交互界面上主要采用Flash 技術(shù),生動形象的展現(xiàn)系統(tǒng)各個部分的狀態(tài)變化。
![]() |
圖3 |
◆快速監(jiān)控
一款強大的網(wǎng)絡(luò)資源監(jiān)控軟件,應能快捷易用,使用戶能夠快速上手。不但可以快速發(fā)現(xiàn)資源,而且可以立即開始監(jiān)控,使用戶可以立即查看所有資源的狀態(tài)、可用性、性能指標取值、報警信息等等。
◆Dashboard
服務Dashboard(業(yè)務服務管理儀表盤),提供對IT 基礎(chǔ)架構(gòu)的全面管理,并且能把IT 服務和相關(guān)用戶串聯(lián)連一起,提供直觀的可視化界面。一旦發(fā)生問題,系統(tǒng)管理員能很快通知受影響的客戶并及時了解服務故障嚴重程度。前端交互界面采用Flash 展現(xiàn),為用戶提供完整的信息視圖和工作平臺。
總結(jié)
一個真正綜合而全面的IT運行維護管理軟件,才是用戶的最終選擇。它必須從用戶角度出發(fā),對業(yè)務/應用服務,及其背后的IT基礎(chǔ)架構(gòu)(路由器、交換機、服務器等)進行全面監(jiān)控;提供保障業(yè)務的服務質(zhì)量,不僅能在服務可用性、響應時間等方面提供良好的服務保證,還能在服務中斷時,及時發(fā)出通知并解決問題。
酷點KoolPoint是針對企業(yè)的 IT 支持和管理部門提供的一款強大的監(jiān)控軟件,幫助用戶解決 IT 支持與管理過程中的難題,提高IT 服務水平和效率的產(chǎn)品。
因為有酷點KoolPoint,無需技術(shù)你也可以輕松運維!