Aix系統(tǒng)維護(hù)經(jīng)驗(yàn)之談
我們經(jīng)常使用Aix系統(tǒng),不免會(huì)遇到嗯多問(wèn)題,Aix系統(tǒng)維護(hù)也就成了必然的事情了,這里我們就學(xué)習(xí)下Aix系統(tǒng)維護(hù)經(jīng)驗(yàn)。應(yīng)用維護(hù)是一項(xiàng)細(xì)致的工作,在工作中除了要求技術(shù)人員工作嚴(yán)謹(jǐn)、認(rèn)真負(fù)責(zé)外,還要求技術(shù)人員必須具備在各種突發(fā)事件中較高的處理能力和工作經(jīng)驗(yàn)。
隨著工商銀行兩大數(shù)據(jù)中心的建立,工行核心業(yè)務(wù)數(shù)據(jù)集中到數(shù)據(jù)中心,各一級(jí)分行的工作重點(diǎn)轉(zhuǎn)移到柜面業(yè)務(wù)系統(tǒng)、綜合前置系統(tǒng)和歷史數(shù)據(jù)查詢(xún)系統(tǒng)等外圍系統(tǒng)的維護(hù)工作方面,其中Aix操作系統(tǒng)在工行的使用比較廣泛。
Aix系統(tǒng)維護(hù)之故障信息的收集
收集故障信息對(duì)于判斷、診斷故障原因,修復(fù)系統(tǒng)非常重要。我們通過(guò)檢查系統(tǒng)錯(cuò)誤報(bào)告?errorlog?、發(fā)給root用戶(hù)的錯(cuò)誤報(bào)告?mail?和檢查hacmp.out?smit.log?boot.log等內(nèi)容來(lái)判斷系統(tǒng)是否發(fā)生故障,根據(jù)故障信息進(jìn)行相應(yīng)的處理。
(1)系統(tǒng)故障記錄
errdemon 進(jìn)程在系統(tǒng)啟動(dòng)時(shí)自動(dòng)運(yùn)行,記錄包括硬件、軟件及其他操作信息,故障記錄文件為/var/adm/ras/errlog,可備份下來(lái)或拷貝到別的機(jī)器上分析,使用errpt 命令(普通用戶(hù)權(quán)限也可使用)。
#errpt |more 列出簡(jiǎn)短出錯(cuò)信息
#errpt -d H 列出所有硬件出錯(cuò)信息
#errpt -d S 列出所有軟件出錯(cuò)信息
#errpt -aj ERROR_ID 列出詳細(xì)出錯(cuò)信息
(2)控制面板上的LED 代碼
(3)SMS(System Management Service)故障記錄
當(dāng)主控臺(tái)出現(xiàn)鍵盤(pán)圖標(biāo)后(LED顯示“E1F1時(shí)”)按1鍵。選擇“Utilities”,選擇“Error Log”,抄下8位故障代碼。
(4) Mail檢查
系統(tǒng)出現(xiàn)故障后會(huì)向root用戶(hù)發(fā)mail,報(bào)告出錯(cuò)信息。通常系統(tǒng)出現(xiàn)故障后沒(méi)有進(jìn)行檢查修復(fù),系統(tǒng)還會(huì)定時(shí)以mail方式提醒root用戶(hù)。
(5)運(yùn)行故障診斷程序
對(duì)系統(tǒng)硬件進(jìn)行檢查和診斷,當(dāng)發(fā)現(xiàn)有硬件故障時(shí)應(yīng)立即使用diag。
#diag
> 選高級(jí)診斷(Advanced Diagnostic)
> 選問(wèn)題診斷(Problem Determination)或選系統(tǒng)檢查(System Verification)
diag運(yùn)行后會(huì)給出SRN代碼、故障設(shè)備名稱(chēng)及百分比數(shù)、地址代碼等。
(6)其他用于收集系統(tǒng)信息的命令
lsdev -C 系統(tǒng)設(shè)備信息
lspv 查看物理卷信息
lsvg 查看卷組信息
lslpp 查看文件組信息
lsattr 查看設(shè)備參數(shù)設(shè)置
lscfg 查看VPD(Virtual Product Data)信息
這樣,我們就學(xué)習(xí)了一些Aix系統(tǒng)維護(hù)的步驟,我們來(lái)一起Aix系統(tǒng)維護(hù)吧!
【編輯推薦】