Aix系統(tǒng)硬件故障定位
Aix系統(tǒng)應(yīng)用維護(hù)是一項(xiàng)細(xì)致的工作,在工作中除了要求技術(shù)人員工作嚴(yán)謹(jǐn)、認(rèn)真負(fù)責(zé)外,還要求技術(shù)人員必須具備在各種突發(fā)事件中較高的處理能力和工作經(jīng)驗(yàn)。隨著工商銀行兩大數(shù)據(jù)中心的建立,工行核心業(yè)務(wù)數(shù)據(jù)集中到數(shù)據(jù)中心,各一級(jí)分行的工作重點(diǎn)轉(zhuǎn)移到柜面業(yè)務(wù)系統(tǒng)、綜合前置系統(tǒng)和歷史數(shù)據(jù)查詢系統(tǒng)等外圍系統(tǒng)的維護(hù)工作方面,其中Aix操作系統(tǒng)在工行的使用比較廣泛。
在應(yīng)用維護(hù)方面,工行使用Aix系統(tǒng)的應(yīng)用主要有:綜合前置系統(tǒng)、跨行支付系統(tǒng)、客戶對(duì)賬系統(tǒng)、歷史數(shù)據(jù)查詢系統(tǒng)、國(guó)際業(yè)務(wù)結(jié)算系統(tǒng)5個(gè)應(yīng)用系統(tǒng)。通過幾年來的工作實(shí)踐,我們積累了一些Aix操作系統(tǒng)環(huán)境下應(yīng)用系統(tǒng)的維護(hù)及性能優(yōu)化的經(jīng)驗(yàn)。
系統(tǒng)硬件故障定位
IBM 小型機(jī)硬件故障定位方法包括小型機(jī)機(jī)柜上的顯示面板上的Checkpoints信息,Error Code和SRNs。Checkpoints檢查點(diǎn)是系統(tǒng)加電CMOS初始化程序 (IPL,Initial Program Load)運(yùn)行后顯示在機(jī)柜的顯示面板上一系列信息。
IPL流程如下:當(dāng)系統(tǒng)加電后,自動(dòng)進(jìn)入IPL流程,IPL流程包括4個(gè)步驟。
①Service Processor的初始化,始于系統(tǒng)加電,直到OK顯示在機(jī)柜上的顯示面板上為止。這個(gè)步驟會(huì)顯示8xxx或9xxx checkpoints代碼。
②由Service Processor引導(dǎo)的硬件初始化,始于按下機(jī)柜上的白色電源開關(guān)。這個(gè)步驟會(huì)顯示9xxx checkpoints。“91FF”是最后的代碼,標(biāo)志著第3步的開始。
③系統(tǒng)固件的初始化,一個(gè)系統(tǒng)處理器接管控制并繼續(xù)初始化系統(tǒng)資源,這個(gè)步驟會(huì)顯示Exxx。“E105”是最后的代碼,標(biāo)志著第4步驟Aix啟動(dòng)的開始。在這個(gè)過程中還會(huì)顯示各種位置碼(位置碼代表著系統(tǒng)的每一個(gè)部分)。
④Aix啟動(dòng),當(dāng)Aix開始啟動(dòng)時(shí),顯示面板上的代碼為0xxx,同時(shí)位置碼會(huì)出現(xiàn)在第二行。當(dāng)Aix的登錄窗口出現(xiàn)在控制臺(tái)上時(shí),第4步驟結(jié)束,同時(shí)顯示面板上再無任何信息顯示。
當(dāng)Aix系統(tǒng)運(yùn)行發(fā)現(xiàn)錯(cuò)誤時(shí),SRNs碼(Service request numbers,服務(wù)請(qǐng)求碼)會(huì)以xxx-xxx的形式顯示在顯示面板上,同時(shí)在Aix的errorlog中也會(huì)進(jìn)行登記;當(dāng)SSA磁盤柜出現(xiàn)故障時(shí),在磁盤柜前面板的液晶顯示屏上會(huì)顯示相應(yīng)的SRNs,同時(shí)黃色的顯示燈會(huì)閃動(dòng),在Aix的errorlog中會(huì)登記相應(yīng)錯(cuò)誤信息,在出現(xiàn)問題后記錄下代碼,并告之IBM公司解決。
如此,我們就能夠很快的找到故障,定位Aix系統(tǒng)故障所在之處了。
【編輯推薦】