【正文】
0 Physical Disk Drive pdisk6 Available 1108164107P SSA160 Physical Disk Drive pdisk7 Available 1108164106P SSA160 Physical Disk Drive pdisk8 Available 1108164109P SSA160 Physical Disk Drive pdisk9 Available 1108164111P SSA160 Physical Disk Drive pdisk10 Available 1108164110P SSA160 Physical Disk Drive pdisk11 Available 1108164112P SSA160 Physical Disk Drive 看第三列中間字符中有01的字樣,表示其物理硬盤位置,以上對應(yīng)關(guān)系表示pdisk0pdisk11對應(yīng)的物理槽位分別是1\5\4\8\2\3\7\6\9\11\10\12的位置,所以在使用smitty ssaraid做RAID0+1時,前面八塊盤按158軸對稱方式對應(yīng)做mirror,912中如選擇9(pdisk8)/12(pdisk11)位置做mirror所以選擇Primary Disks/Secondary Disks時如下: smitty ssaraid Add an SSA RAID Array ... Primary Disks [選擇:pdisk0 pdisk4 pdisk5 pdisk2 pdisk8] 物理14,9槽位 Secondary Disks [選擇:pdisk3 pdisk6 pdisk7 pdisk1 pdisk11]物理85,12槽位 該要求只是從性能考慮,并不增加其他特性。然后使用如下方式將其做成hot spare盤。 e) hot spare盤插入位置可以找前排8個位置中的空位插入即可。問題表現(xiàn): 對ssa卡上的電池保護是通過卡上的一個計數(shù)器實現(xiàn)的,每運行一小時該計數(shù)器會增加一,當(dāng)該計數(shù)接近或超過22000時,系統(tǒng)會有26CA120B硬件報警:26CA120B 0206120904 P H ssa1 CACHE STORAGE CARD 可以用如下命令檢查ssa卡上的狀態(tài):(a 后帶上卡的邏輯設(shè)備名,這里假設(shè)是ssa0) ssa_fw_status a ssa0 p (檢查電池已經(jīng)工作的時間,小時為單位) ssa_fw_status a ssa0 l (檢查電池安全工作壽命,小時為單位) ssa_fw_status a ssa0 c (檢查ssa卡上的fast write功能是否被激活)處理步驟: (按優(yōu)選方式列出,從中選擇一種即可)1)更換電池 選擇系統(tǒng)閑時,更換主備機ssa卡電池,可以采用: 停備機-》更換備機ssa卡電池-》起備機(雙機服務(wù))-》主備倒換-》 停原主機-》更換原主機ssa卡電池-》起原主機(雙機服務(wù))2)如果系統(tǒng)出現(xiàn)26CA120B電池告警,使用ssa_fw_status a ssa0 c 檢查主用ssa卡(一般是ssa0)的Fast Write是否處于inactive(未被激活)狀態(tài),如果是,則以root執(zhí)行如下命令: ssa_format l ssa0 b errclear 0 /usr/lib/errstop /usr/lib/errdemon 可以暫緩更換電池時間,等有電池后再更換,但這段時間對磁陣讀寫性能會有所影響。檢查單盤是否有問題的方法如下: diagTask SelectionSSA Service AidsCertify Disk 選擇認(rèn)為存在故障的硬盤進行檢查如果7133存在硬件故障時,可從狀態(tài)燈上觀察到: 當(dāng)單塊硬盤出現(xiàn)故障或未被使用時,其面板上的硬盤狀態(tài)燈會不亮 陣列的狀態(tài)燈黃燈會亮 或接SSA線的端口的指示燈也會熄滅如果通過以上三種方法都未發(fā)現(xiàn)問題,而系統(tǒng)仍報Open Serial Link錯誤,建議繼續(xù)跟蹤。625E6B9A 0401090004 P H ssa0 ADAPTER DETECTED OPEN SERIAL LINK的排查方法:要求將7133中未插硬盤的槽位全部插上dummy盤。故障排除:對于紅色部分錯誤的問題排除,一般可以使用diag命令進行進一步診斷:diag Task Selection SSA Service Aids Link Verification 檢查環(huán)路中是否出現(xiàn)了???的盤符或狀態(tài)不是good的硬盤或使用:smitty ssaraid List All Defined SSA RAID Arrays 查看磁盤陣列RAID盤的狀態(tài)是否是Good。這類錯誤產(chǎn)生將影響IO寫性能,并且由于在FastWrite打開的情況下,主備機需要同步ssa卡上的write cache,所以甚至?xí)绊懙街鱾錂C同步。2)如果 625E6B9A錯誤偶爾報一次,則要具體情況具體對待,有可能是讀寫忙出現(xiàn)的誤報,也按下面方法進行排查,如果沒有查出具體的原因,則可以繼續(xù)觀察。開環(huán)一般有兩種情況:1)如果625E6B9A報錯比較頻繁,如每天幾次,則表示系統(tǒng)很有可能出了硬件故障,雖然不會導(dǎo)致訪問磁陣失敗,但需要立即查出原因并解決。故障定位:7133硬件故障也可以使用:errpt –dH 查看到伴隨的錯誤碼有:B4C00618 0115140004 P H ssa0 RESOURCE UNAVAILABLEFE9E9357 0401082304 P H ssa0 DISK OPERATION ERRORFE9E9357 1205000803 P H pdisk3 DISK OPERATION ERROR03913B94 1122031103 U H LVDD HARDWARE DISK BLOCK RELOCATION ACHIEVED613E5F38 1121125103 P H LVDD I/O ERROR DETECTED BY L