维护人员在夜间对Metro5000网元一块报BD_STATUS告警的SD16故障单板进行更换时,基站业务发生不到一分钟的闪断。SD16单板更换分析:到达现场后,现场操作人首先和网管核实了网元、槽位及网元工作状态等相关信息。然后在22:49左右拔出2817-马连道-10.1的“IN”口光纤,网管发现该两点环没有正常倒换,于是现场操作人在22:50左右将“IN” 口光纤还原。之后在22:51分左右尝试拔出2817-马连道-10.1的“OUT”口光纤,正常触发了复用段倒换。并于22:53左右完成2817-马连道10板位SD16单板的更换工作。该环的倒换在23:05正常恢复 通过上面的一系列数据,可以初步判断,之前2817-马连道的10-SD16闪报NO_BD_SOFT告警,单板的FLASH存储区出现异常。复位后需要从存储区重新加载App到内存。无法正常加载,单板工作在BIOS态。此时各个业务芯片还可以正常工作,业务不受影响。在App没有开工的情况下,板间通信无法正常完成,K字节检测、上报等相关动作无法正常完成。所以在复位后单板长报BD_STATUS告警。在现场拔出2817-马连道10.1的“IN”口光纤时,线路板就没有将“SF_DETECTED”的K字节报给主机,自然主机无法进行处理,向对端发起倒换请求,所以无法触发倒换。 #2817:szhw [2817-马连道8(10G)/CD5-01][][2011-2-28 11:41:53]> :cfg-get-rmsevent:2,tail MSSPR-EVENT-LOG PG-ID EVENT-NO EVENT-VALUE EVENT-PARA DATE-TIME TIME-STAMP 2 582 K_RECEIVED 0xb108 2011-2-27 22:51:49 0x2e8eddcb 2 583 K_DIR 000000 2011-2-27 22:51:49 0x2e8edde9 2 584 XC_EXECUTE 0x0003 2011-2-27 22:51:49 0x2e8ee579 2817-马连道对应协议模块记录的2月27日最早K字节是现场在23:51分拔10.1的“OUT”口触发对端112-马连道触发倒换后,112-马连道网元从长径发送过来的倒换请求。当客户拔出2817-马连道10.1的“IN”口光纤后下游业务中断,下游VC4穿通的时隙上报AU_AIS。电路末端上报TU_AIS,业务中断。当光纤还原后告警结束,业务恢复。 2817-马连道Meto5000的10-SD16单板故障,现场更换单板时拔出1光口的收方向光纤时,业务中断,光纤插回后业务恢复。 预防、监控措施 如果后续在故障处理过程中遇到MSP环上某单线路板上报BD_STATUS,需要更换该故障线路板时,操作建议如下 ⑴、在相邻网元下强制倒换,网管确认强制倒换成功后。现场再对该单板进行更换。由于是强制倒换,现场拔纤等动作务必小心,防止MSP环上多区段断纤而影响业务。 ⑵、现场首先拔出上报BD_STATUS光板的“OUT”口光纤,让相邻网元收“LOS”触发倒换,网管确认倒换正常后,现场再实施换板操作。
|