[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Странное поведение SCSI-контроллера Adaptec ASC-29320A



Добрый день. 

Сегодня столкнулся со следующей проблемой с этой железкой:
SCSI storage controller: Adaptec ASC-29320A U320 (rev 10)

Произошел какой-то сбой (диска или контроллера), в результате которого
отвалился один из винчестеров, собранных в зеркало (софтварный рейд)
Причем машина не продолжила полет, а практически сразу остановилась,
спас только резет. 
После резета загрузка прошла, но один из винчестеров оказался не
включенным в рейд (цитата)
raid1: raid set md3 active with 1 out of 2 mirrors
md: md4 stopped.
md: bind<sda7>
md: bind<sdb7>
md: kicking non-fresh sda7 from array!
md: unbind<sda7>
md: export_rdev(sda7)

согласно mdadm, на sda7 и правда некорректный суперблок (а именно, там
записано что массив вполне synced, оба зеркала активны).

В логах вообще загадочный длинный фрагмент (цитата)

kernel: DevQ(0:0:0): 0 waiting
kernel: DevQ(0:1:0): 0 waiting
kernel: DevQ(0:2:0): 0 waiting
kernel: DevQ(0:3:0): 0 waiting
kernel: LQICRC_NLQ
kernel: scsi0: Returning to Idle Loop
kernel: scsi0:0:0:0: Attempting to abort cmd 000001003070e980: 0x28 0x0
0x2 0x9e 0xaf 0xaf 0x0 0x0 0x10 0x0
kernel: scsi0: At time of recovery, card was not paused
kernel: >>>>>>>>>>>>>>>>>> Dump Card State Begins <<<<<<<<<<<<<<<<<
kernel: scsi0: Dumping Card State at program address 0x22 Mode 0x33
kernel: Card was paused
kernel: HS_MAILBOX[0x0] INTCTL[0xc0]:(SWTMINTEN|SWTMINTMASK)
kernel: SEQINTSTAT[0x10]:(SEQ_SWTMRTO) SAVED_MODE[0x11]
DFFSTAT[0x34]:(CURRFIFO_0|FIFO0FREE|FIFO1FREE)
kernel: SCSISIGI[0xe6]:(P_MESGIN|REQI|BSYI)
SCSIPHASE[0x8]:(MSG_IN_PHASE)
kernel: SCSIBUS[0x55] LASTPHASE[0x1]:(P_DATAOUT|P_BUSFREE)
kernel: SCSISEQ0[0x0] SCSISEQ1[0x12]:(ENAUTOATNP|ENRSELI)
kernel: SEQCTL0[0x0] SEQINTCTL[0x0] SEQ_FLAGS[0xc0]:(NO_CDB_SENT|
NOT_IDENTIFIED)
kernel: SEQ_FLAGS2[0x0] SSTAT0[0x2]:(SPIORDY) SSTAT1[0x19]:(REQINIT|
BUSFREE|PHASEMIS)
kernel: SSTAT2[0x0] SSTAT3[0x0] PERRDIAG[0x0] SIMODE1[0xa4]:(ENSCSIPERR|
ENSCSIRST|ENSELTIMO)
kernel: LQISTAT0[0x0] LQISTAT1[0x0] LQISTAT2[0x80]:(PACKETIZED)
kernel: LQOSTAT0[0x0] LQOSTAT1[0x0] LQOSTAT2[0xe1]:(LQOSTOP0|LQOPKT)
kernel:
kernel: SCB Count = 72 CMDS_PENDING = 5 LASTSCB 0x9 CURRSCB 0x19 NEXTSCB
0xff02
kernel: qinstart = 38124 qinfifonext = 38124
kernel: QINFIFO:
kernel: WAITING_TID_QUEUES:
kernel:        0 ( 0x19 0x41 0x9 0x23 )
kernel: Pending list:
kernel:  35 FIFO_USE[0x0] SCB_CONTROL[0x60]:(TAG_ENB|DISCENB)
SCB_SCSIID[0x7]
kernel:   9 FIFO_USE[0x0] SCB_CONTROL[0x60]:(TAG_ENB|DISCENB)
SCB_SCSIID[0x7]
kernel:  65 FIFO_USE[0x0] SCB_CONTROL[0x60]:(TAG_ENB|DISCENB)
SCB_SCSIID[0x7]
kernel:  25 FIFO_USE[0x0] SCB_CONTROL[0x60]:(TAG_ENB|DISCENB)
SCB_SCSIID[0x7]
kernel:  47 FIFO_USE[0x0] SCB_CONTROL[0x60]:(TAG_ENB|DISCENB)
SCB_SCSIID[0x7]
kernel: Total 5
kernel: Kernel Free SCB list: 52 0 30 56 44 39 1 46 17 61 51 4 38 19 59
67 8 49 31 45 57 48 28 33 14 53 3 20 32 54 40 7 21 36 2 18 23 70 43 24
41 15 5 10 11 16 27 6 50 60 55 34 22 42 66 12 63 62 58 26 13 69 71 68 64
37 29
kernel: Sequencer Complete DMA-inprog list:
kernel: Sequencer Complete list:
kernel: Sequencer DMA-Up and Complete list:
kernel:
kernel: scsi0: FIFO0 Free, LONGJMP == 0x8234, SCB 0x2f
kernel: SEQIMODE[0x3f]:(ENCFG4TCMD|ENCFG4ICMD|ENCFG4TSTAT|ENCFG4ISTAT|
ENCFG4DATA|ENSAVEPTRS)
kernel: SEQINTSRC[0x0] DFCNTRL[0x0] DFSTATUS[0x88]:(HDONE|PRELOAD_AVAIL)
kernel: SG_CACHE_SHADOW[0x2]:(LAST_SEG) SG_STATE[0x0] DFFSXFRCTL[0x0]
kernel: SOFFCNT[0x0] MDFFSTAT[0x45]:(FIFOFREE|DLZERO|SHCNTNEGATIVE)
kernel: SHADDR = 0x03c, SHCNT = 0xffffc4 HADDR = 0x00, HCNT = 0x0
kernel: CCSGCTL[0x10]:(SG_CACHE_AVAIL)
kernel: scsi0: FIFO1 Free, LONGJMP == 0x8063, SCB 0x3
kernel: SEQIMODE[0x3f]:(ENCFG4TCMD|ENCFG4ICMD|ENCFG4TSTAT|ENCFG4ISTAT|
ENCFG4DATA|ENSAVEPTRS)
kernel: SEQINTSRC[0x0] DFCNTRL[0x0] DFSTATUS[0x89]:(FIFOEMP|HDONE|
PRELOAD_AVAIL)
kernel: SG_CACHE_SHADOW[0x2]:(LAST_SEG) SG_STATE[0x0] DFFSXFRCTL[0x0]
kernel: SOFFCNT[0x0] MDFFSTAT[0x5]:(FIFOFREE|DLZERO) SHADDR = 0x00,
SHCNT = 0x0
kernel: HADDR = 0x00, HCNT = 0x0 CCSGCTL[0x10]:(SG_CACHE_AVAIL)
kernel: LQIN: 0x5 0x0 0x0 0x2f 0x0 0x0 0x0 0x0 0x0 0x0 0x0 0x0 0x0 0x0
0x2 0x0 0x0 0x0 0x2 0x0
kernel: scsi0: LQISTATE = 0x2c, LQOSTATE = 0x0, OPTIONMODE = 0x52
kernel: scsi0: OS_SPACE_CNT = 0x20 MAXCMDCNT = 0x1
kernel:
kernel: SIMODE0[0xc]:(ENOVERRUN|ENIOERR)
kernel: CCSCBCTL[0x4]:(CCSCBDIR)
kernel: scsi0: REG0 == 0x2f, SINDEX = 0x102, DINDEX = 0x102
kernel: scsi0: SCBPTR == 0x19, SCB_NEXT == 0x41, SCB_NEXT2 == 0xff3f
kernel: CDB 28 0 2 ad d1 ef
kernel: STACK: 0xe 0x0 0x0 0x0 0x0 0x0 0x0 0x0
kernel: <<<<<<<<<<<<<<<<< Dump Card State Ends >>>>>>>>>>>>>>>>>>

причем повторяется этот фрагмент несколько раз.
Встречался ли кто-то из присутствующих с таким контроллером, были ли на
него нарекания, нормально ли его поведение в таком вот случае? 
Заранее спасибо.




-- 
Alexander Vlasov
ZULU-UANIC
JID: zulu <at> jabber.kiev.ua

Reply to: