[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: Ошибки в протоколах



On 23.05.2013 23:56, Andrey Tataranovich wrote:
> 01:51 Thu 23 May    , Yuriy Kaminskiy wrote:
>> Andrey Tataranovich wrote:
>>> 23:11 Mon 20 May    , "Артём Н." wrote:
>>>> Периодически обнаруживаю у себя такое:
>>>>
>>>> May 19 23:27:24 dana kernel: [324437.406837] ata3.01: exception Emask 0x10 SAct 0x0 SErr 0x4000000 action 0x0
>>>> May 19 23:27:24 dana kernel: [324437.406841] ata3.01: SError: { DevExch }
>>>> May 19 23:27:24 dana kernel: [324437.406847] ata3.00: hard resetting link
>>>> May 19 23:27:25 dana kernel: [324438.137560] ata3.01: hard resetting link
>>>
>>> Заменить SATA кабель для начала.
>>
>> Я бы согласился, если бы эти ошибки происходили в случайные моменты времени.
>> Однако, как видно из лога, они происходят исключительно во время процесса
>> suspend-on-disk.
>> Что склоняет к более другой причине: либо какая-то проблема с драйвером, либо во
>> время подготовки к заморозке user-level отправляет какую-то команду диску,
>> которую тот не может переварить.
>> Хотя кабель, конечно, проверить не помешает.
> 
>   Во время suspend'а идет активная запись на диск, в этот момент запросто могут
> проявляться ошибки из-за плохого кабеля.
> 
>   Кстати если проблема появилась недавно, то возможно имеет место перегрев. Я как-то
> видел похожие проблемы с диском при перегреве сервера.
> 
> ---
> WBR, Andrey Tataranovich
> 
> 
Заменил SATA кабель.
Но всё-равно:
<<
Jun  1 23:23:28 dana artiom: Activating firewall script generated Wed May 15
22:16:05 2013 by root
Jun  1 23:23:34 dana kernel: [52747.786515] ata3.01: exception Emask 0x10 SAct
0x0 SErr 0x4000000 action 0x0
Jun  1 23:23:34 dana kernel: [52747.786518] ata3.01: SError: { DevExch }
Jun  1 23:23:34 dana kernel: [52747.786525] ata3.00: hard resetting link
Jun  1 23:23:35 dana kernel: [52748.510517] ata3.01: hard resetting link
Jun  1 23:23:36 dana dbus[2816]: [system] Rejected send message, 7 matched ru
...
Jun  2 07:48:22 dana kernel: [52888.583157] ata3.01: exception Emask 0x10 SAct
0x0 SErr 0x4000000 action 0x0
Jun  2 07:48:22 dana kernel: [52888.583162] ata3.01: SError: { DevExch }
Jun  2 07:48:22 dana kernel: [52888.583171] ata3.00: hard resetting link
Jun  2 07:48:22 dana kernel: [52889.306894] ata3.01: hard resetting link
Jun  2 07:48:23 dana kernel: [52890.188565] ata3.00: SATA link up 3.0 Gbps
(SStatus 123 SControl 300)
Jun  2 07:48:23 dana kernel: [52890.188577] ata3.01: SATA link down (SStatus 0
SControl 300)
Jun  2 07:48:23 dana kernel: [52890.216918] ata3.00: configured for UDMA/133
Jun  2 07:48:24 dana kernel: [52891.163541] audit_printk_skb: 108 callbacks
suppressed
...

Jun  2 12:14:05 dana kernel: [   94.556208] ata3.01: exception Emask 0x10 SAct
0x0 SErr 0x4000000 action 0x0
Jun  2 12:14:05 dana kernel: [   94.556211] ata3.01: SError: { DevExch }
Jun  2 12:14:05 dana kernel: [   94.556216] ata3.00: hard resetting link
Jun  2 12:14:06 dana kernel: [   95.288134] ata3.01: hard resetting link
Jun  2 12:14:07 dana kernel: [   96.169847] ata3.00: SATA link up 3.0 Gbps
(SStatus 123 SControl 300)
Jun  2 12:14:07 dana kernel: [   96.169860] ata3.01: SATA link down (SStatus 0
SControl 300)
Jun  2 12:14:07 dana kernel: [   96.194131] ata3.00: configured for UDMA/133 >>

Перегрева, скорее всего, быть не может, потому что в корпусе 5 кулеров, включая
здоровый боковой.
Сенсоры показывают температуру 32 и 41 градус.
SMART показывает:
/dev/sda:
190 Airflow_Temperature_Cel 0x0022   069   063   045    Old_age   Always       -
      31 (Min/Max 24/32)
194 Temperature_Celsius     0x0022   031   040   000    Old_age   Always       -
      31 (0 19 0 0)
/dev/sdb:
190 Airflow_Temperature_Cel 0x0022   157   097   000    Old_age   Always       -
      27
194 Temperature_Celsius     0x0022   157   097   000    Old_age   Always       -
      27


Где ещё смотреть?


Reply to: