[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: OT: un error lógico (Gnu/Linux+filesystem)de disco puede producir sectores defectuosos?



El Fri, 07 Dec 2012 10:37:24 -0300, Flako escribió:

> Hola
>     Esto esto esta mas asociado mas a un tema de harddisk+Gnu/Linux
> que a Debian, pero como de nuevo necesito de su experiencia aquí estoy
> escribiendo otro OT.

Okay :-)

>     Tengo un Disco (SAMSUNG HD103SJ de 1TB) que coloque "casi-nuevo"
> en un servidor (HP DL120 G5), a las 3 semanas el disco fallo con errores
> de sectores que no se podían leer (end_request: I/O error) y el disco
> dejo de estar disponible (el fdisk mostraba el disco sin particiones y
> /dev/xxx no respondía al mount). Para hacer que vuelva andar se tuvo que
> reiniciar el servidor.
>     Me puse a analizar el disco (en otro equipo) y no encontré errores
> de smart, ni sectores  reallocated, según smart el disco esta OK.
> también corrí badblocks -wsv /dev/xxx. y no encontró errores.
>     Los checkeos que hice dan entender que el disco esta bien, pero me
> sale la duda si este tipo de problemas puede ser producto de algún error
> lógico/kernel/etc o algún problema de la controladora de disco.
>     Este disco (SAMSUNG HD103SJ de 1TB) lo coloque en el servidor como
> remplazo de otro que tuvo un comportamiento similar, solo que el disco
> anterior si estaba dañado, con sectores reasignados y fallaba con
> badblocks.
> 
>     Y mi pregunta es si este tipo de errores puede ser producido por
> errores lógicos (algún bug del kernel o del filesystem)?
>     o tendría que pensar en algún problema de hard del servidor?

(...)

Te recomiendo que antes de nada analices el disco con la herramienta del 
fabricante (ahora Seagate) y le pases el "test largo". Si te da algún 
error y el disco es nuevo y está en garantía, gestiona un RMA y que te 
manden uno nuevo.

Si el test no detecta fallos, los errores que mencionas pueden ser 
debidos a factor externos: cables y conexiones del disco en mal estado 
(doblados, forzados o partidos), fuente de alimentación, placa base, 
voltajes... tendrías que descartar uno a uno estos elementos.

Por último, quedaría un error/problema de software. Probar con un kernel 
nuevo sería una posible opción para descartar alguna incompatibilidad 
entre la controladora del disco duro y el driver utilizado (libata, ahci, 
etc...).

Saludos,

-- 
Camaleón


Reply to: