[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: Demoras interminables al perder una conexión de red



Hola...

El 28/04/16 a las 10:51, Camaleón escribió:
El Wed, 27 Apr 2016 22:23:27 -0300, Walter O. Dari escribió:

Hola gente:

No se si tendré algo mal configurado.

Tengo una portátil con Jessie donde se montan (con autofs) algunos
directorios de 3 servidores distintos.

Esos directorios que montas en el portátil ¿son directorios del sistema o
sólo de datos?

Son datos de resguardos.


El asunto es que uno de los servidores comenzó a tener problemas con uno
de los discos en raid1, a partir de no poder montar ese directorio (o
montarlo pero no poder acceder a los datos),

Esto no lo entiendo. Un raid 1 te permite seguir funcionando sin
problemas en caso de fallo de uno de los discos ¿por qué dices que el
servidor tenía problemas de acceso a los datos? :-?

En realidad era un poco más complejo el problema, también daba errores con el disco del sistema (en raid1 estaban las particiones /home y /var). Esto ya me pareció muy raro, dos unidades de disco que fallen en los mismos momentos era demasiada casualidad. Al final reemplacé la fuente de alimentación del servidor y se terminaron todos los problemas.

la portátil prácticamente no funciona, se "cuelga" el administrador de
archivos, las ventanas de terminal donde intento entrar al directorio
en cuestión, en fin, en realidad no se si realmente se cuelga pero los
tiempos de demora son desesperantes, no me alcanza la paciencia para
saber si está colgada o no, he esperado hasta 20 minutos y la portátil
no se recupera. Los datos de los servidores son compartidos mediante nfs
y samba, desde la portátil se utiliza nfs para conectarse.

Es normal esto ?  O tengo que configurar en algún lugar los tiempos de
espera para que me devuelva el control ?

Entiendo que es normal si el portátil está intentando acceder a un
directorio que no existe o al que no tiene acceso y más aún si se trata
de un recurso que use el kernel (p. ej., la partición "/var" donde están
continuamente escribiendo datos los demonios).

Lo primero que haría es iniciar el portátil sin que se monten esos
recursos (si es posible) para comprobar que todo funciona con normalidad
y una vez hecho esto montar esos recursos de red manualmente (sin usar
autofs) para ver qué errores o qué impacto tiene sobre el sistema.

Como si lo anterior fuera poco, la portátil estaba cada vez más trabada y ya no conectaba a los otros 2 servidores. Segundos antes de estamparla contra el piso se me ocurrió controlar el patchcord con un tester, comprobando que el par 3/6 a veces funcionaba, a veces no. Una de las fichas (de esas inyectadas, no armadas) tenía un falso contacto.

En fin, casi toda una noche de trabajo perdida.

Mas allá de todo este cúmulo de problemas, me suele pasar que cuando uno de los servidores está apagado, los demás equipos pierden mucho tiempo intentando conectarse. Cuando ejecuto el dmesg, aparece algo así como...
"intentando conectar a svrsw1"
"no se puede conectar svrsw1"

... incluso hace que el dolphin demore en abrir y también en cerrar.

Por suerte me sucede pocas veces ya que los servidores están las 24 hs. en marcha, salvo algún corte de energía que supere la autonomía de la UPS o por cuestiones de mantenimiento.


Gracias por responder.

Saludos,

Igualmente !



--

Walter O. Dari

http://swcomputacion.com/
https://facebook.com/swcomputacion/
https://facebook.com/sistemasSW/
skype: waomda


Reply to: