[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: Reinicio misterioso del servidor



Hola,

pues lo tienes jodido, ¿Como vas a demostrar que es un problema de
hardware si no tienes hardware para cambiar y probar? La memoria puedes
testearla con memtest pero la placa y la CPU no. Por otra parte si fuese
memoria o CPU seguramente tendrías syslog lleno de segfaults y Oops
ademas de cores repartidos por tu sistema de archivos asi que yo apuesto
por la placa.

¿Como tienes una fuente redundante conectando los dos cables al mismo SAI?

Un saludo.

El 18/06/10 07:14, kazabe escribió:
> El día 17 de junio de 2010 18:05, AngelD <angeld@froga.net> escribió:
>   
>> El Thu, 17 Jun 2010 17:55:02 -0500
>> kazabe <kazabe@gmail.com> escribió:
>>
>>     
>>> Holas.
>>>
>>> Tengo un servidor que desde hace varias se esta reiniciando sin razon
>>> aparente.
>>>
>>> Tiene doble fuente de poder, ambas conectadas a la UPS.  La misma UPS
>>> sostiene otro debian, el cual no ha fallado en ningun momento.  Esto
>>> me hace descartar problemas con la UPS.
>>>
>>> He revisado hasta el cansancio todos los logs del servidor, los
>>> procesos, etc buscando algun indicio de reinicio, pero no encuentro
>>> nada.  Segun veo todos los registros relativos a las horas de los
>>> reinicios, muestran los logs como si se hubiera reiniciado por fallo
>>> electrico.
>>>
>>> Miren por ejemplo este fragmento del syslog.
>>>
>>> Jun 17 17:25:51 matero postfix/qmgr[3661]: D3C9E3A03E: removed
>>> Jun 17 17:25:52 matero postfix/smtp[2718]: 958033A06E:
>>> to=<olymaahe3118@etb.net.co>, relay=mx2.etb.n
>>> et.co[200.69.107.59]:25, delay=1.5, delays=0/0/1.4/0.11, dsn=5.0.0,
>>> status=bounced (host mx2.etb.net
>>> .co[200.69.107.59] said: 550 #5.1.0 Address rejected
>>> olymaahe3118@etb.net.co (in reply to RCPT TO co
>>> mmand))
>>> Jun 17 17:25:52 matero postfix/qmgr[3661]: 958033A06E: removed
>>> Jun 17 17:27:46 matero kernel: imklog 3.18.6, log source = /proc/kmsg
>>> started. Jun 17 17:27:46 matero rsyslogd: [origin software="rsyslogd"
>>> swVersion="3.18.6" x-pid="3073" x-info=
>>> "http://www.rsyslog.com";] restart
>>> Jun 17 17:27:46 matero kernel: [    0.000000] Initializing cgroup
>>> subsys cpuset Jun 17 17:27:46 matero kernel: [    0.000000]
>>> Initializing cgroup subsys cpu Jun 17 17:27:46 matero kernel:
>>> [    0.000000] Linux version 2.6.26-1-xen-686 (Debian 2.6.26-13lenny2
>>> ) (dannf@debian.org) (gcc version 4.1.3 20080704 (prerelease) (Debian
>>> 4.1.2-25)) #1 SMP Fri Mar 13 2
>>> 2:30:40 UTC 2009
>>>
>>> Como veran, a las 17:25:52 se estaba eliminando un mensaje de la cola
>>> de postfix y dos minutos despues, a las 17:27:46 el servidor estaba
>>> arrancando nuevamente.
>>>
>>> Todos los logs muestran la informacion similar.  Procesos normales, y
>>> luego, de la nada, procesos de arranque.
>>>
>>> He buscado en la BIOS del servidor si existe algun registro de
>>> problemas electricos, pero nada.
>>>
>>> El equipo se mantiene a temperatura promedio de 23 grados.
>>>
>>> Alguno de ustedes ha tenido un problema similar?
>>>       
>>        Sip, tube unas memorias jodidas, que de cuando en cuando hacían
>> cosas parecidas. Compraría boletos para 99% hardware.
>>
>>     
>>> lo logro entender que puede estar pasando
>>>       
>>        ¡Que se reinicia el servidor!. Mira  que has puesto una
>> fácil. :-)
>>
>>
>> --
>> To UNSUBSCRIBE, email to debian-user-spanish-REQUEST@lists.debian.org
>> with a subject of "unsubscribe". Trouble? Contact listmaster@lists.debian.org
>> Archive: [🔎] 20100618010518.48906d77@x32">http://lists.debian.org/[🔎] 20100618010518.48906d77@x32
>>
>>
>>     
> Hola.
>
> Como puedo confirmar que sean problemas de memoria?  Para poder
> solicitar cambio de hardware tengo que demostrar que esta realmente
> jodido.
>
> Saludos.
>
> «Existen dos cosas infinitas:
> el universo y la estupidez humana... y no estoy muy seguro de la primera» :
> Albert Einstein
>
>
>   


Reply to: