[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: Reinicio misterioso del servidor



El 21/06/10 23:09, Javier San Roman escribió:
El Viernes, 18 de Junio de 2010, kazabe escribió:
  
Holas.

Tengo un servidor que desde hace varias se esta reiniciando sin razon
aparente.

Tiene doble fuente de poder, ambas conectadas a la UPS.  La misma UPS
sostiene otro debian, el cual no ha fallado en ningun momento.  Esto
me hace descartar problemas con la UPS.

He revisado hasta el cansancio todos los logs del servidor, los
procesos, etc buscando algun indicio de reinicio, pero no encuentro
nada.  Segun veo todos los registros relativos a las horas de los
reinicios, muestran los logs como si se hubiera reiniciado por fallo
electrico.

Miren por ejemplo este fragmento del syslog.

Jun 17 17:25:51 matero postfix/qmgr[3661]: D3C9E3A03E: removed
Jun 17 17:25:52 matero postfix/smtp[2718]: 958033A06E:
to=<olymaahe3118@etb.net.co>, relay=mx2.etb.n
et.co[200.69.107.59]:25, delay=1.5, delays=0/0/1.4/0.11, dsn=5.0.0,
status=bounced (host mx2.etb.net
.co[200.69.107.59] said: 550 #5.1.0 Address rejected
olymaahe3118@etb.net.co (in reply to RCPT TO co
mmand))
Jun 17 17:25:52 matero postfix/qmgr[3661]: 958033A06E: removed
Jun 17 17:27:46 matero kernel: imklog 3.18.6, log source = /proc/kmsg
started. Jun 17 17:27:46 matero rsyslogd: [origin software="rsyslogd"
swVersion="3.18.6" x-pid="3073" x-info=
"http://www.rsyslog.com"] restart
Jun 17 17:27:46 matero kernel: [    0.000000] Initializing cgroup subsys
cpuset Jun 17 17:27:46 matero kernel: [    0.000000] Initializing cgroup
subsys cpu Jun 17 17:27:46 matero kernel: [    0.000000] Linux version
2.6.26-1-xen-686 (Debian 2.6.26-13lenny2
) (dannf@debian.org) (gcc version 4.1.3 20080704 (prerelease) (Debian
4.1.2-25)) #1 SMP Fri Mar 13 2
2:30:40 UTC 2009

Como veran, a las 17:25:52 se estaba eliminando un mensaje de la cola
de postfix y dos minutos despues, a las 17:27:46 el servidor estaba
arrancando nuevamente.

Todos los logs muestran la informacion similar.  Procesos normales, y
luego, de la nada, procesos de arranque.

He buscado en la BIOS del servidor si existe algun registro de
problemas electricos, pero nada.

El equipo se mantiene a temperatura promedio de 23 grados.

Alguno de ustedes ha tenido un problema similar?
    
Si. Tuve que cambiar la placa madre.
También podría ser la fuente de alimentación, memoria o procesador..

  
Yo tuve el mismo problema hace algun tiempo, se reiniciaba el server sin razon aparente y los logs limpios...
Pero no tardamos mucho en darnos cuenta que era la placa madre ya que a los 15 días más o menos se reinicio otra vez sin motivo, pero esta vez ya no pudo arrancar... y segun todas las verificaciones era causa de la placa madre, la cambiamos y todo normal nuevamente...

  
lo logro entender que puede estar pasando.

Gracias de antemano por cualquier ayuda que me puedan facilitar.

saludos

«Existen dos cosas infinitas:
el universo y la estupidez humana... y no estoy muy seguro de la primera» :
Albert Einstein
    

  


Reply to: