[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: Preoccupanti reset



-----BEGIN PGP SIGNED MESSAGE-----
Hash: SHA1

Alle 11:49, venerdì 12 aprile 2002, Guido Notari ha scritto:
> Situazione: due server Supermicro SuperServer 6010H, rack mount, doppio
> processore PIII da 1 GHz, 1Gb di ram ciascuno, due dischi SCSI.
> Le due macchine sono identiche, anche se situate fisicamente in localita`
> diverse.
> 
> Entrambe le macchine hanno la preoccupante tendenza a resettarsi, senza
> motivo e senza lasciare traccia.
> Piu` specificamente: i reboot avvengono spesso (ma non sempre) alle cinque
> di mattina, in concomitanza con un'attivita` schedulata di replicazione fra
> dischi o, in alternativa, in occasione della manutenzione (vacuum) del
> database Postgres.
> 
> Ho pensato alla sovratemperatura, ma le cpu sono ben sotto il valore di
> allarme, le stanze sono condizionate, e i reboot avvengono in momenti di
> carico nullo o bassissimo -- una volta una si e` resettata davanti a me,
> che avevo fatto partire a mano la manutenzione database: si e` resettata
> dopo 10 secondi scarsi di attivita`, la temperatura mi sembra fuori
> questione.
> 
> Memoria: su una delle due macchine ho fatto girare memtest per una notte:
> nulla -- e poi problemi su entrambe le macchine?
> 
> Ho pensato anche ad un intervento inopportuno delle funzioni power saving
> ma, come detto, il reboot e` successo anche mentre usavo la macchina
> interattivamente.
> 
> Avevo pensato di dare la colpa al reiserfs che usavo: l'ho tolto, i
> problemi ci sono ancora, subdoli -- cioe` non tutti i giorni.
> Su uno dei due server ho aggiornato il BIOS, nulla.
> 
> I kernel sono Linux 2.4.17 e .18, compilati per multiprocessore, e con
> opzioni diverse, come tentativo. Debian Potato, ben aggiornata.
> 
> La tragedia e` che non viene lasciata NESSUNA traccia sui log:
> dall'attivita` normale -- spesso quasi nulla -- si passa alla traccia del
> reboot successivo. Nessuna indicazione: i reboot sono istantanei, come ho
> potuto constatare di persona.
> 

Il problema potrebbe essere relativo all'apic prova a passare noapic dal lilo 
e falla girare per un po'. Ci sono stati molti report sulla ml del kernel ed 
inoltre se hai attivo apm ci possono essere problemi.
prova ad aggiornare il kernel alla 2.4.19-pre6aa1 o semplicemente applica la 
vm33 di aa per eliminare ogni dubbio sulla vm. 
altre cose non me ne vengono in mente, se continui avere problemi manda un 
report sulla ml del kernel, li sono un po' piu' preparati :-)

- -- 
ciao
	-ale
-----BEGIN PGP SIGNATURE-----
Version: GnuPG v1.0.6 (GNU/Linux)
Comment: For info see http://www.gnupg.org

iD8DBQE8tsGqRTiBSVhISsERAgwRAKCR2HozKEVLaUcCMoUTld96pTImcwCeMKwE
tRigUZKqq0QFEIgjTevyIg8=
=6nCi
-----END PGP SIGNATURE-----


-- 
To UNSUBSCRIBE, email to debian-italian-request@lists.debian.org
with a subject of "unsubscribe". Trouble? Contact listmaster@lists.debian.org



Reply to: