Probleme mit raidsystem
Habe gestern folgendes Problem bekommen: Systemstillstand nach öffnen
von Iceape und Iceweasel, laut systemüberwachung 50% user + 50% sys last
- an sich ja nicht weiter aufregend aber minutenlanger stillstand wo
nichts mehr geht mit anschließender meldung io timeout und controller
reset - hatte mich doch etwas verwundert.
Bin in sachen Ursachenforschung etwas ratlos und benötige helfende
hinweise, hier erstmal einige Hinweise zu meinen System:
Portierung Etch i386
Dateisystem raid5e auf ServeRaidII Controller aus 6 platten ( jeweils 3*
IBM DNES 9GB SCSI und IBM )
3 Partitionen sda5 und sda7 als cryptfilesystem sda5 ist swap und sda7
ist / als xfs, sda6 ist /boot las ext2
Board ist ASUS A7V133
CPU ist amd k7 1400b
Ram ist 3*512 MB Infineon SDRAM
Erste Prüfung mittels tooldisk erbrachte das auf jeder Festplatte 13
misc events protokoliert waren, also habe ich jede Festplatte über das
Controller Setup abgeschaltet und neugestartet - bei einer Festplatte
ist der Controller sofort auf rebuild gesprungen ( er hat den
Palttenstatus auf rebuild gesetzt) soweit alles gut rebuild läuft ja im
hintergrung also rechner neu gestartet.
Lief auch soweit durch, erwartungsgenäß langsam - lief ja rebuild im
hintergrung.
Nach einigen minuten dan die meldung respawn oder respann to fast, dan
kam der hinweis das das dateisystem für 5 minuten deaktiviert wird kurz
darauf hörte ich wie die Festplatten abgeschaltet wurden.
Also wieder tooldisk und ab ins Controller setup, zu meiner überraschung
wurde die schreibe option von wb in wt geändert - durch wen und warum
weiß ich nicht - habe immer auf wb stehen und temp override wt.
Die Festplatten ließen sich erst nach dem abschalten und neustarten von
PC wieder online stellen.
Die vorher als rebuild makierte Festplatte habe ich gleich übers
controller Setup rebuilden lassen und danach neu gestartet.
Und Pustekuchen, mit zitronen gehandelt grub error15 - nun habe ich mir
/boot zerschoßen.
Knoppix rein und /boot angesehen - ordner grub ist zwar noch da aber
leider leer.
Da der versuch / zu mounten gescheitert ist und ich davon ausgehe das
gesamte system neu Installieren zu müßen habe ich einige Fragen :
- Macht es überhaupt einen Sinn ein fehlertolerantes raid zu benutzen
wenn man dm_crypt verwendet ?
- Ist die CPU zu schlapp um den io in der combination aus dm_crypt und
xfs zu hanhaben ?
- Kann ein treiberproblem zwischen ServeRaidII und linux-kernel
betstehen, wie erzeuge ich mir aktuelleren kerneltreiber ?
Danke für Unterstützung im voraus
Dirk Finkeldey
PS: Das system hatte 6 Monate vollkommen Problemlos funktioniert
Reply to: