[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: RAID-Frage: Rebuild im Voraus



Andre Tann wrote on Tue, 5 Jan 2010 15:49:36 +0100:
> Maxx, Dienstag 05 Januar 2010: 
>  
> > Warum willst du dann so ein "aufwändiges" RAID?
> > Wie groß ist denn deiner Meinung nach die Gefahr, dass auch die 2.
> > Platte während des Rebuilds ausfällt?
> 
> Der Meinung des Herstellers nach ist die Wahrscheinlichkeit für
> einen Bitkipper, wenn ich mich richtig Erinnere, 10E-14. 1 GB =
> 1E12 Bytes = 1E13 Bits, jedenfalls ungefähr. Das heißt also: Die
> Platte zehnmal lesen, und ich habe einen Fehler, statistisch
> gesehen. Bei der Bitkipperwahrscheinlichkeit müßte ich nochmal
> nachlesen, vielleicht waren es auch 1e-15. Dann müßte ich die
> Platte halt hundert mal lesen für einen Kipper. Jedenfalls finde
> ich 10% Wahrscheinlichkeit für nen Lesefehler während des Rebuild
> schon recht hoch.

Ich auch. Das heißt aber auch, dass ich so eine Platte nicht haben
möchte. Irgend was scheinst du da durcheinander gebracht zu haben
(oder blöd vom Hersteller ausgedrückt).

> Tja, was ich aber vor allem vermeiden will, ist Downtime. Wenn eine
> Platte kippt, dann will ich nicht sofort mit Vollgas ins
> Rechenzentrum düsen, sondern halt irgendwann, wenn es mir paßt. Und
> bis dahin soll die Maschine immer noch Redundanz haben.

Hohe Ansprüche für ein Datengrab ;-)

> Der Schaden ist viel größer. Habe ich eine Downtime wegen eines
> Plattenausfalles, dann muß ich a) sofort ins Rechenzentrum fahren
> und mir die Kiste holen. Dann neu aufsetzen = Image draufziehen
> o.ä. Und dann das Backup zurückspielen. 

Dein System läuft auf den gleichen Platten? *staun*

> Dauert bei 1 TB sagen wir
> 10 Stunden, wenn das Backup auf einer einzigen Platte liegt. Dann
> die Kiste wieder ins Rechenzentrum schaffen (inzwischen ist
> natürlich Freitag Nacht), und das alles, wenn es mir gerade
> überhaupt nicht in den Kram paßt. Und das bedeutet alles in allem:
> Downtime von mindestens einem Tag, einen Haufen Streß, und Ärger
> mit den Leuten, die auf dieser Maschine arbeiten wollten, die
> während der ganzen Aktion natürlich dauernd anrufen, wann es denn
> jetzt wieder geht.

Was du willst ist ein Hochverfügbarkeitssystem. Dann denke über
andere Hardware nach als über gespiegelte Platten.

> Nee, wenn ich das mit ein oder auch fünf zusätzlichen Platten
> vermeiden kann, dann vermeide ich das gerne.

Tu das, aber nicht mit RAID1(E) alleine. Dann eher mit RAID 15 oder
51. Das ist relativ einfach realisierbar, halbwegs performant und je
nach Implementierung können locker knapp die Hälfte der Platten
ausfallen, ohne das Datenverlust droht.

Das System selbst würde ich auf eine separate Platte packen, ggf.
eine Backup-Platte im Standby dazu, um im Falle eines Falles auch das
System schnell erneuern zu können.
 
> Weil Du übrigens noch auf die Datensicherung hingewiesen hast: Bei
> Strato ist doch vor einiger Zeit die gesamte Infrastruktur
> ausgefallen. Wenn ich recht erinnere, dann lag das daran, daß
> jemand die Synchronisation zweier Schränke angeschoben hat, aber
> leider in der falschen Richtung. Das hat den noch arbeitenden
> Schrank gefräst. Das anschließende Einspielen des Backups dauerte
> trotz muskulöser Hardware mehrere Tage. 

Ja, sicher dauert Backup einspielen eine Weile. Aber für ein
Datengrab halte ich das für vertretbar. Bei einem
Hochverfügbarkeitsanspruch sollte ein komplettes Backupsystem in
Bereitschaft stehen, wenn du dir Ausfallzeiten nicht leisten kannst. 

-- 
Maxx <linux@houdek.de>


Reply to: