[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: Webserver-Cluster / NFS Stale file handle



Michael Schwartzkopff schrieb:
Am Dienstag, 16. März 2010 16:36:31 schrieb Helmuth Gronewold:

Drei Webnodes erhalten ihre Daten via NFS (/var/www und /var/lib/php5)
[...]
Da zwei Server vorhanden sind, die diese Aufgabe erledigen können, kann
ich im Fehlerfall schnell umschalten.

Manuell ???
Ja. Das klingt zwar seltsam, aber mein Anspruch ist:
- Ich möchte einfach erweitern können (Node dazustellen)
- Ich möchte im Fehlerfall schneller wieder online sein (Kann ich so schneller als wenn ich alles auf einem Server hätte den ich dann ersetzen müsste)

Echtes HA wäre nett gewesen, aber mir reicht es, wenn ich manuell umschalten kann. Ich werde mir aber ganz sicher noch ein kleines Skript schreiben, welches die einzelnen Schritte durchgeht, damit ich nur noch dieses anstoßen muss.

[...] NFS Server sehr schnell umschalten auf ein anderes System.
Wahrscheinlich kann man da auch etwas mit heartbeat bauen, damit habe
ich aber noch gar keine Erfahrung (für Tipps / Links dazu wäre ich sehr
dankbar :).

pacemaker / corosync ist das tool der Wahl. Es soll da bei O'Reilly ein ganz gutes Buch geben ;-)

Vielen Dank, ich schau mir die mal an.

Umgestellt auf NFS habe ich erst vor zwei Wochen, daher bin ich damit
noch ein bisschen unsicher unterwegs. Ich setze zwar NFS schon sehr
lange ein, aber immer nur in sehr kleinen Umgebungen wo entweder kein
konkurrierender Schreibzugriff anfällt oder nur wenig Daten übertragen
werden.

Warum NFS. Können die Serverknoten kein iSCSI direkt importieren? NFS macht die Sache nur langsamer.

OHA! Ich glaube, ich habe mich da falsch ausgedrückt, entschuldigung! Ich habe OCFS2 komplett verworfen und das iSCSI-Target enthält ein ext3.

OCFS2 hatte ich, wie schon gesagt, im Einsatz. Auf drei Nodes war es aktiv. Leider war gerade das Locking sehr instabil. Ich musste zwingend einen selbstgebauten, aktuellen Kernel verwenden, damit das ganze System einigermaßen stabil war. Als dann noch massive Performanceprobleme aufkamen, habe ich die Notbremse gezogen.

Vor der Umstellung habe ich mich natürlich schlau gemacht, welche Fehler
häufig auftreten können und dabei ist mir vor allem "Stale NFS file
handle" / "Stale NFS file system" aufgefallen.

Ja. Jemand muss dem Knoten schon sagen, dass das NFS nicht mehr existiert und er es unmounten soll. Wie gesagt, manuell oder über einen Cluster Resource Manager (pacemaker).

Da verstehe ich jetzt den Zusammenhang nicht. Wenn der NFS-Server abraucht, dann gilt das ja. Aber "Stale NFS file handle" kommt, so wie ich das verstanden habe, von einem Filehandle, welches noch offen ist, wo aber die Datei dahinter nicht mehr existiert. Also wenn ich zum Beispiel eine Datei auf Node A öffne und diese auf Node B lösche?



Gibt es da Best Practices wie man mit "Stale file handle" bzw. "Stale
file system" umgeht?

Ja: Einen richtegen Cluster bauen, so dass diese Fehler erst gar nicht auftreten.

Ich finde, dass der Begriff "Cluster" an dieser Stelle Definitionssache ist. Für mich sind das n>1 Rechner, die zusammen eine Aufgabe erledigen. In diesem Fall ist die Aufgabe die Interpretation von PHP-Skripten und Auslieferung von Ergebnissen dieser und einiger statischer Dateien. Ob der Cluster nun zu mehr Leistung, höherer Verfügbarkeit oder beidem führen soll ist dabei noch nicht gesagt. Für mich ist das also jetzt schon ein "richtiger Cluster", dem noch ein Automatismus fehlt, der die Datenquelle bei einem Ausfall wechselt.


Ich habe ein Skript gefunden, welches via mount(8), timeout(1), ls(1)
und ein bisschen Shell-Magie nach sieht, ob das gesamte Dateisystem noch
in Ordnung ist oder nicht. Leider kann ich die Quelle gerade nicht
finden. Ich habe das aber auf meinem PC zuhause und kann das evtl.
nachreichen.

Das ist keine Lösung, sondern Stückwerk.

Naja, es sagt mir aber sehr zuverlässig ob eines meiner NFS-Dateisysteme "stale" ist. Bei file handles bringt das nur leider nichts.

Mir fallen sicher noch ein Dutzend weitere Fragen ein, die die größe
dieses Posts wohl zu hoch treiben würden. Daher einfach noch die bitte
um Tipps und Tricks zu dem ganzen Thema Webserver-Cluster. Ich bin gerne
bereit da Erfahrungen auszutauschen.

Bei weiteren Fragen gerne direkte Mail.

Darauf komme ich mit Sicherheit noch zurück. Danke! :)


Reply to: