Am 25.01.2009 um 19:20 schrieb Michelle Konzack: naja,.. ich meinte schon ein richtiges san... immerhin brauchst du ja
auch noch eine integrierte backup-lösung.. gerade wenn das auf so
viele verschiedene kisten verteilt ist.
Die Frage ist eigentlich, wie macht man backups von ein paar 100 millionen Messages? Ich habe schon probleme, wenn ich Durch mein mailarchiv (1999 bis heute) nur mal durchgucke... 123 Mailinglisten. (123ml x 12mon x 9y = über 13000 verzeichnisse) Jedes Verzeichnis 50-9000 messages Mein eigenes Maildir hat derzeit 8.769.965 messages seit 1995 gesammelt was gut 34 GByte sind... Hmmm, "Der Mensch ist ein Sammler..."
tja, das leben ist oft grausam.. ;) die frage wäre nur: ist backup überhaupt ein thema? weil wenn es ein offizieller auftraggeber ist, dann möchte der doch sicherlich nicht im falle von egal was mails verlieren, oder? ein SAN heißt ja nicht unbedingt, dass das an einem Standort sein
muss. Logisch gesehen würde ich an deiner stelle aber vermeiden
wollen, auch noch softwaremäßig rausfinden zu müssen, wo jetzt welche
Ehm, das weis doch eigentlich NSS (= ${HOME}) ;-)
hm... dann muss aber jeder user immer den richtigen server erwischen, oder wie macht man das dann? was ist, wenn mal ein imap-server down ist? sind dann auch die 4000 mailboxen zeitweise nicht zu erreichen? mailbox liegt, wenn ein user man nicht an seinem standort ist. sowas
kann man doch wunderbar das san machen lassen, in dem es benötigte
teile des FS aus der ferne dann lokal beiholt, wenn ein user sie
anfordert. da hat man dann ein kleines delay, aber alles kann man
nunmal nicht vermeiden. da mach ich mir eher sorgen um die
netzwerkbandbreite.
Das würde aber bedeuten, das ich die IMAP server plus SAN benötige, also die doppelte Anzahl der Rechner.
nunja.. ein SAN besteht ja nicht unbedingt aus "Rechnern". ich sehe ein san mehr als black-box.. dem sagst du halt, was du an daten haben willst, und dann kriegst du das. genau.. backup backup backup ;)
Ein GROSSES SAN würde ich nicht mehr backupen wollen... Wenn da ne miliarde messages drauf liegen...
naja,... bei nem san kannst du ja immerhin sowas wie snapshots nutzen.. das wäre ja schon mal immerhin ein backup-ding.. und wenn wirklich noch mehr bedarf besteht, dann hat das san ja auch genug eigenintelligenz, um selten benutzte daten usw. auf virtual-tapes oder sogar auf richtige tapes auszulagern. der managementvorteil ist dann wiederum klar.
mehrfach heißt dann genau wieviel?... ich mein..... z.b. 2GBit ist für
so ne applikation garnichts... da sollte man schon sowas wie 10Gbit+
an anbindungen haben
Eine STM-64 ist 10 GBit Fiberoptic und STM-16 ist 2,5 GBit.
nunja, das ist doch schon mal was. die stm-16 ist dann der zweite standort? da müssen hoffentlich nicht so viele user dran, oder?
HAM: knapp über 9 millionen pro Tag (~120 Mails pro user)
wenn ich das richtig sehe, dann produziert der mailstrom eine minimale
grundlast von ca. 600 mbit? kommt das hin?
Nunja, da ist mal ein CISCO verendet und dann ging das ganze über einen Westentashen CISCO mit 155 MBit OC-3... Da hatte vor zwei Jahren funktioniert. Das Problem ist nur, das die mails nicht konstannt reinkommen, sondern meistens vor Mittag dann raucht der Server 2 Stunden Die durchschitts Mail dürfte bei 100 kByte liegen... Outlook und WordMail (Ich hoffe Du weist was das ist)
wordmail sagt mir tatsächlich so auf anhieb nix ;) aber google sagt, es ist auch was aus outlook und word ;) auf jeden fall sagt mir das, dass der reine sinnvolle mailverkehr sowas um die 300mbit schluckt.. plus der spam.. und dann noch die user.... SPAM: derzeit so um die 23 millionen pro Tag
da sollte man halt massiv mit policyd was dran ändern... und alle
tricks ausnutzen, weil: spammer sind meistens nicht so schlau.
Also 70% kann ich bereist auf SMTP level stopen... aber diese Flut belastet auch dann noch den IN-Bound. wie gesagt: ich halte das nicht für sinnvoll, storage und
auslieferaufgaben auf einer maschine zusammenzufassen. das ist
preislich einfach nicht attraktiv.. und du hast ganz viele sachen, die
kaputt gehen können..
Fällt ein SAN aus, sind 20.000 Mitarbeite ohne Mail... Und so groß ist der Preisunterscheid zwischen einem Monster-SAN und vielen kleinen Mailservern nicht.
naja, EIN san sollte erstmal garnix machen.. man hat doch failover, hoffe ich? also zumindest sollte man das haben, wenn man vernünftig geplant hat ;) dann lieber alle kisten per FC an einem san teilhaben lassen. da kann
man die dann sogar effektiv clustern und zentral updaten usw.. ^^
alles sehr praktisch
Dann ist aber das SAN die schwachstelle. Wenn es ausfällt sind 90.000 Verwaltungsangestellte ohne Kommunikation. Bis jetzt habe ich kein SAN gesehen, das 99% uptime hatte. Nicht mal HP, Sun, IBM oder Compaq können das garantieren.
nunja, man muss natürlich SPOF vermeiden, aber: SAN und FC können redundant ausgelegt werden.. und ich denke, das sollten sie auch sein. die zusätzlichen kosten haben sich schon beim ersten hypotetischen ausfall (ohne redundanz) bezahlt gemacht, da die 80000 menschen weiterhin arbeiten können, und nicht warten müssen, bis alles wieder läuft. naja, so viele unterschiedliche mailstores? das ist doch total
unübersichtlich am ende.
Was ist unübersichtlich? Ich habe die Mailstores von Freenet, GMX und Microsoft gesehen die arbeiten alle mit einer unzahl von kleinen Servern.
Freenet hat mittlerweiel weit über 100 <mboxXX.freent.de> rechner welche die Mailboxen tragen und auf jedem Rechner sind 50.000 Mailaccounts.
die frage sollte sein: ist das der maßstab? oder sollte es nicht besser laufen, als ein x-beliebiger freemail-provider? naja, das problem sind eher die concurrent users... die erzeugen ja
auch ein vielfaches des traffic... ist ja schliesslich kein
mailverliess ;)
Dafür Torture ich meine PostgreSQL mit tsearch2 und Volltextsuchen. Bei einer Tabelle mit 1200 GByte (über Tablepartitioning) kannste dann echt meinen der Rechner fällt auseinander.
naja,.. ich weiß nicht genau, was du damit jetzt meinst. aber bei 80000 usern auf 30 servern... da ist schon ne menge I/O-load da... das wäre schon sinnvoll, das anders aufzuteilen, vorallem wenn alle tatsächlich IMAP benutzen. wahrscheinlich sind davon zu spitzenzeiten bis zu 60000 leute gleichzeitig online.
bye,
Michael.
|