[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: IMAP Proxy für 28 Courier-Server




Am 25.01.2009 um 19:20 schrieb Michelle Konzack:


naja,.. ich meinte schon ein richtiges san... immerhin brauchst du ja  
auch noch eine integrierte backup-lösung.. gerade wenn das auf so  
viele verschiedene kisten verteilt ist.

Die Frage ist eigentlich, wie macht man backups
von ein paar 100 millionen Messages?

Ich habe schon probleme, wenn ich Durch mein mailarchiv (1999 bis heute)
nur mal durchgucke...

123 Mailinglisten. (123ml x 12mon x 9y = über 13000 verzeichnisse)

Jedes Verzeichnis 50-9000 messages

Mein eigenes Maildir hat derzeit 8.769.965 messages seit 1995 gesammelt
was gut 34 GByte sind... Hmmm, "Der Mensch ist ein Sammler..."

tja, das leben ist oft grausam.. ;)
die frage wäre nur: ist backup überhaupt ein thema? weil wenn es ein offizieller auftraggeber ist, dann möchte der doch sicherlich nicht im falle von egal was mails verlieren, oder?



ein SAN heißt ja nicht unbedingt, dass das an einem Standort sein  
muss. Logisch gesehen würde ich an deiner stelle aber vermeiden  
wollen, auch noch softwaremäßig rausfinden zu müssen, wo jetzt welche  

Ehm, das weis doch eigentlich NSS (= ${HOME})  ;-)

hm... dann muss aber jeder user immer den richtigen server erwischen, oder wie macht man das dann?
was ist, wenn mal ein imap-server down ist? sind dann auch die 4000 mailboxen zeitweise nicht zu erreichen?


mailbox liegt, wenn ein user man nicht an seinem standort ist. sowas  
kann man doch wunderbar das san machen lassen, in dem es benötigte  
teile des FS aus der ferne dann lokal beiholt, wenn ein user sie  
anfordert. da hat man dann ein kleines delay, aber alles kann man  
nunmal nicht vermeiden. da mach ich mir eher sorgen um die  
netzwerkbandbreite.

Das würde aber bedeuten, das ich die IMAP server plus SAN benötige, also
die doppelte Anzahl der Rechner.

nunja.. ein SAN besteht ja nicht unbedingt aus "Rechnern". ich sehe ein san mehr als black-box..
dem sagst du halt, was du an daten haben willst, und dann kriegst du das.



genau.. backup backup backup ;)

Ein GROSSES SAN würde ich nicht mehr backupen wollen...
Wenn da ne miliarde messages drauf liegen...

naja,... bei nem san kannst du ja immerhin sowas wie snapshots nutzen.. das wäre ja schon mal immerhin ein backup-ding..
und wenn wirklich noch mehr bedarf besteht, dann hat das san ja auch genug eigenintelligenz, um selten benutzte daten usw. auf virtual-tapes oder sogar auf richtige tapes auszulagern.
der managementvorteil ist dann wiederum klar.



mehrfach heißt dann genau wieviel?... ich mein..... z.b. 2GBit ist für  
so ne applikation garnichts... da sollte man schon sowas wie 10Gbit+  
an anbindungen haben

Eine STM-64 ist 10 GBit Fiberoptic und STM-16 ist 2,5 GBit.

nunja, das ist doch schon mal was.
die stm-16 ist dann der zweite standort? da müssen hoffentlich nicht so viele user dran, oder?



HAM: knapp über 9 millionen pro Tag (~120 Mails pro user)

wenn ich das richtig sehe, dann produziert der mailstrom eine minimale  
grundlast von ca. 600 mbit? kommt das hin?

Nunja, da ist mal ein CISCO verendet und dann ging das ganze über  einen
Westentashen CISCO  mit  155 MBit  OC-3...  Da  hatte  vor  zwei  Jahren
funktioniert.  Das Problem  ist  nur,  das  die  mails  nicht  konstannt
reinkommen, sondern meistens vor Mittag dann raucht der Server 2 Stunden

Die durchschitts Mail dürfte bei 100 kByte liegen...
Outlook und WordMail (Ich hoffe Du weist was das ist)

wordmail sagt mir tatsächlich so auf anhieb nix ;) aber google sagt, es ist auch was aus outlook und word ;)
auf jeden fall sagt mir das, dass der reine sinnvolle mailverkehr sowas um die 300mbit schluckt.. plus der spam.. und dann noch die user....




SPAM: derzeit so um die 23 millionen pro Tag

da sollte man halt massiv mit policyd was dran ändern... und alle  
tricks ausnutzen, weil: spammer sind meistens nicht so schlau.

Also 70% kann ich bereist auf  SMTP  level  stopen...  aber  diese  Flut
belastet auch dann noch den IN-Bound.

wie gesagt: ich halte das nicht für sinnvoll, storage und  
auslieferaufgaben auf einer maschine zusammenzufassen. das ist  
preislich einfach nicht attraktiv.. und du hast ganz viele sachen, die  
kaputt gehen können..

Fällt ein SAN aus, sind 20.000 Mitarbeite ohne Mail...  Und so  groß ist
der  Preisunterscheid  zwischen  einem  Monster-SAN und  vielen  kleinen
Mailservern nicht.

naja, EIN san sollte erstmal garnix machen.. man hat doch failover, hoffe ich?
also zumindest sollte man das haben, wenn man vernünftig geplant hat ;)



dann lieber alle kisten per FC an einem san teilhaben lassen. da kann  
man die dann sogar effektiv clustern und zentral updaten usw.. ^^  
alles sehr praktisch

Dann ist aber das SAN die schwachstelle.  Wenn es ausfällt  sind  90.000
Verwaltungsangestellte ohne Kommunikation.

Bis jetzt habe ich kein SAN gesehen, das 99% uptime hatte.
Nicht mal HP, Sun, IBM oder Compaq können das garantieren.

nunja, man muss natürlich SPOF vermeiden, aber: SAN und FC können redundant ausgelegt werden.. und ich denke, das sollten sie auch sein.
die zusätzlichen kosten haben sich schon beim ersten hypotetischen ausfall (ohne redundanz) bezahlt gemacht, da die 80000 menschen weiterhin arbeiten können, und nicht warten müssen, bis alles wieder läuft.

naja, so viele unterschiedliche mailstores? das ist doch total  
unübersichtlich am ende.

Was ist unübersichtlich?

Ich habe die Mailstores von  Freenet,  GMX  und  Microsoft  gesehen  die
arbeiten alle mit einer unzahl von kleinen Servern.


Freenet hat mittlerweiel weit über 100 <mboxXX.freent.de> rechner welche
die Mailboxen tragen und auf jedem Rechner sind 50.000 Mailaccounts.

die frage sollte sein: ist das der maßstab? oder sollte es nicht besser laufen, als ein x-beliebiger freemail-provider?


naja, das problem sind eher die concurrent users... die erzeugen ja  
auch ein vielfaches des traffic...  ist ja schliesslich kein  
mailverliess ;)

Dafür Torture ich meine PostgreSQL mit tsearch2 und Volltextsuchen.  Bei
einer Tabelle mit 1200 GByte (über Tablepartitioning) kannste dann  echt
meinen der Rechner fällt auseinander.

naja,.. ich weiß nicht genau, was du damit jetzt meinst.
aber bei 80000 usern auf 30 servern... da ist schon ne menge I/O-load da... das wäre schon sinnvoll, das anders aufzuteilen, vorallem wenn alle tatsächlich IMAP benutzen.
wahrscheinlich sind davon zu spitzenzeiten bis zu 60000 leute gleichzeitig online.


bye,

Michael.



Attachment: PGP.sig
Description: Signierter Teil der Nachricht


Reply to: