Am 25.01.2009 um 04:21 schrieb Michelle Konzack:
Hallo Michael,
Am 2009-01-25 01:09:13, schrieb Michael Mohn:
Am 25.01.2009 um 00:46 schrieb Michelle Konzack:
was ich mich frage: wieso nicht die ganze sache mehr kanalisieren?
also z.b.:
4 oder 5 mail-in-server über dns-loadbalancing.. mit spamfilter
jeweils und userkontrolle über ldap oder was auch immer...
Gut, das sowieso... User-Kontrolle/Authentifizierung ist vollständig
PAM nach wie vor mit PostgreSQL.
nunja, das skaliert ja zumindest ;)
macht die datenbank noch anderes, als die user zu authentifizieren?
dahinter dann ein ganzes cluster (vielleicht so 100 stk. ) von
einfachen 1 HE servern mit imap und einem proxy/loadbalancer/
userverteiler und dazu dann ein schnittiges SAN für die Mailboxen..
offensichtlich wirst du ja dann bald ca. 220 TB datenspeicher
benötigen... (mindestens)
Genau, vor allem diese gewaltigen Speicherkapazitäten... Aber bei bei
der Anzahl der Mail kannste ein einzelnes SAN vergessen. Bereits
getestet und Sun Microsystems hat uns bereits davon abgeraten besonderst
weil es sich um einen Regierungskunden handelt.
naja,.. ich meinte schon ein richtiges san... immerhin brauchst du ja auch noch eine integrierte backup-lösung.. gerade wenn das auf so viele verschiedene kisten verteilt ist.
Das System muß so gut wie 99.99% ausfallsicher sein, weshalb wir die
"Mailboxen" auf die einzelnen Standorte in Frankreich verteilen...
ein SAN heißt ja nicht unbedingt, dass das an einem Standort sein muss. Logisch gesehen würde ich an deiner stelle aber vermeiden wollen, auch noch softwaremäßig rausfinden zu müssen, wo jetzt welche mailbox liegt, wenn ein user man nicht an seinem standort ist. sowas kann man doch wunderbar das san machen lassen, in dem es benötigte teile des FS aus der ferne dann lokal beiholt, wenn ein user sie anfordert. da hat man dann ein kleines delay, aber alles kann man nunmal nicht vermeiden. da mach ich mir eher sorgen um die netzwerkbandbreite.
Somit ist das Ding nahezu vollständig sicher gegen Naturkatastrophen.
genau.. backup backup backup ;)
Die einzelnen haben mehrfache GBit/STM-16/64 Anbindungen sprich selbst
wenn Mitarbeiter den Standort wechseln, die Leistung der Backbones
reicht weit aus.
mehrfach heißt dann genau wieviel?... ich mein..... z.b. 2GBit ist für so ne applikation garnichts... da sollte man schon sowas wie 10Gbit+ an anbindungen haben
was meinst du dazu?
ist jetzt nur ein schuss ins blaue, aber ich würde das so aufsetzen.
auf jeden fall wäre es interessant, genaueres zum mailaufkommen zu
wissen.. also.. wieviel spam/ham anzahl.. speichergröße..
HAM:
knapp über 9 millionen pro Tag (~120 Mails pro user)
wenn ich das richtig sehe, dann produziert der mailstrom eine minimale grundlast von ca. 600 mbit? kommt das hin?
SPAM: derzeit so um die 23 millionen pro Tag
da sollte man halt massiv mit policyd was dran ändern... und alle tricks ausnutzen, weil: spammer sind meistens nicht so schlau.
Speichergröße soll 2,5 Gbyte pro User resetviert sei, die auch tatsäch-
lich zur verfügung stehen... Also keine Auge-Mal-Pi Mischkalkulation.
Sprich, der von mir vorgeschlagene SAS Server würde 16 mal 1 TByte in
zwei Raid-6 haben = 2 x 8 Platten = 2 x 5 Platten (5 TByte) pro Raid-5
nutzbar.
5 TByte / 2,5 TByte/user = 2000 User * 2 = 4000 User/Server
wie gesagt: ich halte das nicht für sinnvoll, storage und auslieferaufgaben auf einer maschine zusammenzufassen. das ist preislich einfach nicht attraktiv.. und du hast ganz viele sachen, die kaputt gehen können..
dann lieber alle kisten per FC an einem san teilhaben lassen. da kann man die dann sogar effektiv clustern und zentral updaten usw.. ^^ alles sehr praktisch
netzwerktraffic und bandbreite... eventuell kann man auch mit policyd-
weight schon viel last vom spamassassin nehmen z.b.
Wenn ich mit 4000 User/Server rechne, dann sind das so um die 50.000
Mails pro Tag (zur Zeit) was durchschnittlich 1,5 Sekunden/Mail bedeutet
naja, so viele unterschiedliche mailstores? das ist doch total unübersichtlich am ende.
Ich habe pro Tag ein persönliches Mailaufkommen von 2900 Messages und
das macht meine Eierlegende Wollmilchsau zu Hause nebenbei.
naja, das problem sind eher die concurrent users... die erzeugen ja auch ein vielfaches des traffic... ist ja schliesslich kein mailverliess ;)
Michael.