Am 2009-01-25 14:46:28, schrieb Michael Mohn: > nunja, das skaliert ja zumindest ;) > macht die datenbank noch anderes, als die user zu authentifizieren? Nein, trägt nur die Tabellen für NSS und PAM. Die Datenbank hat nur ein paar MByte. > naja,.. ich meinte schon ein richtiges san... immerhin brauchst du ja > auch noch eine integrierte backup-lösung.. gerade wenn das auf so > viele verschiedene kisten verteilt ist. Die Frage ist eigentlich, wie macht man backups von ein paar 100 millionen Messages? Ich habe schon probleme, wenn ich Durch mein mailarchiv (1999 bis heute) nur mal durchgucke... 123 Mailinglisten. (123ml x 12mon x 9y = über 13000 verzeichnisse) Jedes Verzeichnis 50-9000 messages Mein eigenes Maildir hat derzeit 8.769.965 messages seit 1995 gesammelt was gut 34 GByte sind... Hmmm, "Der Mensch ist ein Sammler..." > ein SAN heißt ja nicht unbedingt, dass das an einem Standort sein > muss. Logisch gesehen würde ich an deiner stelle aber vermeiden > wollen, auch noch softwaremäßig rausfinden zu müssen, wo jetzt welche Ehm, das weis doch eigentlich NSS (= ${HOME}) ;-) > mailbox liegt, wenn ein user man nicht an seinem standort ist. sowas > kann man doch wunderbar das san machen lassen, in dem es benötigte > teile des FS aus der ferne dann lokal beiholt, wenn ein user sie > anfordert. da hat man dann ein kleines delay, aber alles kann man > nunmal nicht vermeiden. da mach ich mir eher sorgen um die > netzwerkbandbreite. Das würde aber bedeuten, das ich die IMAP server plus SAN benötige, also die doppelte Anzahl der Rechner. > genau.. backup backup backup ;) Ein GROSSES SAN würde ich nicht mehr backupen wollen... Wenn da ne miliarde messages drauf liegen... Anm: Ich bin gerade dabei, die Wikipedia runterzuladen... Und wenn ich da so die Logs sehe, wie lahmarschig das ist... <http://download.wikimedia.org/jawiki/20090124/> > mehrfach heißt dann genau wieviel?... ich mein..... z.b. 2GBit ist für > so ne applikation garnichts... da sollte man schon sowas wie 10Gbit+ > an anbindungen haben Eine STM-64 ist 10 GBit Fiberoptic und STM-16 ist 2,5 GBit. > >HAM: knapp über 9 millionen pro Tag (~120 Mails pro user) > > wenn ich das richtig sehe, dann produziert der mailstrom eine minimale > grundlast von ca. 600 mbit? kommt das hin? Nunja, da ist mal ein CISCO verendet und dann ging das ganze über einen Westentashen CISCO mit 155 MBit OC-3... Da hatte vor zwei Jahren funktioniert. Das Problem ist nur, das die mails nicht konstannt reinkommen, sondern meistens vor Mittag dann raucht der Server 2 Stunden Die durchschitts Mail dürfte bei 100 kByte liegen... Outlook und WordMail (Ich hoffe Du weist was das ist) > >SPAM: derzeit so um die 23 millionen pro Tag > > da sollte man halt massiv mit policyd was dran ändern... und alle > tricks ausnutzen, weil: spammer sind meistens nicht so schlau. Also 70% kann ich bereist auf SMTP level stopen... aber diese Flut belastet auch dann noch den IN-Bound. > wie gesagt: ich halte das nicht für sinnvoll, storage und > auslieferaufgaben auf einer maschine zusammenzufassen. das ist > preislich einfach nicht attraktiv.. und du hast ganz viele sachen, die > kaputt gehen können.. Fällt ein SAN aus, sind 20.000 Mitarbeite ohne Mail... Und so groß ist der Preisunterscheid zwischen einem Monster-SAN und vielen kleinen Mailservern nicht. > dann lieber alle kisten per FC an einem san teilhaben lassen. da kann > man die dann sogar effektiv clustern und zentral updaten usw.. ^^ > alles sehr praktisch Dann ist aber das SAN die schwachstelle. Wenn es ausfällt sind 90.000 Verwaltungsangestellte ohne Kommunikation. Bis jetzt habe ich kein SAN gesehen, das 99% uptime hatte. Nicht mal HP, Sun, IBM oder Compaq können das garantieren. > naja, so viele unterschiedliche mailstores? das ist doch total > unübersichtlich am ende. Was ist unübersichtlich? Ich habe die Mailstores von Freenet, GMX und Microsoft gesehen die arbeiten alle mit einer unzahl von kleinen Servern. Freenet hat mittlerweiel weit über 100 <mboxXX.freent.de> rechner welche die Mailboxen tragen und auf jedem Rechner sind 50.000 Mailaccounts. > naja, das problem sind eher die concurrent users... die erzeugen ja > auch ein vielfaches des traffic... ist ja schliesslich kein > mailverliess ;) Dafür Torture ich meine PostgreSQL mit tsearch2 und Volltextsuchen. Bei einer Tabelle mit 1200 GByte (über Tablepartitioning) kannste dann echt meinen der Rechner fällt auseinander. Thanks, Greetings and nice Day/Evening Michelle Konzack Systemadministrator 24V Electronic Engineer Tamay Dogan Network Debian GNU/Linux Consultant -- Linux-User #280138 with the Linux Counter, http://counter.li.org/ ##################### Debian GNU/Linux Consultant ##################### <http://www.tamay-dogan.net/> <http://www.can4linux.org/> Michelle Konzack Apt. 917 ICQ #328449886 +49/177/9351947 50, rue de Soultz MSN LinuxMichi +33/6/61925193 67100 Strasbourg/France IRC #Debian (irc.icq.com)
Attachment:
signature.pgp
Description: Digital signature