[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: Spamassassin: immer noch autolearn ....



Am Sonntag, 22. Oktober 2006 21:20 schrieb Thomas Antepoth:
> On Sun, 22 Oct 2006, Dr. Clemens Hardewig wrote:
> > [,,, Bayes - Filter unter Spamassassin funktioniert nicht
> > mit "autolearn=failed" ...]
>
> Siehe auch: /usr/share/doc/spamassassin/Readme.Debian:
>
> == cut ==
> Configuring spamd
> -----------------
>
> If you intend to use Bayes sitewide, you will need to create a
> world-writable and world-readable directory. /var/spool/spamassassin
> is recommended as an FHS-compliant path. You will then need to add the
> following lines to /etc/spamassassin/local.cf:
>         bayes_path        /var/spool/spamassassin/bayes
>         bayes_file_mode   0666
>
> If you intend to run spamd as a non-root user, you will need to ensure
> the pidfile to which spamd writes its PID is writable by that
> user. The best way to do this is to create a directory
> /var/run/spamassassin with appropriate permissions which will hold
> this file.
> == cut ==
>
> HTH
>
>       t++

Sorry für lange Rü-Zeit, der Tip hat mich wesentlich weitergebracht, 
herzlichen Dank dafür ! Diese Vorgehensweise steht zwar im Widerspruch zum in 
der Alistair McDonald Spamassassin Bibel genannten Vorgehen, funzt aber  - 
wieder was gelernt ....

mithilfe diverser Rumspielerei und setzen eines definierten users beim starten 
von spamassassin (Debian-exim), wird der Filter aufgerufen und ausgeführt - 
soweit so gut.

Allerdings scheint in meiner exim/spamd/Cyrus Kombi nochwas falsch zu sein - 
viele Mails scheinen hier als Dubletten (?) zu laufen und spamd wird zweimal 
kontaktiert (interessanterweise einmal als user Debian-exim und einmal mit 
user nobody (obwohl ich spamd mit definiertem user Debian-exim starte) (hier 
Auszug aus dem syslog)

Oct 28 16:35:10 server spamd[24059]: connection from localhost.localdomain 
[127.0.0.1] at port 50792
Oct 28 16:35:10 server spamd[24059]: checking message 
<9dac637d0610280729y552d0edka2c53d5472d1cece@XXXX.com>
for nobody:102.
Oct 28 16:35:21 server spamd[24059]: clean message (-2.6/5.0) for nobody:102 
in 11.3 seconds, 3777 bytes.
Oct 28 16:35:21 server spamd[24059]: result: . -2 - BAYES_00 
scantime=11.3,size=3777,mid=<9dac637d0610280729y55
2d0edka2c53d5472d1cece@XXXXX.com>,bayes=0,autolearn=ham
Oct 28 16:35:21 server spamd[25214]: connection from localhost.localdomain 
[127.0.0.1] at port 50797
Oct 28 16:35:21 server spamd[25214]: processing message 
<9dac637d0610280729y552d0edka2c53d5472d1cece@XXXXXX
.com> for Debian-exim:102.
Oct 28 16:35:31 server spamd[25214]: clean message (-1.3/5.0) for 
Debian-exim:102 in 10.1 seconds, 3801 bytes.
Oct 28 16:35:31 server spamd[25214]: result: . -1 - AWL,BAYES_00 
scantime=10.1,size=3801,mid=<9dac637d061028072
9y552d0edka2c53d5472d1cece@XXXXXX.com>,bayes=0,autolearn=unavailable
Oct 28 16:35:31 server cyrus/master[26486]: about to 
exec /usr/lib/cyrus/bin/lmtpd
Oct 28 16:35:31 server cyrus/lmtpunix[26486]: executed
Oct 28 16:35:31 server cyrus/lmtpd[26486]: accepted connection
Oct 28 16:35:31 server cyrus/lmtpd[26486]: lmtp connection preauth'd as 
postman
Oct 28 16:35:31 server cyrus/lmtpd[26486]: duplicate_check: 
<9dac637d0610280729y552d0edka2c53d5472d1cece@XXXXXX
.com> user.XXXXXX.Studium 0
Oct 28 16:35:31 server cyrus/lmtpd[26486]: mystore: starting txn 2147503311
Oct 28 16:35:31 server cyrus/lmtpd[26486]: mystore: committing txn 2147503311
Oct 28 16:35:31 server cyrus/lmtpd[26486]: duplicate_mark: 
<9dac637d0610280729y552d0edka2c53d5472d1cece@XXXXXX
.com> user.XXXXXX.Studium 1162046131
Oct 28 16:35:31 server cyrus/lmtpd[26486]: mystore: starting txn 2147503312
Oct 28 16:35:31 server cyrus/lmtpd[26486]: mystore: committing txn 2147503312
Oct 28 16:35:31 server cyrus/lmtpd[26486]: duplicate_mark: 
<9dac637d0610280729y552d0edka2c53d5472d1cece@XXXXXXX
.com> .XXXXXX+.sieve.    1162046131

Mein Verständnis davon ist: Die Mail wird zweimal gescanned (von 
unterschiedlichen Instanzen von spamd, bei der ersten als ham autogelernt, 
die zweite stellt dann fest, dass die Mail schon gelernt wurde und sagt dann 
autolearn= failed (was gemäß Apache Seite auch korrekt ist, wenn die Mail 
schon in der db ist). Cyrus lmtpd markiert dann die Mail als ein Duplikat und 
zeigt den dann die Version mit Header mit autolearn=failed an (obwohl sie ja 
gelernt wurde), die andere wird verworfen ...

<und eh jetzt wieder einer über mich herfällt: nein ich sage nicht ES IST SO, 
ich sage MEIN VERSTÄNDNIS ...>

Ich habe jetzt meine exim4.conf gecheckt, dort scheint die router section und 
transport section aber korrekt zu sein ????!? 
Wer ruft denn den ERSTEN  spamd mit user nobody auf (obwohl spamd mit -u 
gestartet wird) ?

Wäre toll, wenn jemand ein paar Tips hat, wie man das Thema angehen könnte

Besten Dank im Voraus

BR Clemens



Reply to: