Menu Content/Inhalt
Home arrow Tipps und Tricks arrow Programme arrow Mini-HOWTO für bogofilter mit KMail

Login






Passwort vergessen?
Noch kein Benutzerkonto?
Registrieren
Mini-HOWTO für bogofilter mit KMail PDF Drucken E-Mail

Von Diese E-Mail-Adresse ist gegen Spam-Bots geschützt, du musst Javascript aktivieren, damit du sie sehen kannst

Inhalt
    1.
Vorwort
    2. Vorbereitung
    3. Filterregeln
        3.1. bogofilter_ist_spam
        3.2. bogofilter
        3.3. bogoheader

1. Vorwort

Bogofilter ist ein Bayes-Filter, er errechnet also die Wahrscheinlichkeit, daß eine Mail Spam enthält oder nicht. Mehr soll zu dem Thema hier nicht gesagt werden. Dazu gibt es in der c't 17/2003 einen sehr guten Artikel. Die Anleitung soll konkret zeigen, wie man bogofilter mit KMail benutzt. Ich benutze KMail mit einem POP3-Zugang. IMAP habe ich nicht getestet, soll aber auch gehen.

2. Vorbereitung

Zuerst werden in KMail zwei neue Verzeichnisse im Maildir-Format angelegt. Sie werden benötigt, um bogofilter zu trainieren, welche Mails Spam oder nicht Spam sind.

Benenne diese Verzeichnisse nonspam und spam.

Sortiere anschließend so viel typische Spammails und "gute Mails" wie möglich in diese Verzeichnisse. Je typischer diese Mails jeweils sind, desto besser wird später die Spamerkennungsrate sein.

3. Filterregeln

Nun müssen in KMail nur noch ein paar Filterregeln erstellt werden, damit KMail jede ankommende Mail zuerst durch den bogofilter laufen lässt.

Die Filterregeln in KMail werden grundsätzlich von oben nach unten abgearbeitet. Filterregeln für Mailinglisten o.ä. müssen also möglicherweise über den Regeln für bogofilter stehen.

Die Regeln sollten so aussehen:

3.1. bogofilter_ist_spam

Im Menü für »Einstellungen/Filter einrichten.../neu/umbenennen...«: bogofilter_ist_spam

Filterbedingungen: »Trifft auf alle Folgenden zu«: "X-Bogosity" enthält "Yes"

Filteraktion:


verschieben in Ordner: spam
markieren als: ungelesen

Weitere Einstellungen:


Eingehende Nachrichten:         aktiviert
Versendete Nachrichten:         egal
zur manuellen Filterung:        aktiviert
Bearbeitung hier Abbrechen:     aktiviert

3.2. bogofilter

»neu/umbenennen...«: bogofilter

Filterbedingungen: »Trifft auf alle Folgenden zu«: "Feld im Vorspann" passt auf regulären Ausdruck ".*"

Filteraktion: »durch Programm leiten«: bogofilter -epv

Weitere Einstellungen:


Eingehende Nachrichten:       aktiviert
Versendete Nachrichten:       egal
zur manuellen Filterung:      aktiviert
Bearbeitung hier Abbrechen:   NICHT! aktiviert

3.3. bogoheader

»neu/umbenennen...«: bogoheader

Filterbedingungen: »Trifft auf alle Folgenden zu«: "Feld im Vorspann" passt auf regulären Ausdruck ".*"

Filteraktion:


Vorspann entfernen: X-Bogosity
Vorspann entfernen: X-Attachments

Weitere Einstellungen:


Eingehende Nachrichten:       aktiviert
Versendete Nachrichten:       egal
zur manuellen Filterung:      aktiviert
Bearbeitung hier Abbrechen:   NICHT! aktiviert

Die Regeln sollten anschließend in folgender Reihenfolge in der Liste stehen:

  • bogoheader
  • bogofilter
  • bogofilter_ist_spam

Nun muss nur noch die Datenbank von bogofilter mit den Beispielmails und den Spammails trainiert werden. Dies geschieht mit folgender Eingabe.


rm ~/.bogofilter/*.db
find ~/Mail/spam -type f | bogofilter -vvv -s -b
find ~/Mail/nonspam -type f | bogofilter -vvv -n -b

Die Erstellung der Datenbank kann sehr lange dauern! Auf einem 2 GHz-Rechner mit 10000 Mails dauert es etwa eine Stunde. Dies sollte man also gelegentlich mit einem Cronjob erledigen.

Ist dies erledigt, werden alle ankommenden Mails zuerst mit bogofilter geprüft und in den Header der Mail eine kleine Statistik geschrieben, wie bogofilter die Mail einschätzt. Spammails werden dann in den "spam"-Ordner verschoben und als ungelesen markiert. Nach meiner Erfahrung hat bogofilter dabei schon bei eher wenigen Trainingsmails (240 gute, 60 Spam) eine erstaunlich gute Trefferquote.

 
< Zurück   Weiter >

Scroll-news

Mailingliste:
http://mlists.in-berlin.de/mailman/listinfo/lieo-mlists.in-berlin.de 

 

Das Forum ist online gegangen

 


Who's Online

Aktuell 8 Gäste online

Google AdSense