Regeln von Spamassassin: Unterschied zwischen den Versionen

Aus
(Die Seite wurde neu angelegt: == About == Spamassassin besitzt ein sehr umfangreiches Regelwerk zur Spambekämpfung. Wenn Spamassassin (sa) neuinstalliert wurde, ist dessen Datenbank noch leer und d...)
 
Zeile 1: Zeile 1:
== About ==
== About ==
Spamassassin besitzt ein sehr umfangreiches Regelwerk zur Spambekämpfung. Wenn Spamassassin (sa) neuinstalliert wurde, ist dessen Datenbank noch leer und damit ist die Trefferquote ziemlich gering. Zwar lassen sich die Regeln manuell hinzufügen oder vordefinierte Regelsätze aus dem Internet herunterladen und als Files einfügen, aber eine der Stärken von sa ist es, dass er sich die Regeln selbstständig (sa-update) laden kann.
Spamassassin besitzt ein sehr umfangreiches Regelwerk zur Spambekämpfung. Wenn Spamassassin (sa) neuinstalliert wurde, ist dessen Datenbank noch leer und damit ist die Trefferquote ziemlich gering. Zwar lassen sich die Regeln manuell hinzufügen oder vordefinierte Regelsätze aus dem Internet herunterladen und als Files einfügen, aber eine der Stärken von sa ist es, dass er sich die Regeln selbstständig (sa-update) laden kann.
== Voraussetzungen ==
== automatisches Update ==
# perl installiert (via ipkg)<br />könnte auch mit dem Default Perl gehen (nicht getestet)
# perl installiert (via ipkg)<br />könnte auch mit dem Default Perl gehen (nicht getestet)
# spamassassin installiert (via ipkg) und konfiguriert<br />Wie man spamassassin einrichtet steht im [http://www.synology-forum.de Forum] (Stichworte: purzel und dovecot)
# spamassassin installiert (via ipkg) und konfiguriert<br />Wie man spamassassin einrichtet steht im [http://www.synology-forum.de Forum] (Stichworte: purzel und dovecot)
# sa-update auf der Konsole ausgeführt und alle fehlenden Perl Module via ipkg nachinstalliert<br />Beim ersten Aufruf von sa-update wird eine Ellenlange Fehlermeldung bezüglich fehlender Perl Module ausgespuckt. Diese sollten sich via ipkg installieren lassen. In der Fehlermeldung stehen die Module als Perl::MODULE in ipkg ist die Benamsung leider etwas anders. Aber mittels eines  
# sa-update auf der Konsole z.B. <span style="font-family:monospace;color:blue;">$ sa-update --nogpg --channel saupdates.openprotect.com</span> ausgeführt<br />Beim ersten Aufruf von sa-update wird eine Ellenlange Fehlermeldung bezüglich fehlender Perl Module ausgespuckt. Diese sollten sich via ipkg installieren lassen. In der Fehlermeldung stehen die Module als Perl::MODULE in ipkg ist die Benamsung leider etwas anders. Aber mittels eines <span style="font-family:monospace;color:blue;">$ ipkg list | grep perl | grep MODULE</span>&nbsp;lassen sich die ipkg Namen schnell ermitteln.<br/>Am Ende werden es ein zwei Module sein die fehlen, aber sa-update sollte jetzt bis zur Namensauflösung für die Update Server kommen<br />Wenn diese erfolglos verläuft dann schaut den nächsten Punkt an (4). Wenn der Name aufgelöst werden konnte seid ihr durch und die Regeln sollte automatisch heruntergeladen und in sa integriert werden. Der sa-update Aufruf lässt sich auch in crontab eintragen <br />z.B. <span style="font-family:monospace;color:blue;">sa-update --nogpg --channel saupdates.openprotect.com --channel updates.spamassassin.org>>/dev/null</span>
<span style="font-family:monospace;">
# dns Server im LAN (z.B. dnsmasq via ipkg)<br />Wie ich im Intenet gelesen habe ist es so, dass die meisten Router (via DNS Forwarding, den Namen nicht auflösen können). Bei mir war es auch so und drum installierte ich noch dnsmasq auf einer 2. Diskstation.
$ ipkg list | grep perl | grep MODULE
== manuelles Training ==
</span> lassen sich die ipkg Namen schnell ermitteln
sa hat auch sehr mächtige statistische Wortfilter, nur müssen diese trainiert werden um effektiv zu sein. Ich habe schon von bis zu 5000 Spam und Ham Meldungen gelesen, die nötig sein sollen, um die statistischen Filter auszureizen. Man kann dabei mittels<br /><span style="font-family:monospace;color:blue;">sa-learn --spam|ham [--progress] /path/to/spam|ham</span><br /> das Training auf Verzeichnisse mit Ham und solche mit Spam Meldungen loslassen. Das Format der Email-Dateien sollte .eml sein (in Thunderbird gibt es eine Erweiterung '''SmartSave''', die Emails aus ganzen Verzeichnisstrukturen in .eml exportieren kann) und das spam resp ham Verzeichnis darf keine Unterverzeichnisse haben. Dazu gibt es zwei Optionen in '''SmartSave''' Include subfolders und Preserve subfolder structure. Erstere sollte aktiviert sein und Letztere nicht.
# dns Server im LAN (z.B. dnsmasq via ipkg)

Version vom 20. März 2009, 00:08 Uhr

About

Spamassassin besitzt ein sehr umfangreiches Regelwerk zur Spambekämpfung. Wenn Spamassassin (sa) neuinstalliert wurde, ist dessen Datenbank noch leer und damit ist die Trefferquote ziemlich gering. Zwar lassen sich die Regeln manuell hinzufügen oder vordefinierte Regelsätze aus dem Internet herunterladen und als Files einfügen, aber eine der Stärken von sa ist es, dass er sich die Regeln selbstständig (sa-update) laden kann.

automatisches Update

  1. perl installiert (via ipkg)
    könnte auch mit dem Default Perl gehen (nicht getestet)
  2. spamassassin installiert (via ipkg) und konfiguriert
    Wie man spamassassin einrichtet steht im Forum (Stichworte: purzel und dovecot)
  3. sa-update auf der Konsole z.B. $ sa-update --nogpg --channel saupdates.openprotect.com ausgeführt
    Beim ersten Aufruf von sa-update wird eine Ellenlange Fehlermeldung bezüglich fehlender Perl Module ausgespuckt. Diese sollten sich via ipkg installieren lassen. In der Fehlermeldung stehen die Module als Perl::MODULE in ipkg ist die Benamsung leider etwas anders. Aber mittels eines $ ipkg list | grep perl | grep MODULE lassen sich die ipkg Namen schnell ermitteln.
    Am Ende werden es ein zwei Module sein die fehlen, aber sa-update sollte jetzt bis zur Namensauflösung für die Update Server kommen
    Wenn diese erfolglos verläuft dann schaut den nächsten Punkt an (4). Wenn der Name aufgelöst werden konnte seid ihr durch und die Regeln sollte automatisch heruntergeladen und in sa integriert werden. Der sa-update Aufruf lässt sich auch in crontab eintragen
    z.B. sa-update --nogpg --channel saupdates.openprotect.com --channel updates.spamassassin.org>>/dev/null
  4. dns Server im LAN (z.B. dnsmasq via ipkg)
    Wie ich im Intenet gelesen habe ist es so, dass die meisten Router (via DNS Forwarding, den Namen nicht auflösen können). Bei mir war es auch so und drum installierte ich noch dnsmasq auf einer 2. Diskstation.

manuelles Training

sa hat auch sehr mächtige statistische Wortfilter, nur müssen diese trainiert werden um effektiv zu sein. Ich habe schon von bis zu 5000 Spam und Ham Meldungen gelesen, die nötig sein sollen, um die statistischen Filter auszureizen. Man kann dabei mittels
sa-learn --spam|ham [--progress] /path/to/spam|ham
das Training auf Verzeichnisse mit Ham und solche mit Spam Meldungen loslassen. Das Format der Email-Dateien sollte .eml sein (in Thunderbird gibt es eine Erweiterung SmartSave, die Emails aus ganzen Verzeichnisstrukturen in .eml exportieren kann) und das spam resp ham Verzeichnis darf keine Unterverzeichnisse haben. Dazu gibt es zwei Optionen in SmartSave Include subfolders und Preserve subfolder structure. Erstere sollte aktiviert sein und Letztere nicht.