Spamassassin hat etwas als Spam markiert, das kein Spam ist. Wie kann ich das mitteilen?

Question 1

Es gibt sowohl spezifische als auch allgemeine Ratschläge, die in diesem Fall hilfreich sein können.

Spezifisch

Das zugrunde liegende Problem besteht darin, dass Garuda Airlines, Gott segne sie, Bestätigungs-E-Mails verschickt, die viele der Kennzeichen von Spam aufweisen. Die Betreffzeile ist SEHR SCHRECKLICH, sie versenden nur HTML-E-Mails, die ziemlich viele Bilder und sehr wenig Text enthalten, der Envelope-Sender ( [email protected]) ist ganz klar ein maschinell erstellter Nonce, und der E-Mail-Anbieter für ihr (ausgelagertes) Bestätigungssystem (amadeus.com) hat einen nutzlosen SPF-Eintrag (trotzalle unsere gegenteiligen Ratschläge, manche Leute glauben fälschlicherweise, dass ein Datensatz wertvoll ist, der auflistetmancheihrer Sendesysteme und -enden ~all).

Gegen die meisten dieser Dinge können Sie nicht viel tun. Wenn Sie sicher sein möchten, dass diese Nachrichten ankommen, geben Sie in Ihrem E-Mail-Posteingang eine Zeile ein, ~/.spamassassin/user_prefsdie besagt, whitelist_from *@amadeus.comdass diese Nachrichten an Sie weitergeleitet werden. Darüber hinauszugehen und die Gewichtung der ausgelösten Regeln zu manipulieren, ist wahrscheinlich keine gute Idee. Der SpamAssassin (SA)-Regelsatz wird erstellt, indem eine große Menge Spam gefiltert und herausgefunden wird, welche Merkmale auf den Großteil davon zutreffen. Wenn Sie diese Regeln deaktivieren, werden Sie in Ihrem Posteingang wahrscheinlich viel mehr als nur Garuda-Bestätigungs-E-Mails sehen.

Allgemein

Genau mit solchen Situationen kommt die Bayesian Engine gut zurecht. Sie ist so konzipiert, dass sie E-Mails herausfiltert, die die anderen Regeln nicht auslösen, aber Dinge enthalten, die Sie nicht lesen möchten, und hilft gleichzeitig dabei, E-Mails durchzufiltern, die diese Regeln auslösen, aber Dinge enthalten, die SieTunmöchte lesen.

Soweit ich mich erinnere, tut die Engine nichts, wenn Sie sie nicht trainieren. Am einfachsten trainieren Sie sie, indem Sie zwei Ordner pflegen, die beispielsweise spamund heißen ham. In spamlegen Sie Kopien von E-Mails ab, die es in Ihren Posteingang geschafft haben, die Sie aber nicht haben wollten; in hamlegen Sie Kopien von E-Mails ab, die SA missachtet haben, die Sie aber haben wollten, wie beispielsweise diese Bestätigungs-E-Mail.

Dann haben Sie jede Nacht (oder so) einen Cron-Job, der sagt

sa-learn --spam --mbox mail/spam
sa-learn --ham  --mbox mail/ham

Ändern Sie die Pfade entsprechend. Mit der Zeit lernt die Engine dadurch, was Sie gerne lesen und was nicht. Da ein hoher Bayesian-Score den SA-Score einer E-Mail um +4,0 Punkte erhöhen kann, während ein niedriger 1,9 Punkte abziehen kann, kann eine gut trainierte Engine SA wirklich dabei helfen, zu unterscheiden, wasDuwill lesen, wasDunicht - aberman muss sich anstrengen, es zu lehren.

Answer

Es gibt sowohl spezifische als auch allgemeine Ratschläge, die in diesem Fall hilfreich sein können.

Spezifisch

Das zugrunde liegende Problem besteht darin, dass Garuda Airlines, Gott segne sie, Bestätigungs-E-Mails verschickt, die viele der Kennzeichen von Spam aufweisen. Die Betreffzeile ist SEHR SCHRECKLICH, sie versenden nur HTML-E-Mails, die ziemlich viele Bilder und sehr wenig Text enthalten, der Envelope-Sender ( [email protected]) ist ganz klar ein maschinell erstellter Nonce, und der E-Mail-Anbieter für ihr (ausgelagertes) Bestätigungssystem (amadeus.com) hat einen nutzlosen SPF-Eintrag (trotzalle unsere gegenteiligen Ratschläge, manche Leute glauben fälschlicherweise, dass ein Datensatz wertvoll ist, der auflistetmancheihrer Sendesysteme und -enden ~all).

Gegen die meisten dieser Dinge können Sie nicht viel tun. Wenn Sie sicher sein möchten, dass diese Nachrichten ankommen, geben Sie in Ihrem E-Mail-Posteingang eine Zeile ein, ~/.spamassassin/user_prefsdie besagt, whitelist_from *@amadeus.comdass diese Nachrichten an Sie weitergeleitet werden. Darüber hinauszugehen und die Gewichtung der ausgelösten Regeln zu manipulieren, ist wahrscheinlich keine gute Idee. Der SpamAssassin (SA)-Regelsatz wird erstellt, indem eine große Menge Spam gefiltert und herausgefunden wird, welche Merkmale auf den Großteil davon zutreffen. Wenn Sie diese Regeln deaktivieren, werden Sie in Ihrem Posteingang wahrscheinlich viel mehr als nur Garuda-Bestätigungs-E-Mails sehen.

Allgemein

Genau mit solchen Situationen kommt die Bayesian Engine gut zurecht. Sie ist so konzipiert, dass sie E-Mails herausfiltert, die die anderen Regeln nicht auslösen, aber Dinge enthalten, die Sie nicht lesen möchten, und hilft gleichzeitig dabei, E-Mails durchzufiltern, die diese Regeln auslösen, aber Dinge enthalten, die SieTunmöchte lesen.

Soweit ich mich erinnere, tut die Engine nichts, wenn Sie sie nicht trainieren. Am einfachsten trainieren Sie sie, indem Sie zwei Ordner pflegen, die beispielsweise spamund heißen ham. In spamlegen Sie Kopien von E-Mails ab, die es in Ihren Posteingang geschafft haben, die Sie aber nicht haben wollten; in hamlegen Sie Kopien von E-Mails ab, die SA missachtet haben, die Sie aber haben wollten, wie beispielsweise diese Bestätigungs-E-Mail.

Dann haben Sie jede Nacht (oder so) einen Cron-Job, der sagt

sa-learn --spam --mbox mail/spam
sa-learn --ham  --mbox mail/ham

Ändern Sie die Pfade entsprechend. Mit der Zeit lernt die Engine dadurch, was Sie gerne lesen und was nicht. Da ein hoher Bayesian-Score den SA-Score einer E-Mail um +4,0 Punkte erhöhen kann, während ein niedriger 1,9 Punkte abziehen kann, kann eine gut trainierte Engine SA wirklich dabei helfen, zu unterscheiden, wasDuwill lesen, wasDunicht - aberman muss sich anstrengen, es zu lehren.

Question 2

Sie scheinen Dovecot zu verwenden. Ich habe einige Wochen damit verbracht, eine reibungslose Integration zu finden, die es Benutzern ermöglicht, die serverseitigen Spamfilter einfach zu trainieren, ohneKopierenMails.

Der Schlüssel ist dieAntispamDovecot-Plugin. Das Antispam-Plugin löst aus beibewegenOperationen zwischen drei Ordnergruppen: trash, unsureund spam. Insbesondere wird beim Erkennen eines Übergangs von irgendetwas (außer spam) zu spameine Spam-Lernaktion ausgelöst, und beim Erkennen eines Übergangs von spamzu unsurewird eine Ham-Lernaktion ausgelöst.

Es werden verschiedene Trainings-Backends unterstützt. Ein einfaches ist mailtrain, das einfach einen Befehl ausführt und die E-Mail auf die Standardeingabe legt. Eine Konfiguration dafür könnte wie folgt aussehen:

plugin {
   antispam_backend = mailtrain
   antispam_mail_sendmail = /usr/local/bin/sa-learn-stdin.sh
   antispam_mail_spam = spam
   antispam_mail_notspam = ham
   antispam_mail_sendmail_args = -L
   antispam_spam = Junk;INBOX.Junk
   antispam_trash = Trash;INBOX.Trash
   antispam_allow_append_to_spam = no
}

Zusammen mit /usr/local/bin/sa-learn-stdin.sh:

#!/bin/bash
/usr/bin/spamc "$@" >> /tmp/sa-learn-log
exit 0

Die Konfiguration lautet: „Um zu lernen, ob es Spam ist, führen Sie aus, /usr/local/bin/sa-learn-stdin.sh -L spamund um zu lernen, ob es Ham ist, führen Sie aus /usr/local/bin/sa-learn-stdin.sh -L ham.“ Die Argumente werden durch antispam_mail_spam, antispam_mail_notspamund konfiguriert antispam_mail_sendmail_args.

Das ist schon ziemlich gut. Wenn Sie Ihren Client so konfigurieren können, dass er Mails, die Sie als Spam markieren, in den Spam-Ordner verschiebt, ist das bereits eine ziemlich automatische Integration zwischen dem Client und dem Server. Wenn Sie den Server so konfigurieren, dass er Mails, die als Spam klassifiziert werden, bei der Zustellung im Spam-Ordner speichert (zum Beispiel mit Sieve), wird die Nachricht als Ham erkannt, wenn der Benutzer sie aus dem Spam-Ordner verschiebt.

Um die Integration mit Thunderbird und KMail zu verbessern, habe ich einePatch für Antispam, das leider kein Feedback vom Upstream erhielt;Benutzung auf eigene Gefahr.

Es fügt dem Spamschutz eine Konfigurationsoption hinzu, die einfach dem pluginAbschnitt in der Dovecot-Konfiguration hinzugefügt werden kann:

   antispam_spam_flags = "Junk;$JUNK"

(Die Anführungszeichen sind wichtig, um zu verhindern, dass sie $irgendetwas Lustiges tun.)

Mit dem Patch wird AntispamAucheine Lernaktion auslösen, wenn eine Nachricht als Spam gekennzeichnet wird oder alle Spamkennzeichen verliert. Kennzeichen sind eine IMAP-Funktion und werden von Clients verwendet, um Informationen serverseitig zu speichern. Es hat sich herausgestellt, dass Thunderbird und KMail diese Kennzeichen verwenden, um den Junk-/Spam-Status von Nachrichten zu speichern.

Das JunkFlag wird von Thunderbird gesetzt, wenn Sie eine Nachricht als Junk markieren. Gleiches gilt für das $JUNKFlag in KMail. Mit dieser Konfiguration können Sie also serverseitiges Lernen auslösen, indem Sie E-Mails in Thunderbird und KMail als Junk/NonJunk markieren.

Andere Clients wie K9-Mail spielen immer noch gut mit, da dort die Standardeinstellung darin besteht, Junk-Mails in den Spam-Ordner zu verschieben, woraufhin der Spam-Schutz ebenfalls ausgelöst wird.

Ich denke, Sie können die gleiche Funktionalität implementieren inIMAPSieve. Dies steht auf meiner TODO-Liste, aber leider verfüge ich derzeit nicht über eine testbereite Umgebung mit einem ausreichend aktuellen Dovecot.

Answer

Sie scheinen Dovecot zu verwenden. Ich habe einige Wochen damit verbracht, eine reibungslose Integration zu finden, die es Benutzern ermöglicht, die serverseitigen Spamfilter einfach zu trainieren, ohneKopierenMails.

Der Schlüssel ist dieAntispamDovecot-Plugin. Das Antispam-Plugin löst aus beibewegenOperationen zwischen drei Ordnergruppen: trash, unsureund spam. Insbesondere wird beim Erkennen eines Übergangs von irgendetwas (außer spam) zu spameine Spam-Lernaktion ausgelöst, und beim Erkennen eines Übergangs von spamzu unsurewird eine Ham-Lernaktion ausgelöst.

Es werden verschiedene Trainings-Backends unterstützt. Ein einfaches ist mailtrain, das einfach einen Befehl ausführt und die E-Mail auf die Standardeingabe legt. Eine Konfiguration dafür könnte wie folgt aussehen:

plugin {
   antispam_backend = mailtrain
   antispam_mail_sendmail = /usr/local/bin/sa-learn-stdin.sh
   antispam_mail_spam = spam
   antispam_mail_notspam = ham
   antispam_mail_sendmail_args = -L
   antispam_spam = Junk;INBOX.Junk
   antispam_trash = Trash;INBOX.Trash
   antispam_allow_append_to_spam = no
}

Zusammen mit /usr/local/bin/sa-learn-stdin.sh:

#!/bin/bash
/usr/bin/spamc "$@" >> /tmp/sa-learn-log
exit 0

Die Konfiguration lautet: „Um zu lernen, ob es Spam ist, führen Sie aus, /usr/local/bin/sa-learn-stdin.sh -L spamund um zu lernen, ob es Ham ist, führen Sie aus /usr/local/bin/sa-learn-stdin.sh -L ham.“ Die Argumente werden durch antispam_mail_spam, antispam_mail_notspamund konfiguriert antispam_mail_sendmail_args.

Das ist schon ziemlich gut. Wenn Sie Ihren Client so konfigurieren können, dass er Mails, die Sie als Spam markieren, in den Spam-Ordner verschiebt, ist das bereits eine ziemlich automatische Integration zwischen dem Client und dem Server. Wenn Sie den Server so konfigurieren, dass er Mails, die als Spam klassifiziert werden, bei der Zustellung im Spam-Ordner speichert (zum Beispiel mit Sieve), wird die Nachricht als Ham erkannt, wenn der Benutzer sie aus dem Spam-Ordner verschiebt.

Um die Integration mit Thunderbird und KMail zu verbessern, habe ich einePatch für Antispam, das leider kein Feedback vom Upstream erhielt;Benutzung auf eigene Gefahr.

Es fügt dem Spamschutz eine Konfigurationsoption hinzu, die einfach dem pluginAbschnitt in der Dovecot-Konfiguration hinzugefügt werden kann:

   antispam_spam_flags = "Junk;$JUNK"

(Die Anführungszeichen sind wichtig, um zu verhindern, dass sie $irgendetwas Lustiges tun.)

Mit dem Patch wird AntispamAucheine Lernaktion auslösen, wenn eine Nachricht als Spam gekennzeichnet wird oder alle Spamkennzeichen verliert. Kennzeichen sind eine IMAP-Funktion und werden von Clients verwendet, um Informationen serverseitig zu speichern. Es hat sich herausgestellt, dass Thunderbird und KMail diese Kennzeichen verwenden, um den Junk-/Spam-Status von Nachrichten zu speichern.

Das JunkFlag wird von Thunderbird gesetzt, wenn Sie eine Nachricht als Junk markieren. Gleiches gilt für das $JUNKFlag in KMail. Mit dieser Konfiguration können Sie also serverseitiges Lernen auslösen, indem Sie E-Mails in Thunderbird und KMail als Junk/NonJunk markieren.

Andere Clients wie K9-Mail spielen immer noch gut mit, da dort die Standardeinstellung darin besteht, Junk-Mails in den Spam-Ordner zu verschieben, woraufhin der Spam-Schutz ebenfalls ausgelöst wird.

Ich denke, Sie können die gleiche Funktionalität implementieren inIMAPSieve. Dies steht auf meiner TODO-Liste, aber leider verfüge ich derzeit nicht über eine testbereite Umgebung mit einem ausreichend aktuellen Dovecot.

Spamassassin hat etwas als Spam markiert, das kein Spam ist. Wie kann ich das mitteilen?

Antwort1

Spezifisch

Allgemein

Antwort2

verwandte Informationen