Spamassassin は動作しているが学習していない? ベイズフィルタの精度が向上していない

Question

の結果スパマサシンベイズトレーニングは、一般的にいくつかのファイルで構成されるデータベースに保存されます実行しているユーザーのホームディレクトリに保存されます別のユーザーで呼び出すと、同じデータセットにアクセスしたり更新したりすることはありません。

_{(以前のコメントの拡張版)}

特権の分離については、スパマサシンdebian-spamd通常、やなどの別のユーザーで実行されるamavisため、自動学習中にそのユーザーのデータベースが更新されます。データベースを手動で更新する場合は、正しいユーザーを指定する必要があります。そうしないと、トレーニングデータが別の無関係なデータベースに保存されることになります。

どうやって見分けるの？トレーニングデータファイルのインスタンスが2つある場合（バックアップは別として）、スパマサシン2 人の異なるユーザー (おそらく 1 人はメールサーバーから、もう 1 人はシェルから) で実行します。

# find / -name bayes_toks
/var/lib/amavis/.spamassassin/bayes_toks
/root/.spamassassin/bayes_toks

両方のファイルには最新の変更タイムスタンプがある可能性があります。データベースが十分にシードされると、スパマサシン5月十分に識別されたメールを選択してオートトレインこれは、手動操作なしで受信したメールからトークンを学習することです (この動作は構成可能であり、通常はオンにする必要があります)。

直し方？同じメールを適切なデータベースに送ります -sa-learnメールサーバーから呼び出されるときに使用しているユーザー/ホームディレクトリで呼び出します（確認するこの場合、フォルダ名がユーザー名と一致しない可能性があります！):

sudo -H -u amavis sa-learn --no-sync --spam /var/vmail/$domain/$user/Maildir/.Junk/{cur,new} >> /var/log/sa-learn.log 2>&1
sudo -H -u amavis sa-learn --no-sync --ham /var/vmail/$domain/$user/Maildir/{cur} >> /var/log/sa-learn.log 2>&1
sudo -H -u amavis sa-learn --sync >> /var/log/sa-learn.log 2>&1

推奨しません合併内部ファイル形式が少しわかりにくいため、意図せずデータセットが分割される可能性があります（ただし、できる--backup使用してダンプされる破壊的にを使用して上書きされます--restoreが、同じスパムデータでの再トレーニングははるかに簡単で、sa-learn同じメールが何度も送られても悪影響がないように設計されています。

Answer 1