¿Spamassassin trabaja pero no aprende? La precisión del filtro Bayes no mejora

Question

Los resultados despamasassinLos entrenamientos Bayes se almacenan en una base de datos compuesta por algunos archivos comúnmentealmacenado en el directorio de inicio del usuario bajo el que se está ejecutando. Si llama con un usuario diferente, no está accediendo ni actualizando el mismo conjunto de datos.

_{(Versión extendida del comentario anterior)}

Para la separación de privilegios,spamasassinPor lo general, se ejecuta con un usuario independiente, como debian-spamdo amavis, por lo que durante el aprendizaje automático, se actualizará la base de datos de ese usuario. Si desea realizar actualizaciones manuales en la base de datos, es posible que deba especificar el usuario correcto; de lo contrario, simplemente estaría guardando sus datos de entrenamiento en una base de datos diferente y no relacionada.

¿Como decir?Si tiene (aparte de las copias de seguridad) dos instancias de los archivos de datos de entrenamiento, ha estado llamandospamasassinbajo dos usuarios diferentes (probablemente uno de su servidor de correo, uno de su shell):

# find / -name bayes_toks
/var/lib/amavis/.spamassassin/bayes_toks
/root/.spamassassin/bayes_toks

Ambos archivos pueden tener una marca de tiempo de modificación reciente porque tan pronto como la base de datos esté lo suficientemente inicializada,spamassassin puedeseleccionar correo suficientemente bien identificado paraautotrenque consiste en aprender tokens del correo recibido sin acción manual (este comportamiento se puede configurar y normalmente lo querrás activar).

¿Como arreglar?Envíe los mismos correos a la base de datos correcta, llamando sa-learncon el usuario/homedir que está utilizando mientras se llama desde el servidor de correo (verificaresto, es posible que el nombre de la carpeta no coincida con el nombre de usuario):

sudo -H -u amavis sa-learn --no-sync --spam /var/vmail/$domain/$user/Maildir/.Junk/{cur,new} >> /var/log/sa-learn.log 2>&1
sudo -H -u amavis sa-learn --no-sync --ham /var/vmail/$domain/$user/Maildir/{cur} >> /var/log/sa-learn.log 2>&1
sudo -H -u amavis sa-learn --sync >> /var/log/sa-learn.log 2>&1

no estoy recomendandofusionandolos conjuntos de datos divididos involuntariamente porque el formato de archivo interno puede ser un poco confuso (aunquepoderser desechado usando --backupydestructivamentesobrescrito usando --restore), mientras que volver a entrenar con los mismos datos de spam es mucho más simple y sa-learnestá diseñado para lidiar con el envío del mismo correo una y otra vez sin efectos adversos.

Answer 1