Spamassassin은 일하지만 배우지 않습니까? 베이즈 필터 정확도가 향상되지 않음

Question

결과스팸 암살자Bayes 훈련은 일반적으로 일부 파일로 구성된 데이터베이스에 저장됩니다.실행중인 사용자의 홈 디렉토리에 저장됩니다.. 다른 사용자로 호출하면 동일한 데이터 세트에 액세스/업데이트되지 않습니다.

_{(이전 댓글의 확장 버전)}

권한 분리를 위해,스팸 암살자debian-spamd일반적으로 또는 같은 별도의 사용자로 실행되므로 amavis자동 학습 중에 해당 사용자의 데이터베이스가 업데이트됩니다. 데이터베이스를 수동으로 업데이트하려면 올바른 사용자를 지정해야 할 수도 있습니다. 그렇지 않으면 훈련 데이터를 관련 없는 다른 데이터베이스에 저장하게 됩니다.

어떻게 말하나요?훈련 데이터 파일의 인스턴스가 두 개(백업 제외)인 경우 다음을 호출했습니다.스팸 암살자두 명의 다른 사용자(메일 서버에서 한 명, 셸에서 한 명):

# find / -name bayes_toks
/var/lib/amavis/.spamassassin/bayes_toks
/root/.spamassassin/bayes_toks

데이터베이스가 충분히 시드되자마자 두 파일 모두 최근 수정 타임스탬프를 가질 수 있습니다.스팸 암살자충분히 식별 가능한 메일을 선택하세요.자동열차이는 수동 조치 없이 수신된 메일에서 토큰을 학습하는 것입니다(이 동작은 구성할 수 있으며 일반적으로 활성화하기를 원합니다).

어떻게 고치는 지?동일한 메일을 올바른 데이터베이스에 공급 - sa-learn메일 서버에서 호출하는 동안 사용하는 사용자/homedir로 호출하여(확인하다이 경우 폴더 이름이 사용자 이름과 일치하지 않을 수 있습니다!):

sudo -H -u amavis sa-learn --no-sync --spam /var/vmail/$domain/$user/Maildir/.Junk/{cur,new} >> /var/log/sa-learn.log 2>&1
sudo -H -u amavis sa-learn --no-sync --ham /var/vmail/$domain/$user/Maildir/{cur} >> /var/log/sa-learn.log 2>&1
sudo -H -u amavis sa-learn --sync >> /var/log/sa-learn.log 2>&1

나는 추천하지 않는다병합내부 파일 형식이 약간 혼란스러울 수 있기 때문에 의도하지 않게 데이터세트를 분할한 경우(비록~할 수 있다다음을 사용하여 덤프됩니다 --backup.파괴적으로)을 사용하여 덮어쓰는 --restore반면, 동일한 스팸 데이터에 대한 재교육은 훨씬 간단하며 sa-learn부정적인 영향 없이 동일한 메일을 계속해서 공급하도록 설계되었습니다.

Answer 1