문자 집합 사용에 따라 mutt에서 메시지를 어떻게 선택할 수 있나요?

문자 집합 사용에 따라 mutt에서 메시지를 어떻게 선택할 수 있나요?

나는 한자 또는 키릴 문자(러시아어)를 사용하는 모든 메시지를 삭제 대상으로 표시하려고 합니다. 왜냐하면 나에게는 그 메시지가 모두 스팸이기 때문입니다.

답변1

다음을 사용하여 인코딩을 필터링할 수 있습니다 foo.~h^content-type:.*foo

그러나 이는 다소 제한적입니다. 첫째, 특정 문자(중국어, 키릴 문자...)를 사용하는 메시지는 UTF-8로 인코딩될 수 있습니다. 또한 첨부 파일이 있는 메시지의 경우 MIME 첨부 파일의 헤더에 인코딩이 지정되어 있으며 Mutt의 패턴 관점에서 보면 이것이 본문입니다. 을 계속 사용할 수 있지만 ~Bfoo속도가 느리고 잘못된 긍정이 발생할 수 있습니다( content-type첨부 파일 헤더가 여러 본문 줄에 있을 수 있으므로 포함할 수 없음).

스크립트를 식별할 수 있는 외부 도구가 있을 수 있지만 이는 더 이상 Mutt와 관련이 없습니다...

스팸 필터링을 위한 것이라면 베이지안 필터가 이런 종류의 작업에 적합할 수 있습니다(어떤 스크립트인지 알 필요가 없음).

특정 스크립트에 속하는 일부 문자의 존재 여부를 필터링할 수도 있습니다.정규 표현식을 사용하여 utf-8 인코딩의 모든 중국어 문자와 일치. 이것은 아직 Mutt에서는 작동하지 않지만(아마도 미래에는) 그 동안 외부 도구를 사용할 수 있습니다.

먼저 디코딩하지 않고 필터링하는 것도 가능합니다(이것이 더 빠릅니다). 예를 들어, 나는 현재 다음 pcre 정규식(대소문자 구분)을 사용하여 접미사에서 일부 러시아 스팸을 필터링합니다.

/^Subject:\s*"?=\?[Uu][Tt][Ff]-8\?[Bb]\?(0[J-Z]|(KN|W9)[C-R])/i

관련 정보