ASCII가 아닌 내용이 포함된 PDF를 감지하는 쉘 스크립트

ASCII가 아닌 내용이 포함된 PDF를 감지하는 쉘 스크립트

유효한 PDF를 감지하려면 쉘 스크립트가 필요합니다. 즉, 일반 ASCII PDF만 유지하면 됩니다. ASCII가 아닌 내용과 악성 스크립트가 포함된 기타 PDF는 삭제해야 합니다. 어떻게 그렇게 할 수 있습니까? 이를 수행하는 데 사용할 수 있는 스크립트가 있습니까?

답변1

당신이 원하는 것은 바이러스 스캐너라고합니다. 예.ClamAV

답변2

여기에는 몇 가지 Python 스크립트가 있습니다. "맬웨어 아카이브: PDF 파일" 또한 Bruce Schneier가 자신의 사이트에서 이를 언급했습니다.

pdf2ps는 쉽지만 확실성은 훨씬 낮습니다. 흥미로운 PDF/A입니다.http://en.wikipedia.org/wiki/PDF/A멀티미디어 요소를 허용하지 않습니다.

관련 정보