Shell-Skript zum Erkennen von PDFs mit Nicht-ASCII-Inhalten

Shell-Skript zum Erkennen von PDFs mit Nicht-ASCII-Inhalten

Ich brauche ein Shell-Skript, um gültige PDFs zu erkennen. Das heißt, ich muss nur einfache ASCII-PDFs behalten. Andere PDFs, die nicht-ASCII-Inhalte und bösartige Skripte enthalten, müssen gelöscht werden. Wie kann ich das tun? Gibt es dafür ein Skript?

Antwort1

Was Sie wollen, ist ein sogenannter Virenscanner. Z. B.ClamAV

Antwort2

Hier gibt es einige Python-Skripte. „The Malware Archives: PDF Files“ – auch Bruce Schneier hat dies auf seiner Site erwähnt.

pdf2ps ist einfach, aber viel weniger sicher. Das ist interessant PDF/Ahttp://en.wikipedia.org/wiki/PDF/Alässt keine Multimedia-Elemente zu.

verwandte Informationen