Script de Shell para detectar archivos PDF con contenido no ASCII

Script de Shell para detectar archivos PDF con contenido no ASCII

Necesito un script de shell para detectar archivos PDF válidos. Es decir, necesito conservar sólo archivos PDF ASCII simples. Es necesario eliminar otros archivos PDF que contengan contenidos no ASCII y scripts maliciosos. ¿Cómo podría hacer eso? ¿Hay algún script disponible para hacerlo?

Respuesta1

Lo que quieres se llama escáner de virus. P.ej.almejav

Respuesta2

Aquí hay algunos scripts de Python. "The Malware Archives: PDF Files" también Bruce Schneier ha mencionado esto en su sitio.

pdf2ps es fácil pero mucho menos seguro. Este es un PDF/A interesante.http://en.wikipedia.org/wiki/PDF/Ano permite elementos multimedia.

información relacionada