Necesito un script de shell para detectar archivos PDF válidos. Es decir, necesito conservar sólo archivos PDF ASCII simples. Es necesario eliminar otros archivos PDF que contengan contenidos no ASCII y scripts maliciosos. ¿Cómo podría hacer eso? ¿Hay algún script disponible para hacerlo?
Respuesta1
Lo que quieres se llama escáner de virus. P.ej.almejav
Respuesta2
Aquí hay algunos scripts de Python. "The Malware Archives: PDF Files" también Bruce Schneier ha mencionado esto en su sitio.
pdf2ps es fácil pero mucho menos seguro. Este es un PDF/A interesante.http://en.wikipedia.org/wiki/PDF/Ano permite elementos multimedia.