Como encontro arquivos PDF corrompidos?

Como encontro arquivos PDF corrompidos?

Tenho mais de 100.000 arquivos .pdf. Entre eles preciso descobrir os arquivos corrompidos.

Existe uma maneira de obter os arquivos corrompidos - ou vice-versa, obter aqueles que estão funcionando (de maneira automatizada, em vez de examinar manualmente os arquivos, um de cada vez)?

Procurei muito mas não encontrei nenhum. Todos os resultados me mostraram software para consertar PDFs quebrados.

Responder1

Você poderia usar algo como Ghostscript para ler todos eles e convertê-los em imagens bitmap que não são gravadas em um arquivo (por exemplo, no Linux redirecionar a saída para /dev/null). Um script pode verificar códigos de retorno e mensagens de erro.

informação relacionada