破損した PDF ファイルを見つけるにはどうすればいいですか?

破損した PDF ファイルを見つけるにはどうすればいいですか?

100,000 個を超える .pdf ファイルがあります。その中で破損したファイルを見つける必要があります。

破損したファイルを取得する方法、またはその逆に、動作しているファイルを取得する方法(ファイルを 1 つずつ手動で調べるのではなく、自動的に取得する方法)はありますか?

いろいろ検索しましたが、何も見つかりませんでした。結果はすべて、壊れた PDF を修復するソフトウェアを表示するものでした。

答え1

Ghostscript のようなものを使用して、それらすべてを読み取り、ファイルに書き込まれないビットマップ イメージに変換することができます (たとえば、Linux では出力を /dev/null にリダイレクトします)。スクリプトは、戻りコードとエラー メッセージをチェックできます。

関連情報