100,000 個を超える .pdf ファイルがあります。その中で破損したファイルを見つける必要があります。
破損したファイルを取得する方法、またはその逆に、動作しているファイルを取得する方法(ファイルを 1 つずつ手動で調べるのではなく、自動的に取得する方法)はありますか?
いろいろ検索しましたが、何も見つかりませんでした。結果はすべて、壊れた PDF を修復するソフトウェアを表示するものでした。
答え1
Ghostscript のようなものを使用して、それらすべてを読み取り、ファイルに書き込まれないビットマップ イメージに変換することができます (たとえば、Linux では出力を /dev/null にリダイレクトします)。スクリプトは、戻りコードとエラー メッセージをチェックできます。