「無効な XRef エントリ」エラーのある PDF からテキストを抽出できますか?

「無効な XRef エントリ」エラーのある PDF からテキストを抽出できますか?

読みたい PDF があるのですが、Adobe Reader で開けません。pdftotext を使用すると、「無効な XRef エントリ」というメッセージが表示されました。PDFtk と Ghostscript ではファイルを解析できませんでした。手動で修復しようとしましたが、すぐに手に負えないことがわかりました。

ファイルからテキストを復元する方法があるかどうか知りたいのですが。画像リソースはたくさん見えますが、テキストははっきりと見えません。復元できるかどうか知っている人はいますか?

答え1

PDF を手動でいじくり回すと、必ず失敗します (自分が何をしているのか、どのようにやっているのかを本当に理解していない限り)。

現在のバージョンの Acrobat (Reader) で問題を解決できない場合は、Acrobat/Reader 7 またはそれ以前のバージョンを入手してみてください。古いバージョンの Acrobat/Reader では、新しいバージョンよりも破損したドキュメントの修復が何度も試行されていました。

そうでなければ…それを修正できる可能性はかなり低くなります。

関連情報