能否從 PDF 中提取文字並出現「無效外部參照條目」錯誤?

能否從 PDF 中提取文字並出現「無效外部參照條目」錯誤?

我有一個 PDF,我正在嘗試閱讀,但無法在 Adob​​e Reader 中開啟。當使用 pdftotext 時,我看到它說“無效的外部參考條目”。 PDFtk 和 Ghostscript 無法解析該文件。我嘗試手動修復它,但很快就意識到這超出了我的能力範圍。

我想知道是否有任何方法可以從文件中恢復任何文字?我可以看到很多圖像資源,但沒有任何文字清晰可見。有誰知道是否可以恢復?

答案1

在 PDF 中手動亂七八糟肯定會失敗(除非您真的知道自己在做什麼以及如何做)。

如果目前版本的 Acrobat (Reader) 無法解決該問題,您可以嘗試使用 Acrobat/Reader 7 或更早版本;較舊的 Acrobat/Reader 版本比新版本嘗試更多地修復混亂的文檔。

否則……你能修復它的機會很小。

相關內容