Можно ли извлечь текст из PDF-файла с ошибкой «Недопустимая запись XRef»?

Можно ли извлечь текст из PDF-файла с ошибкой «Недопустимая запись XRef»?

У меня есть PDF, который я пытаюсь прочитать, но он не открывается в Adobe Reader. При использовании pdftotext я увидел сообщение «Недопустимая запись XRef». PDFtk и Ghostscript не смогли проанализировать файл. Я попытался восстановить его вручную, но быстро понял, что это выше моих сил.

Мне было интересно, есть ли способ восстановить текст из файла? Я вижу много ресурсов изображения, но ни один текст там явно не виден. Кто-нибудь знает, можно ли его восстановить?

решение1

Ручная работа с PDF-файлом гарантированно обречена на провал (если только вы действительно не знаете, что делаете и как это делать).

Если текущая версия Acrobat (Reader) не может исправить проблему, вы можете попробовать использовать Acrobat/Reader 7 или даже более раннюю версию; старые версии Acrobat/Reader предпринимали больше попыток восстановить испорченные документы, чем новые.

В противном случае… шансы, что вы сможете это исправить, весьма малы.

Связанный контент