Невозможно скопировать текст из защищенного PDF-файла с помощью Adobe Reader

Невозможно скопировать текст из защищенного PDF-файла с помощью Adobe Reader

У меня есть технический документ PDF из стороннего источника, из которого мне нужно было скопировать небольшой фрагмент сложного текста. Я выбрал текст и обнаружил, что опция копирования неактивна. Я посмотрел свойства, и, похоже, он был защищен от копирования. Я хотел скопировать текст, а не перепечатывать его, так как он был немного сложным, и я хотел избежать опечаток.

решение1

Если этот pdf не является изображением, используйте команду pdftotext. Это встроенная утилита в Ubuntu. Если pdf является файлом изображения, вам нужно преобразовать его в jpg, а затем распознать его с помощью tesseract.

convert-im6.q16 -density 300 yourfile.pdf yourfile.jpg
tesseract -l en youfile.pdf

решение2

Открытие файла в альтернативном приложении для работы с PDF-файлами, например в браузере, может быть простым способом обойти НЕКОТОРЫЕ меры защиты, которые могут применяться к PDF-файлу.

Если содержимое PDF-файла представляет собой изображение (например, отсканированное), это может не сработать, и вам понадобится инструмент с функцией OCR (оптического распознавания символов), чтобы проанализировать изображение и сгенерировать из него текст.

Связанный контент