Невозможно скопировать текст из защищенного PDF-файла с помощью Adobe Reader

Question 1

Если этот pdf не является изображением, используйте команду pdftotext. Это встроенная утилита в Ubuntu. Если pdf является файлом изображения, вам нужно преобразовать его в jpg, а затем распознать его с помощью tesseract.

convert-im6.q16 -density 300 yourfile.pdf yourfile.jpg
tesseract -l en youfile.pdf

Answer

Если этот pdf не является изображением, используйте команду pdftotext. Это встроенная утилита в Ubuntu. Если pdf является файлом изображения, вам нужно преобразовать его в jpg, а затем распознать его с помощью tesseract.

convert-im6.q16 -density 300 yourfile.pdf yourfile.jpg
tesseract -l en youfile.pdf

Question 2

Открытие файла в альтернативном приложении для работы с PDF-файлами, например в браузере, может быть простым способом обойти НЕКОТОРЫЕ меры защиты, которые могут применяться к PDF-файлу.

Если содержимое PDF-файла представляет собой изображение (например, отсканированное), это может не сработать, и вам понадобится инструмент с функцией OCR (оптического распознавания символов), чтобы проанализировать изображение и сгенерировать из него текст.

Answer

Открытие файла в альтернативном приложении для работы с PDF-файлами, например в браузере, может быть простым способом обойти НЕКОТОРЫЕ меры защиты, которые могут применяться к PDF-файлу.

Если содержимое PDF-файла представляет собой изображение (например, отсканированное), это может не сработать, и вам понадобится инструмент с функцией OCR (оптического распознавания символов), чтобы проанализировать изображение и сгенерировать из него текст.

Невозможно скопировать текст из защищенного PDF-файла с помощью Adobe Reader

решение1

решение2

Связанный контент