Adobe Reader를 사용하여 보호된 PDF 파일의 텍스트를 복사할 수 없습니다

Adobe Reader를 사용하여 보호된 PDF 파일의 텍스트를 복사할 수 없습니다

소량의 복잡한 텍스트를 복사해야 하는 제3자 소스의 기술적 PDF 문서가 있습니다. 텍스트를 선택했는데 복사 옵션이 회색으로 표시되어 있는 것을 발견했습니다. 속성을 살펴보니 복사가 방지되어 있는 것 같았습니다. 조금 복잡하고 오타를 피하고 싶어서 다시 입력하기보다는 복사해서 쓰고 싶었습니다.

답변1

이 pdf가 이미지가 아닌 경우 pdftotext 명령을 사용하십시오. 우분투에 내장된 유틸리티입니다. PDF가 이미지 파일인 경우 jpg로 변환한 후 tesseract로 인식해야 합니다.

convert-im6.q16 -density 300 yourfile.pdf yourfile.jpg
tesseract -l en youfile.pdf

답변2

브라우저와 같은 대체 PDF 응용 프로그램에서 파일을 여는 것은 PDF에 적용될 수 있는 일부 보호 기능을 우회하는 간단한 방법이 될 수 있습니다.

PDF 콘텐츠가 그림인 경우(예를 들어 스캔한 경우) 작동하지 않을 수 있으며 그림을 분석하고 텍스트를 생성하려면 OCR(광학 문자 인식) 기능이 있는 도구가 필요합니다.

관련 정보