페르시아어 PDF 파일을 Microsoft Word 형식으로 변환하는 방법은 무엇입니까?

페르시아어 PDF 파일을 Microsoft Word 형식으로 변환하는 방법은 무엇입니까?

페르시아어 문자로 된 PDF 파일이 있는데,오른쪽에서 왼쪽으로. 페르시아어는 UTF-8 형식을 사용하므로 Microsoft Word에서 일반 텍스트로 변환할 수 없으며 결과적으로 읽을 수 없는 문자를 복사하여 붙여넣을 수도 없습니다. 나는 다음과 같은 많은 소프트웨어를 사용해 보았습니다.유니PDF및 e-Pdf 변환기는 변환 후에도 여전히 문자가 제대로 표시되지 않습니다. OCR도 시도했지만 다시 같은 문제가 나타났습니다. PDF에는 비밀번호나 제한 사항이 없습니다.

누구든지 다른 아이디어가 있나요?

편집: 실제로 MS Word에서 파일을 생성하여 PDF로 변환하려고 시도했지만 그 후에도 PDF 파일에서 동일한 문제가 발생했습니다.(인코딩도 알려졌습니다.)

답변1

PDF 파일을 워드로 변환할 때에도 동일한 문제가 발생했습니다. Word에서 복사/붙여넣기한 후 서식이 변경되어 문제가 발생했습니다. 여러 온라인 변환기를 시도했지만 실패했습니다.
효과가 있었던 유일한 방법은 다음과 같습니다.

  1. Adobe Acrobat Reader로 PDF 파일을 연 다음 파일 메뉴에서 인쇄를 선택하세요. 프린터 이름에서 adobe acrobat을 선택합니다. 예, PDF에서 PDF를 만들려고 합니다!
  2. Google Chrome에서 새 PDF 파일을 엽니다(파일을 Chrome으로 끌어서 놓기).
  3. 이제 모든 텍스트를 선택하고(ctrl + A) 빈 Word 파일에 복사/붙여넣기만 하면 됩니다.

답변2

라틴어가 아닌 스크립트(특히 아랍어, 히브리어, 페르시아어와 같은 RTL 스크립트)의 PDF 파일은 단어 또는 문장 조각 수준에서 텍스트를 LTR화하거나 어떻게든 올바른 문자 모양을 가져오는 소프트웨어에 의해 생성되는 경우가 많습니다. 표시되지만 '논리적' 텍스트에 대해 횡설수설하게 됩니다. 이러한 경우 사실상 옵션이 아닌 사용자 정의 백 컨버터를 작성하는 것 외에는 수행할 작업이 거의 없습니다.

그러나 일반적인 PDF 리더를 사용하여 액세스할 수 있는 메타데이터에 종종 표시되는 파일 생성 방법을 파악할 수 있는 경우 해당 파일을 생성한 응용 프로그램에서 파일을 열 수 있는 옵션이 있을 수 있습니다. 귀하의 질문이 더 구체적입니다.

답변3

저는 현재 PDF를 편집 가능한 페르시아어 텍스트로 변환하는 작업을 하고 있습니다. 내가 찾은 가장 좋은 해결책은 다음과 같이 Google 문서를 사용하는 것입니다.

  1. PDF 페이지를 이미지로 변환해야 합니다. 이를 위해 Adobe acrobat 리더(무료인 adobe 리더 아님)를 사용하거나 Linux에서는 GIMP를 사용하여 PDF를 연 다음 각 페이지를 별도의 이미지로 열도록 선택합니다. 그것은 당신 자신의 선택입니다.
  2. Google 드라이브에 이미지 파일 업로드
  3. Google 드라이브로 이동하여 각 이미지를 마우스 오른쪽 버튼으로 클릭한 다음 클릭하세요.open with google doc
  4. Google 문서가 이미지에서 편집 가능한 텍스트를 열 때까지 기다립니다.
  5. 워드로 복사하세요

자동화된 방법이 있는지는 모르겠습니다. 언젠가는 이 작업을 자동으로 수행하도록 신청할 시간이 있기를 바랍니다.

답변4

답변이 너무 늦었다는 건 알지만, 같은 질문을 갖고 계신 분들을 위해 제안해 드릴 수 있습니다.Delix.ir이는 페르시아어 OCR 및 PDF를 단어로 변환하는 변환기입니다.

면책 조항: 저는 delix.ir의 창립자이며 이것이 광고로 취급되지 않기를 바랍니다.

관련 정보