Convertendo PDF gerado em LaTeX para Word usando Acrobat XI

Convertendo PDF gerado em LaTeX para Word usando Acrobat XI

Eu me vi, novamente, precisando viver na terra do LaTeX e do Microsoft Word. Eu tenho o Acrobat XI disponível, então pensei em usá-lo apenas como intermediário na conversão de LaTeX para Word. Parece que já tive esse trabalho no passado, mas agora está apenas produzindo muito texto sem sentido.

O fluxo de trabalho atual:

  • Escreva LaTeX no TeXworks (do MikTeX)
  • Composto usando a configuração "pdfLaTeX + MakeIndex + BibTex"
  • Abra o PDF de saída no Acrobat Pro XI
  • Vá em Arquivo->Salvar como Outro->Microsoft Word->Documento do Word
  • Nas configurações, desmarque "Incluir comentários" e "Executar OCR se necessário"
  • Salvar

Tudo parece estar bem, então abro o documento do Word de saída e todo o texto é apenas símbolos aleatórios. Curiosamente, a formatação parece absolutamente perfeita - listas são listas, links ainda funcionam, o layout da página parece bom - apenas texto ilegível. Eu verifiquei e o Acrobat é capaz de pesquisar o PDF perfeitamente e copiar simplesmente o texto para o Word (via área de transferência) está perfeitamente bem. Mas se eu escolher "Copiar com formatação" e colar no Word, volto aos símbolos.

Suspeito que seja apenas um problema de fontes. Também estou assumindo que este é um problema bastante genérico que não é necessariamente específico do Acrobat. Eu realmente espero resolver isso - o documento do Word de saída não precisa ser perfeito, ele só precisa ter o mesmo texto e aproximadamente a mesma formatação. Alguma ideia sobre possíveis configurações a serem alteradas no MikTeX que possam gerar um PDF Acrobat será mais fácil?

Obrigado!

Responder1

Resolvi esse problema usando no documento látex

\usepackage[T1]{fontenc}
\usepackage{lmodern}

A primeira instrução permite T1a codificação de fontes e a segunda permite o uso de fontes modernas de látex.

Eu até usei (apenas) a primeira instrução o tempo todo (o que não resolveu o problema por si só), mas adicionar a segunda instrução corrigiu o problema e o documento do Word salvo no Acrobat Pro (X no meu caso) foi exibido corretamente.

Veja as respostas nestehttps://tex.stackexchange.com/questions/115080/cannot-copy-text-from-the-simplest-pdf-file?rq=1pergunta para mais detalhes.

Responder2

  1. Use esses pacotes em arquivo LateX que podem ajudar a criar um arquivo PDF copiável de texto melhor.

    • \usepackage[T1]{fontenc}
    • \usepackage{lmoderno}
  2. Gere o arquivo PDF

  3. Abra o arquivo PDF com Microsoft Word 2013 ou superior

  4. Ele irá converter todos os seus textos, figuras, tabelas. Mas tive alguns problemas com as seções de nota de rodapé, nome do livro e nome do autor na parte superior/inferior da página.

Responder3

Atualmente, é melhor usarMathpixpara converter PDF gerado em LaTeX em Word com a melhor precisão. Se alguém souber uma opção melhor, ficarei feliz em testá-la.

informação relacionada