Conversión de PDF generado por LaTeX a Word usando Acrobat XI

Conversión de PDF generado por LaTeX a Word usando Acrobat XI

Nuevamente me encontré con la necesidad de vivir tanto en la tierra de LaTeX como en Microsoft Word. Tengo Acrobat XI disponible, así que pensé en usarlo como intermediario en la conversión de LaTeX a Word. Parece que he tenido este trabajo en el pasado, pero ahora solo produce una gran cantidad de texto sin sentido.

El flujo de trabajo actual:

  • Escribir LaTeX en TeXworks (de MikTeX)
  • Componga utilizando la configuración "pdfLaTeX + MakeIndex + BibTex"
  • Abra el PDF de salida en Acrobat Pro XI
  • Vaya a Archivo->Guardar como otro->Microsoft Word->Documento de Word
  • En la configuración, desmarque "Incluir comentarios" y "Ejecutar OCR si es necesario".
  • Ahorrar

Todo parece ir bien, luego abro el documento de Word de salida y todo el texto son solo símbolos aleatorios. Curiosamente, el formato parece ser absolutamente perfecto: las listas son listas, los enlaces aún funcionan, el diseño de la página se ve bien, solo texto ilegible. Lo verifiqué y Acrobat puede buscar el PDF sin problemas y copiar el texto en Word (a través del portapapeles) está perfectamente bien. Pero si elijo "Copiar con formato" y lo pego en Word, vuelvo a los símbolos.

Sospecho que esto es sólo un problema de fuentes. También supongo que se trata de un problema bastante genérico que no es necesariamente específico de Acrobat. Realmente espero solucionar esto: el documento de Word resultante no necesita ser perfecto, solo necesita tener el mismo texto y aproximadamente el mismo formato. ¿Alguna idea sobre posibles configuraciones para cambiar en MikTeX que podrían generar un PDF con el que Acrobat le resultará más fácil?

¡Gracias!

Respuesta1

Resolví este problema usando en el documento de látex.

\usepackage[T1]{fontenc}
\usepackage{lmodern}

La primera declaración permite T1la codificación de fuentes y la segunda permite el uso de fuentes de látex modernas.

Incluso había estado usando (solo) la primera declaración todo el tiempo (lo que no solucionó este problema por sí solo), pero agregar la segunda declaración sí lo solucionó y el documento de Word guardado desde Acrobat Pro (X en mi caso) se mostró correctamente.

Vea las respuestas en estehttps://tex.stackexchange.com/questions/115080/cannot-copy-text-from-the-simplest-pdf-file?rq=1pregunta para más detalles.

Respuesta2

  1. Utilice estos paquetes en archivos LateX que podrían ayudar a crear un mejor archivo PDF copiable de texto.

    • \usepackage[T1]{fontenc}
    • \usepackage{lmoderno}
  2. Generar el archivo PDF

  3. Abra el archivo PDF con Microsoft Word 2013 o superior

  4. Convertirá todos sus textos, figuras y tablas. Pero tuve algunos problemas con las secciones de nota al pie, nombre del libro y nombre del autor en la parte superior/inferior de la página.

Respuesta3

Actualmente, es mejor usarMathpixpara convertir PDF generado por LaTeX a Word con la mayor precisión. Si alguien conoce una opción mejor, estaría encantado de probarla.

información relacionada