Преобразование PDF-файла, созданного в LaTeX, в Word с помощью Acrobat XI

Преобразование PDF-файла, созданного в LaTeX, в Word с помощью Acrobat XI

Я снова обнаружил, что мне нужно жить и в стране LaTeX, и в стране Microsoft Word. У меня есть Acrobat XI, поэтому я подумал, что просто воспользуюсь им как посредником при конвертации из LaTeX в Word. Кажется, у меня была такая работа в прошлом, но теперь она просто выдает кучу бессмысленного текста.

Текущий рабочий процесс:

  • Написать LaTeX в TeXworks (из MikTeX)
  • Набрано с использованием настройки "pdfLaTeX + MakeIndex + BibTex"
  • Откройте выходной PDF-файл в Acrobat Pro XI.
  • Перейдите в Файл->Сохранить как другой->Microsoft Word->Документ Word.
  • В настройках снимите галочки «Включить комментарии» и «Запустить OCR при необходимости».
  • Сохранять

Все вроде бы идет хорошо, затем я открываю выходной документ Word, и весь текст представляет собой просто случайные символы. Интересно, что форматирование кажется абсолютно идеальным — списки есть списки, ссылки все еще работают, макет страницы выглядит нормально — просто нечитаемый текст. Я проверил, и Acrobat может нормально искать в PDF, и простое копирование текста в Word (через буфер обмена) проходит отлично. Но если я выбираю «Копировать с форматированием» и вставляю в Word, я возвращаюсь к символам.

Я подозреваю, что это просто проблема со шрифтами. Я также предполагаю, что это довольно общая проблема, которая не обязательно свойственна только Acrobat. Я очень надеюсь разобраться с этим — выходной документ Word не обязательно должен быть идеальным, он просто должен иметь тот же текст и примерно то же форматирование. Есть ли у вас мысли о возможных настройках, которые можно изменить в MikTeX, чтобы получить PDF, с которым Acrobat будет проще работать?

Спасибо!

решение1

Я решил эту проблему, используя в документе Latex

\usepackage[T1]{fontenc}
\usepackage{lmodern}

Первое утверждение включает T1кодирование шрифтов, а второе позволяет использовать современные латексные шрифты.

Я даже использовал (только) первый оператор все время (что само по себе не решило проблему), но добавление второго оператора исправило ее, и документ Word, сохраненный из Acrobat Pro (X в моем случае), отображался правильно.

Смотрите ответы здесьhttps://tex.stackexchange.com/questions/115080/невозможно-скопировать-текст-из-самого-простого-pdf-файла?rq=1вопрос для более подробной информации.

решение2

  1. Используйте эти пакеты в файле LateX, чтобы создать более качественный текстовый копируемый PDF-файл.

    • \usepackage[T1]{fontenc}
    • \usepackage{lmodern}
  2. Сгенерировать PDF-файл

  3. Откройте PDF-файл в Microsoft Word 2013 или более поздней версии.

  4. Он преобразует все ваши тексты, рисунки, таблицы. Но у меня возникли некоторые проблемы с разделами сносок, названий книг, имен авторов вверху/внизу страницы.

решение3

В настоящее время лучше использоватьМатпиксдля преобразования PDF, созданного LaTeX, в Word с наилучшей точностью. Если кто-то знает лучший вариант, я был бы рад его протестировать.

Связанный контент