Мне поручено преобразовать документ MS Word (*.docx) в файл HTML. Этот документ Word содержит много формул, написанных в MathType. Вот фиктивный текст, похожий на текст документа Word:
Я попытался сохранить документ как веб-страницу, но в итоге получилось следующее:
Формулы были преобразованы в изображения с низким разрешением и выглядели довольно непривлекательно.
Есть ли способ добиться удовлетворительного результата без ручного воссоздания исходного документа в HTML?
Должен признать, что я полный новичок в этой области.
решение1
Если вы все еще ищете решение, я недавно обновил свой конвертер Word docx в html, чтобы теперь распознавать математические уравнения и правильно отображать их на веб-странице. Я использую онлайн-версию Mathjax, чтобы иметь возможность легко отображать математические уравнения на веб-странице. Это простой класс php, который принимает файл docx в качестве входных данных и выводит его как html для отображения на веб-странице и/или сохранения в файл.
Я только что добавил эту возможность, поэтому с ней все еще могут быть некоторые проблемы. Если вы их обнаружите, я буду очень рад рассмотреть их и исправить для вас.
Для получения дополнительной информации и загрузки моего PHP-класса «wordtohtml» см.: https://github.com/timy352/wordtohtml или https://www.phpclasses.org/package/12250-PHP-Convert-Microsoft-Word-DOCX-document-to-HTML.html