
Мне нужно преобразовать файлы PowerPoint PPTX в HTML с помощью командной строки. Файл HTML должен сохранять текст как текст (не изображение), при этом все фигуры, Smart-arts и графики должны преобразовываться в изображения (или, если не изображения, то в SVG).
Я пытаюсь сделать это с помощью LibreOffice Impress 4.4.3.2.
Если я открываю Impress и экспортирую файл PPTX в HTML, все слайды преобразуются в изображения, включая текст. Если я экспортирую в PDF, он действительно сохраняет текст и преобразует все формы нормально, но увы... Мне нужен HTML, а не PDF.
Используя командную строку (в Windows 8), я перепробовал все HTML-фильтры, которые нашел по ссылке: текст
Большинство из них просто не работали. Самое близкое, что я смог найти:
soffice.exe --headless --convert-to html --outdir d:\temp d:\temp\presentation.pptx успешно преобразовал текст, но по какой-то причине в преобразованном HTML-файле отсутствуют все фигуры и графики.
Как мне решить мою проблему? Возможно, какие-то другие бесплатные инструменты/библиотеки .net могут это сделать?