Convierta PPTX a HTML conservando el texto

Convierta PPTX a HTML conservando el texto

Necesito convertir archivos PPTX de PowerPoint a HTML usando la línea de comandos. El archivo HTML debe conservar el texto como texto (no imagen) mientras convierte todas las formas, artes inteligentes y gráficos en imágenes (o si no son imágenes, entonces SVG).

Estoy intentando hacer esto usando LibreOffice Impress 4.4.3.2.

Si abro Impress y exporto un archivo PPTX a HTML, todas las diapositivas se convierten en imágenes, incluido el texto. Si exporto a PDF, de hecho conserva el texto y convierte todas las formas correctamente, pero, por desgracia... quiero HTML, no PDF.

Usando la línea de comando (en Windows 8), probé todos los filtros HTML que encontré en: texto del enlace

La mayoría de ellos simplemente no funcionaron. Lo más cercano que pude encontrar:

soffice.exe --headless --convert-to html --outdir d:\temp d:\temp\presentation.pptx convirtió el texto correctamente, pero por alguna razón faltan todas las formas y gráficos en el archivo HTML convertido.

¿Cómo puedo solucionar mi problema? ¿Quizás algunas otras herramientas gratuitas/bibliotecas .net puedan hacer eso?

información relacionada