
Necesito convertir archivos PPTX de PowerPoint a HTML usando la línea de comandos. El archivo HTML debe conservar el texto como texto (no imagen) mientras convierte todas las formas, artes inteligentes y gráficos en imágenes (o si no son imágenes, entonces SVG).
Estoy intentando hacer esto usando LibreOffice Impress 4.4.3.2.
Si abro Impress y exporto un archivo PPTX a HTML, todas las diapositivas se convierten en imágenes, incluido el texto. Si exporto a PDF, de hecho conserva el texto y convierte todas las formas correctamente, pero, por desgracia... quiero HTML, no PDF.
Usando la línea de comando (en Windows 8), probé todos los filtros HTML que encontré en: texto del enlace
La mayoría de ellos simplemente no funcionaron. Lo más cercano que pude encontrar:
soffice.exe --headless --convert-to html --outdir d:\temp d:\temp\presentation.pptx convirtió el texto correctamente, pero por alguna razón faltan todas las formas y gráficos en el archivo HTML convertido.
¿Cómo puedo solucionar mi problema? ¿Quizás algunas otras herramientas gratuitas/bibliotecas .net puedan hacer eso?