Converta PPTX em HTML preservando o texto

Converta PPTX em HTML preservando o texto

Preciso converter arquivos PPTX do PowerPoint em HTML usando a linha de comando. O arquivo HTML deve preservar o texto como texto (não como imagem) enquanto converte todas as formas, artes inteligentes e gráficos em imagens (ou, se não forem imagens, então SVG).

Estou tentando fazer isso usando o LibreOffice Impress 4.4.3.2.

Se eu abrir o Impress e exportar um arquivo PPTX para HTML, todos os slides serão convertidos em imagens, incluindo o texto. Se eu exportar para PDF, ele realmente preserva o texto e converte todas as formas corretamente, mas, infelizmente... eu quero HTML e não PDF.

Usando a linha de comando (no Windows 8), tentei todos os filtros HTML que encontrei em: link text

A maioria deles simplesmente não funcionou. O mais próximo que consegui encontrar:

soffice.exe --headless --convert-to html --outdir d:\temp d:\temp\presentation.pptx converteu o texto corretamente, mas por algum motivo todas as formas e gráficos estão faltando no arquivo HTML convertido.

Como posso resolver meu problema? Talvez algumas outras ferramentas gratuitas/bibliotecas .net possam fazer isso?

informação relacionada