
Ich muss PowerPoint PPTX-Dateien über die Befehlszeile in HTML konvertieren. In der HTML-Datei sollte der Text als Text (kein Bild) erhalten bleiben, während alle Formen, Smart-Arts und Diagramme in Bilder (oder wenn nicht in Bilder, dann in SVG) konvertiert werden.
Ich versuche, dies mit LibreOffice Impress 4.4.3.2 zu tun.
Wenn ich Impress öffne und eine PPTX-Datei in HTML exportiere, werden alle Folien inklusive Text in Bilder umgewandelt. Wenn ich in PDF exportiere, bleibt der Text zwar erhalten und alle Formen werden problemlos konvertiert, aber leider ... ich möchte HTML, nicht PDF.
Über die Kommandozeile (unter Windows 8) habe ich alle HTML-Filter ausprobiert, die ich gefunden habe: Linktext
Die meisten davon funktionierten einfach nicht. Das Nächstliegende, was ich finden konnte, war:
soffice.exe --headless --convert-to html --outdir d:\temp d:\temp\presentation.pptx hat den Text einwandfrei konvertiert, aber aus irgendeinem Grund fehlen alle Formen und Grafiken in der konvertierten HTML-Datei.
Wie kann ich mein Problem lösen? Vielleicht können das andere kostenlose Tools/.net-Bibliotheken?