
コマンドラインを使用して、PowerPoint PPTX ファイルを HTML に変換する必要があります。HTML ファイルでは、すべての図形、スマート アート、グラフを画像 (画像でない場合は SVG) に変換しながら、テキストをテキスト (画像ではない) として保持する必要があります。
私はLibreOffice Impress 4.4.3.2を使用してこれを実行しようとしています。
Impress を開いて PPTX ファイルを HTML にエクスポートすると、すべてのスライドがテキストを含む画像に変換されます。PDF にエクスポートすると、確かにテキストは保持され、すべての図形が適切に変換されますが、残念ながら、PDF ではなく HTML が必要です。
コマンドライン(Windows 8)を使用して、リンクテキストで見つかったすべてのHTMLフィルターを試しました。
それらのほとんどは単に機能しませんでした。私が見つけた最も近いものは次のとおりです。
soffice.exe --headless --convert-to html --outdir d:\temp d:\temp\presentation.pptx はテキストを正常に変換しましたが、何らかの理由で、変換された HTML ファイルからすべての図形とグラフが失われています。
どうすればこの問題を解決できますか? おそらく他の無料ツールや .net ライブラリで解決できるのではないでしょうか?