텍스트를 유지하면서 PPTX를 HTML로 변환

텍스트를 유지하면서 PPTX를 HTML로 변환

명령줄을 사용하여 PowerPoint PPTX 파일을 HTML로 변환해야 합니다. HTML 파일은 모든 도형, 스마트 아트 및 그래프를 이미지(또는 이미지가 아닌 경우 SVG)로 변환하는 동안 텍스트를 텍스트(이미지 아님)로 유지해야 합니다.

LibreOffice Impress 4.4.3.2를 사용하여 이 작업을 수행하려고 합니다.

Impress를 열고 PPTX 파일을 HTML로 내보내면 모든 슬라이드가 텍스트를 포함한 이미지로 변환됩니다. PDF로 내보내면 실제로 텍스트가 보존되고 모든 모양이 잘 변환되지만 아쉽게도 PDF가 아닌 HTML이 필요합니다.

명령줄(Windows 8)을 사용하여 다음에서 찾은 모든 HTML 필터를 시도했습니다. 링크 텍스트

그들 중 대부분은 단순히 작동하지 않았습니다. 내가 찾을 수 있는 가장 가까운 것:

soffice.exe --headless --convert-to html --outdir d:\temp d:\temp\presentation.pptx는 텍스트를 잘 변환했지만 어떤 이유로 변환된 HTML 파일에서 모든 모양과 그래프가 누락되었습니다.

내 문제를 어떻게 해결할 수 있나요? 아마도 다른 무료 도구나 .net 라이브러리가 그렇게 할 수 있을까요?

관련 정보