PDF 到 HTML - 大量轉換器 - 最可靠、最準確的免費和付費軟體?

PDF 到 HTML - 大量轉換器 - 最可靠、最準確的免費和付費軟體?

我正在尋找免費或付費的(大約 50 美元/40 磅)批次PDF 到 HTML 轉換器進行轉換一些一次產生 PDF 文件。

需要能夠處理文件中的向量圖像和點陣圖圖像,並將兩者輸出為 html 頁面引用的 jpeg。

我已經嘗試過 iorigsoft 付費 PDF 到 HTML - 問題似乎掛起或只是閒置,並且它實際轉換的內容有損壞的鏈接 - 組成章節使用了錯誤的名稱作為 html。

也嘗試了來自 intrapdf.com 的應用程序,但在轉換開始時始終崩潰。

更新:

intrapdf 可在我的 Windows XP 電腦上執行,但無法在我的 Windows 7 電腦上執行。唯一的問題是框架索引內容 html - 頁面中的圖形不會顯示在框架的頁面中 - 但如果您僅在新選項卡中開啟框架,那麼您可以看到它們。這可能只是 Chrome 中的瀏覽器故障。

這個解決方案對我來說已經足夠好了 - 考慮到我已經花了錢(我在提出要求之前就已經花了),但我無法接受我自己的答案,因為這在 Windows 7 上不起作用。

檢視過開源工具,但它們看起來同樣不穩定或使用舊的 PDF 版本。

在 Windows 7 32 位元家用版上需要它。

想法?

答案1

PDF 是一個糟糕用於轉換的輸入格式,因此“flakey”幾乎是規則。有些文件可以相對容易地轉換,但大多數文件將要有問題。 (非常簡單:PDF 文件是「移動到此處、輸出此、移動到那裡…」的壓縮清單。如果文件包含任何事物除了簡單的從左到右的文字(表格、圖像、RTL 文字、腳註等)之外,轉換可能會產生一些垃圾。

答案2

有一個基於 HTML Javascript 的 PDF 渲染器,稱為 PDF.js,它使用 Canvas 元素。 http://mozilla.github.com/pdf.js/web/viewer.html

它正在開發中,但可能適合某些人。

答案3

我會檢查 openoffice/libreoffice 是否有用於轉換的命令列標誌。

PDF 對於你想要做的事情來說很糟糕。 PDF 如何看待頁面和 HTML 如何看待頁面之間存在巨大的文件模型不符。有些 PDF 文件無法以任何方式輕鬆轉換為 HTML。

答案4

相關內容