如何將網頁轉換為PDF?

如何將網頁轉換為PDF?

將網頁轉換為 PDF 的方法有很多(線上服務、小書籤、列印到 PDF 解決方案等)。

但這些都不能產生可搜尋的 PDF。看起來他們都將 HTML 轉換為一張巨大的圖像。有沒有辦法將網頁轉換為可搜尋的 PDF?

答案1

我發現wkhtml轉pdf項目,這似乎可以解決問題。它是命令行,所以有一點學習曲線,但還不錯。

具體來說,要轉換網頁,請在wkhtmltopdf安裝目錄中開啟命令視窗並執行以下命令:

wkhtmltopdf.exe http://www.yourpage.com/index.htm c:\misc\cnn.pdf

該應用程式有大量的選項旨在根據需要調整輸出,但預設值給出了相當好的結果。

答案2

可愛的PDF書寫器使用 GhostScript 進行文字處理,然後使用 ps2pdf 建立可搜尋的網頁 PDF。如果頁面上的文字一開始就是圖像,這當然不起作用。

答案3

列印到 PDF 解決方案有什麼問題?我的系統中安裝了兩台虛擬印表機:PDF建立器和 Adob​​e Acrobat X 的虛擬印表機。只要我的 PDF 檢視器具有 OCR 功能(現在很常見),我就可以輕鬆搜尋生成的 PDF 中的文字。
如果您正在考慮創建文字和 Word 文件之類的內容,那麼您做不到。它對 PDF 格式的限製或說它是 PDF 格式的工作原理。因此,我們可以在這種格式中嵌入字體等,而無需任何依賴以使其通用。
而且,我不認為wkhtml轉pdf專案可以產生一個 PDF 文件,可以在不使用 OCR 技術的情況下搜尋其中的文字(因為這會違反 PDF 規範)。

答案4

這是一個非常好的工具,可以將網頁轉換為可搜尋的 PDF:http://kitpdf.com/web_to_pdf/。嘗試一下,看看它是否滿足您的需求。

相關內容