Web ページを PDF に変換するにはどうすればいいですか?

Web ページを PDF に変換するにはどうすればいいですか?

Web ページを PDF に変換する方法は多数あります (オンライン サービス、ブックマークレット、PDF への印刷ソリューションなど)。

しかし、これらのいずれも検索可能な PDF を生成しません。すべて HTML を 1 つの巨大な画像に変換するようです。Web ページを検索可能な PDF に変換する方法はありますか?

答え1

私は見つけたwkhtmlからpdfプロジェクトはうまく機能しているようです。コマンドラインなので、少し学習が必要ですが、それほど難しくはありません。

特に Web ページを変換するには、インストールされているディレクトリでコマンド ウィンドウを開きwkhtmltopdf、次のコマンドを実行します。

wkhtmltopdf.exe http://www.yourpage.com/index.htm c:\misc\cnn.pdf

このアプリケーションには、必要に応じて出力を微調整するための膨大な数のオプションがありますが、デフォルトでもかなり良い結果が得られます。

答え2

CutePDFライターテキスト処理には GhostScript を使用し、次に ps2pdf を使用して Web ページの検索可能な PDF を作成します。もちろん、ページ上のテキストが画像である場合は、この方法は機能しません。

答え3

PDF 印刷ソリューションの問題は何でしょうか? 私のシステムには 2 つの仮想プリンターがインストールされています:PDF クリエイターおよびAdobe Acrobat Xの仮想プリンター。どちらも問題なく動作します。PDFビューアにOCR機能があれば、生成されたPDF内のテキストを簡単に検索できます(最近では一般的です)。
テキストやワード文書のようなものを作成したい場合は、できません。これはPDF形式の制限であり、PDF形式の仕組みです。これにより、この形式にフォントなどを埋め込むことができ、汎用性を高めることができます。
そして、wkhtmlからpdfこのプロジェクトでは、OCR テクノロジを使用せずにテキストを検索できる PDF ファイルを生成できます (PDF 仕様に違反するため)。

答え4

これは、Web ページを検索可能な PDF に変換する非常に優れたツールです。http://kitpdf.com/web_to_pdf/試してみて、ニーズを満たすかどうかを確認してください。

関連情報