
かなり大きな .htm ファイル (100 MB) があるのですが、どのブラウザーでも完全には読み込まれません (ある時点以降、ページのレンダリングが停止します)。そのため、このファイルを .pdf ファイルに変換して、ドキュメント全体を表示できるようにしたいと考えています。ブラウザーではファイルを完全にレンダリングできないため、ブラウザーがファイル全体を一度に読み込めない場合、この大きな .htm ファイルを変換できるソフトウェア/プログラムはどれでしょうか。一度にファイルをチャンク単位で読み込み、最後にすべてをまとめることができるソフトウェア/プログラムでしょうか。または、処理前にファイル全体を読み込むことなく、オンザフライでファイルを変換するものでしょうか。 (Windows 7 を使用しています) よろしくお願いします。
答え1
Pandoc には、使用できるメモリ量に厳しい制限はありません。インストール後にコンソールから次のコマンドで呼び出すことができます。
pandoc -f html -t pdf yourfile.html
残念ながら、100MB のファイルを正しく変換するには、少なくとも 64GB の RAM が必要になるでしょう。
デスクトップ コンピューターの約 20 GB の RAM を使用して、50 MB の HTML ファイルを pandoc で正常に変換できました。