PDFを切り取って空白を削除する

PDFを切り取って空白を削除する

数学の試験問題の PDF があり、そこには質問と解答が短い段落で書かれています。その後に改ページがあり、別のテキストの段落があります。解答がページ全体を占めることもあります。

空白を削除して、すべてのテキストを 1 ページにまとめたいと思います。

誰か解決策を提案できますか?

私はWindows 8.1を使用しています。GUIまたはコマンドラインのわかりやすいガイドがあればありがたいです。また、ソリューションでは数式を処理する必要があります。

ありがとう

答え1

PDFは単なる文書を表示するためのファイル形式なので、使用する必要があるのは任意のPDFエディタそれを実現するには、PDF ファイルを RTF/DOC ファイルに変換できるソフトウェアを使用します。

ファイルが編集可能な場合は問題はありません。ただし、ファイルにスキャンされた画像が含まれている場合は、OCRプログラムを使用して編集可能なドキュメントに変換する必要があるため、より複雑になります(たとえば、.rtf.doc.docx)をクリックして再度 PDF に変換します。

参照:

答え2

以前の回答では正しい方法が 1 つ提案されていましたが、その理由は説明されていませんでした。

PDF には通常、「空白」はほとんどまたはまったくありません。基本的に、空白はコンテンツ間のオフセットによって作成されるため、プリンタでインクを印刷するための領域のみになります。ページには改ページがありません。すべてのページを任意の順序で PDF 内に保存し、画面またはプリンタの順序に、左右、上下、または上下に再組み立てできるためです。そのため、物理的な関係はなく、たとえば、ページが繰り返されたり、他のページの領域にネストされたりすることさえあります。

したがって、任意のページ (セクション) から別のページ (セクション) にコンテンツを移動するには、従来のワード プロセッシング形式に変換するか、再印刷時に HTML や Doc が追加できるような「ページ区切り」を持つ「再フロー可能な」PDF エディターで編集する必要があります。

スキャンされたページを扱う場合、画像のスライスが必要になります。これは、次のようなPDFリフローソフトウェアで実現できます。https://willus.com/k2pdfopt/使用できます。MS Word を使用することが推奨されていることに注意してください。

関連情報