Ubuntu 14.04 を使用しています。PDF ステートメントがあり、それを Excel ファイル形式に変換したいと考えています。このタスクを実行できる OCR エンジン/ソフトウェアはありますか? どなたかアドバイスをお願いします。
答え1
1 つの解決策としては、PDFedit で PDF ファイルを開き、そのファイルをテキスト ファイルとして保存することが挙げられます。
PDFedit をインストールする場合は、ターミナルに次のように入力するだけです。
$ sudo apt-get update
$ sudo apt-get install pdfedit
その後、テキスト ファイルを OpenOffice.org (または LibreOffice) Calc などにインポートし、結果のスプレッドシートを目的の形式 (ods、xls など) で保存できます。
テキスト ファイルを Calc にインポートするには、[挿入]、[ファイルからシート] メニューから [テキスト インポート] ダイアログ ボックスを開きます。次に、データに応じて [固定幅] または [区切り] オプションを選択します。[固定幅] オプションを使用する場合は、ボックスの [フィールド] プレビューで各列の幅を設定できます。