この PDF のデータをプレーンテキストで取得するにはどうすればよいでしょうか?

この PDF のデータをプレーンテキストで取得するにはどうすればよいでしょうか?

このファイル5 ページ目から、いくつかのデータ行が書き込まれます。これらの行をプレーン テキスト形式で取得する必要があります。どうすれば抽出できますか?

答え1

PDFの内容をプレーンテキストに変換することができます。pdfをテキストに変換

実行すると、その中のすべてのプレーンテキストがpdftotext Appendix.pdf出力されます。Appendix.txt

答え2

単にコピーするだけで何が問題なのですか?

Cartesian coordinates for all structures:

React

6 6.390727 0.132095 4.960391
6 5.969971 -1.321389 4.932512
8 6.229932 -2.095504 5.854485
7 5.288242 -1.652799 3.816634
6 4.675691 -2.942048 3.614359
6 3.234362 -2.800745 3.119131
6 3.107771 -2.046443 1.784738
8 3.907686 -1.094593 1.556228
8 2.188216 -2.443833 1.008985
6 -5.322697 -1.975980 -1.333635
6 -4.229638 -1.620947 -0.307343
16 -2.533574 -1.760488 -0.994608
6 8.431743 -0.064459 -3.050202
6 7.281182 -0.571938 -2.237196
6 7.017856 -0.342487 -0.904258
6 6.208644 -1.400670 -2.720284
7 5.852218 -0.976787 -0.527814

答え3

  1. ドキュメントをローカルマシンに保存します。

  2. http://www.pdfonline.com/pdf-to-word-converter/PDF を Word に変換します。大きな文書は部分的にしか変換されない可能性があるため、ブロック単位で変換する必要がある場合があります。

  3. Word '07 では、[ファイル] -> [オプション] -> [詳細設定] -> [文書内での貼り付け] および [文書間での貼り付け] を [テキストのみを保持する] に設定します。

  4. ある文書内のデータをその文書自体に切り取って貼り付けたり、他の文書から最初の文書に切り取って貼り付けたりします。

これで、プレーンテキストの大きな Word 文書が 1 つ作成されます。

関連情報