
Вэтот файлНачиная с 5 страницы, записано несколько строк данных. Мне нужны эти строки в формате простого текста. Как их извлечь?
решение1
Вы можете преобразовать содержимое PDF-файла в обычный текст, используяpdftotext.
Просто запустите pdftotext Appendix.pdf
, и он выдаст Appendix.txt
вам весь открытый текст, который в нем содержится.
решение2
Что плохого в том, чтобы просто их скопировать?
Cartesian coordinates for all structures:
React
6 6.390727 0.132095 4.960391
6 5.969971 -1.321389 4.932512
8 6.229932 -2.095504 5.854485
7 5.288242 -1.652799 3.816634
6 4.675691 -2.942048 3.614359
6 3.234362 -2.800745 3.119131
6 3.107771 -2.046443 1.784738
8 3.907686 -1.094593 1.556228
8 2.188216 -2.443833 1.008985
6 -5.322697 -1.975980 -1.333635
6 -4.229638 -1.620947 -0.307343
16 -2.533574 -1.760488 -0.994608
6 8.431743 -0.064459 -3.050202
6 7.281182 -0.571938 -2.237196
6 7.017856 -0.342487 -0.904258
6 6.208644 -1.400670 -2.720284
7 5.852218 -0.976787 -0.527814
решение3
Сохраните документ на локальном компьютере.
http://www.pdfonline.com/pdf-to-word-converter/преобразует pdf в Word. Большие документы могут быть преобразованы только частично, поэтому вам, возможно, придется конвертировать их блоками.
В Word '07, Файл --> Параметры --> Дополнительно --> «Вставка в документ» и «Вставка между документами», установите значение «сохранить только текст».
Вырезать/вставить данные из одного документа в другой, вырезать/вставить данные из других документов в первые документы.
После этого у вас должен получиться один большой текстовый документ.