
InDiese DateiAb Seite 5 werden eine Reihe von Datenzeilen geschrieben. Ich brauche diese Zeilen im Klartextformat. Wie kann ich sie extrahieren?
Antwort1
Sie können den Inhalt einer PDF-Datei in einfachen Text umwandeln, indem Siepdftotext.
Führen Sie es einfach aus und es wird den gesamten darin enthaltenen Klartext pdftotext Appendix.pdf
ausspucken .Appendix.txt
Antwort2
Was ist falsch daran, sie einfach zu kopieren?
Cartesian coordinates for all structures:
React
6 6.390727 0.132095 4.960391
6 5.969971 -1.321389 4.932512
8 6.229932 -2.095504 5.854485
7 5.288242 -1.652799 3.816634
6 4.675691 -2.942048 3.614359
6 3.234362 -2.800745 3.119131
6 3.107771 -2.046443 1.784738
8 3.907686 -1.094593 1.556228
8 2.188216 -2.443833 1.008985
6 -5.322697 -1.975980 -1.333635
6 -4.229638 -1.620947 -0.307343
16 -2.533574 -1.760488 -0.994608
6 8.431743 -0.064459 -3.050202
6 7.281182 -0.571938 -2.237196
6 7.017856 -0.342487 -0.904258
6 6.208644 -1.400670 -2.720284
7 5.852218 -0.976787 -0.527814
Antwort3
Dokument auf dem lokalen Computer speichern.
http://www.pdfonline.com/pdf-to-word-converter/konvertiert PDF in Word. Größere Dokumente können nur teilweise konvertiert werden, daher müssen Sie sie möglicherweise in Blöcken konvertieren.
In Word '07 ist unter Datei --> Optionen --> Erweitert --> „Einfügen innerhalb des Dokuments“ und „Einfügen zwischen Dokumenten“ die Einstellung „Nur Text behalten“ zu wählen.
Daten aus einem Dokument ausschneiden/in dieses einfügen, Daten aus anderen Dokumenten in das erste Dokument ausschneiden/einfügen.
Danach sollten Sie ein großes Word-Dokument im Nur-Text-Format haben.