
EnEste archivoA partir de la página 5, se escriben varias filas de datos. Necesito estas filas en formato de texto sin formato. ¿Cómo puedo extraerlos?
Respuesta1
Puede convertir el contenido de un PDF a texto sin formato utilizandopdf a texto.
Simplemente ejecútelo pdftotext Appendix.pdf
y escupirá Appendix.txt
todo el texto sin formato que contiene.
Respuesta2
¿Qué hay de malo en simplemente copiarlos?
Cartesian coordinates for all structures:
React
6 6.390727 0.132095 4.960391
6 5.969971 -1.321389 4.932512
8 6.229932 -2.095504 5.854485
7 5.288242 -1.652799 3.816634
6 4.675691 -2.942048 3.614359
6 3.234362 -2.800745 3.119131
6 3.107771 -2.046443 1.784738
8 3.907686 -1.094593 1.556228
8 2.188216 -2.443833 1.008985
6 -5.322697 -1.975980 -1.333635
6 -4.229638 -1.620947 -0.307343
16 -2.533574 -1.760488 -0.994608
6 8.431743 -0.064459 -3.050202
6 7.281182 -0.571938 -2.237196
6 7.017856 -0.342487 -0.904258
6 6.208644 -1.400670 -2.720284
7 5.852218 -0.976787 -0.527814
Respuesta3
Guarde el documento en la máquina local.
http://www.pdfonline.com/pdf-to-word-converter/convertirá pdf a Word. Es posible que los documentos más grandes solo se conviertan parcialmente, por lo que es posible que tengas que convertirlos en bloques.
En Word '07, Archivo --> Opciones --> Avanzado --> "Pegar dentro del documento" y "pegar entre documentos", configurado en "conservar sólo texto".
Corte/pegue datos de un documento en sí mismo, corte/pegue de otros documentos en los primeros documentos.
Después de esto, debería tener 1 documento de Word grande en texto sin formato.