¿Cómo se pueden obtener los datos de este PDF en texto plano?

¿Cómo se pueden obtener los datos de este PDF en texto plano?

EnEste archivoA partir de la página 5, se escriben varias filas de datos. Necesito estas filas en formato de texto sin formato. ¿Cómo puedo extraerlos?

Respuesta1

Puede convertir el contenido de un PDF a texto sin formato utilizandopdf a texto.

Simplemente ejecútelo pdftotext Appendix.pdfy escupirá Appendix.txttodo el texto sin formato que contiene.

Respuesta2

¿Qué hay de malo en simplemente copiarlos?

Cartesian coordinates for all structures:

React

6 6.390727 0.132095 4.960391
6 5.969971 -1.321389 4.932512
8 6.229932 -2.095504 5.854485
7 5.288242 -1.652799 3.816634
6 4.675691 -2.942048 3.614359
6 3.234362 -2.800745 3.119131
6 3.107771 -2.046443 1.784738
8 3.907686 -1.094593 1.556228
8 2.188216 -2.443833 1.008985
6 -5.322697 -1.975980 -1.333635
6 -4.229638 -1.620947 -0.307343
16 -2.533574 -1.760488 -0.994608
6 8.431743 -0.064459 -3.050202
6 7.281182 -0.571938 -2.237196
6 7.017856 -0.342487 -0.904258
6 6.208644 -1.400670 -2.720284
7 5.852218 -0.976787 -0.527814

Respuesta3

  1. Guarde el documento en la máquina local.

  2. http://www.pdfonline.com/pdf-to-word-converter/convertirá pdf a Word. Es posible que los documentos más grandes solo se conviertan parcialmente, por lo que es posible que tengas que convertirlos en bloques.

  3. En Word '07, Archivo --> Opciones --> Avanzado --> "Pegar dentro del documento" y "pegar entre documentos", configurado en "conservar sólo texto".

  4. Corte/pegue datos de un documento en sí mismo, corte/pegue de otros documentos en los primeros documentos.

Después de esto, debería tener 1 documento de Word grande en texto sin formato.

información relacionada