Como os dados deste PDF podem ser obtidos em texto simples?

Como os dados deste PDF podem ser obtidos em texto simples?

Emeste ficheiroa partir da página 5, várias linhas de dados são gravadas. Preciso dessas linhas em formato de texto simples. Como posso extraí-los?

Responder1

Você pode converter o conteúdo de um PDF em texto simples utilizandopdf para texto.

Basta executar pdftotext Appendix.pdfe ele exibirá Appendix.txttodo o texto simples contido nele.

Responder2

O que há de errado em simplesmente copiá-los?

Cartesian coordinates for all structures:

React

6 6.390727 0.132095 4.960391
6 5.969971 -1.321389 4.932512
8 6.229932 -2.095504 5.854485
7 5.288242 -1.652799 3.816634
6 4.675691 -2.942048 3.614359
6 3.234362 -2.800745 3.119131
6 3.107771 -2.046443 1.784738
8 3.907686 -1.094593 1.556228
8 2.188216 -2.443833 1.008985
6 -5.322697 -1.975980 -1.333635
6 -4.229638 -1.620947 -0.307343
16 -2.533574 -1.760488 -0.994608
6 8.431743 -0.064459 -3.050202
6 7.281182 -0.571938 -2.237196
6 7.017856 -0.342487 -0.904258
6 6.208644 -1.400670 -2.720284
7 5.852218 -0.976787 -0.527814

Responder3

  1. Salve o documento na máquina local.

  2. http://www.pdfonline.com/pdf-to-word-converter/irá converter pdf para Word. Documentos maiores podem ser convertidos apenas parcialmente, portanto, talvez seja necessário convertê-los em blocos.

  3. No Word '07, Arquivo -> Opções -> Avançado -> "Colar dentro do documento" e "colar entre documentos", definido como "manter somente texto".

  4. Recortar/colar dados de um documento em si mesmo, recortar/colar de outros documentos nos primeiros documentos.

Depois disso, você deverá ter 1 documento grande do Word em texto simples.

informação relacionada