
Estoy intentando copiar texto de un archivo PDF a Word, sin embargo, cuando pego el texto en un archivo de Word, las líneas en el archivo PDF son "más cortas", por lo que no ocupa toda la línea en Word y tengo que hacerlo manualmente. une las oraciones para que parezca normal (usando retroceso).
Intenté copiar y pegar PDF, aunque funciona, eliminó todos los saltos de línea, por lo que no se conservan párrafos, pero el archivo que estoy intentando copiar es bastante grande y necesito conservar los párrafos reales. ¿Hay alguna manera de hacer que Word se ajuste a las líneas tanto como sea posible y respete también los párrafos reales?
Respuesta1
El texto en el PDF consta de fragmentos de texto absolutamente posicionados y, en el caso general, los saltos de línea y de párrafo no se indican específicamente. Por lo tanto, la tarea de determinarlos correctamente se convierte más en un OCR, lo cual es una tarea compleja y lo más probable es que necesites un software complejo para lograr resultados satisfactorios.
El propio MS Word, por ejemplo, tiene la función de importar documentos PDF, pero tampoco siempre reconoce perfectamente las rupturas (por ejemplo, cuando los fragmentos de texto están un poco "inclinados", como es el caso de los archivos escaneados y editados con OCR). documentos).