
Я пытаюсь скопировать текст из PDF-файла в Word, однако, когда я вставляю текст в файл Word, строки в PDF-файле становятся «короче», поэтому текст не занимает всю строку в Word, и мне приходится вручную соединять предложения, чтобы текст выглядел нормально (используя клавишу Backspace).
Я попробовал PDF copy paster, хотя он вроде работает, он удалил все переносы строк, так что абзацы не сохранились, но файл, который я пытаюсь скопировать, довольно большой, и мне нужно сохранить абзацы. Есть ли способ заставить Word максимально вписывать строки и при этом учитывать абзацы?
решение1
Текст в PDF состоит из абсолютно позиционированных фрагментов текста, и в общем случае разрывы строк и абзацев специально не обозначены. Поэтому задача их правильного определения становится скорее OCR, что является сложной задачей, и вам, скорее всего, понадобится сложное программное обеспечение для достижения удовлетворительных результатов.
Например, в самом MS Word есть функция импорта PDF-документов, но он также не всегда идеально распознает разрывы (например, когда фрагменты текста немного «наклонены», что имеет место в случае отсканированных и распознанных с помощью OCR документов).