從 PDF 複製時的線條格式

從 PDF 複製時的線條格式

我正在嘗試將文字從PDF文件複製到word,但是當我將文字貼到word文件中時,PDF文件中的行“較短”,因此它不會佔用word中的整行,我必須手動連接句子,使其看起來像正常的(使用退格鍵)。

我嘗試了 PDF 複製貼上,雖然它有點工作,但它刪除了每個換行符,因此沒有保留任何段落,但我嘗試複製的文件非常大,我需要保留實際的段落。有沒有一種方法可以使單字盡可能地適合線條並尊重實際的段落?

答案1

PDF 中的文字由絕對定位的文字片段組成,並且在一般情況下,不會具體表示換行符和段落符。因此,正確確定它們的任務更像是 OCR,這是一項複雜的任務,您很可能需要複雜的軟體才能獲得滿意的結果。

例如,MS Word 本身俱有匯入 PDF 文件的功能,但它也並不總是能夠完美地識別中斷(例如,當文字片段有點「傾斜」時,掃描和 OCR 編輯的情況就是如此)。

相關內容